Trong nhiều bài báo nghiên cứu y học lúc thì báo cáo odds
ratio, lúc thì relative risk. Câu hỏi đăt ra là hai chỉ số này khác nhau như
thế nào và chỉ số nào đúng. Bài này sẽ giải thích sơ qua hai khái niệm odds và
risk.
Đây là một thắc mắc không chỉ ở nước ta mà …
toàn thế giới. Rất nhiều nhà nghiên cứu, dù đã công bố báo cáo khoa học trên
các tập san danh tiếng như New England Journal of Medicine, vẫn hiểu sai – có
khi cực kì sai lầm – về hai chỉ số này. Tôi muốn mượn câu hỏi này để giải thích
những khác biệt quan trọng của hai chỉ số odds ratio (OR) và relative risk
(RR). Tạm thời tôi sẽ không dịch hai thuật ngữ này ở đây. Tôi hi vọng rằng qua
bài viết ngắn này, bạn đọc sẽ nắm vững vấn đề hơn và phân biệt những khác biệt
căn bản của hai chỉ số để không vấp phải những sai lầm như các nhà nghiên cứu y
học Tây phương từng phạm phải.
OR và RR: cơ chế tính toán
OR và RR là hai chỉ số thống kê rất phổ biến
và có ích trong dịch tễ học, vì cả hai chỉ số kiểm định mối liên hệ giữa một
yếu tố nguy cơ và bệnh tật – một mục tiêu gần như căn bản của nghiên cứu y học
hiện đại. Cơ chế tính toán của hai chỉ số này cực kì đơn giản.
RR:
Nếu trong một nhóm n1 bệnh
nhân bị phơi nhiễm một yếu tố nguy cơ (chẳng hạn như hút thuốc lá), và sau khi
theo dõi trong một thời gian, có k1 bệnh
nhân mắc bệnh, thì tỉ lệ mắc bệnh đơn giản là:
(hãy gọi tỉ lệ này là p1)
Nếu một nhóm n2bệnh
nhân khác không bị phơi nhiễm yếu tố nguy cơ đó và trong cùng thời gian theo
dõi có k1 bệnh nhân mắc bệnh, thì tỉ lệ mắc
bệnh là:
Do đó, RR đơn giản là tỉ số của hai tỉ lệ:
Nếu RR > 1 (hay p1>p2),
chúng ta có thể phát biểu rằng yếu tố nguy cơ làm tăng khả năng mắc bệnh; nếu
RR = 1 (tức là p1=p2),
chúng ta có thể nói rằng không có mối liên hệ nào giữa yếu tố nguy cơ và khả
năng mắc bệnh; và nếu RR < 1 (tức p1<p2),
chúng ta có bằng chứng để thể phát biểu rằng yếu tố nguy cơ có thể làm giảm khả
năng mắc bệnh.
OR:
Thay vì sử dụng tỉ lệ phát sinh p để đo lường khả năng mắc
bệnh, thống kê cung cấp cho chúng ta một chỉ số khác: đó là odd.
Odd được định nghĩa là tỉ số của hai xác suất. Nếu p là xác
suất mắc bệnh, thì 1-p là xác suất sự kiện không mắc bệnh. Theo đó,
odd được định nghĩa bằng:
Như vậy, nếu odd > 1, khả năng mắc bệnh cao
hơn khả năng không mắc bệnh; nếu odd = 1 thì điều này cũng có nghĩa là khả năng
bằng với khả năng không mắc bệnh; và nếu odd < 1, chúng ta có thể nói khả
năng mắc bệnh thấp hơn khả năng không mắc bệnh.
Với định nghĩa này, chúng ta quay lại với ví
dụ vừa trình bày trong mục RR. Odd mắc bệnh trong nhóm bị phơi nhiễm yếu tố
nguy cơ là:
và odd mắc bệnh trong nhóm không bị phơi nhiễm
yếu tố nguy cơ là:
Từ đó, OR được định nghĩa là tỉ số của hai
odds:
Mối liên hệ giữa RR và OR. Qua công thức [1], [2] và [3], chúng ta có thể
thấy OR và RR có một mối liên hệ số học. Nếu ai thích đại số, có thể viết lại
công thức RR như là một hàm số của OR (hay ngược lại), nhưng ở đây, tôi chỉ
muốn lưu ý một điểm quan trọng có liên quan đến việc diễn dịch RR và OR.
Nhìn vào công thức [2] của odd, chúng ta dễ
dàng thấy nếu tỉ lệ mắc bệnh p thấp (chẳng hạn như 0.001 hay
0.01 – tức 0.1% hay 1%), thì odd = p. Chẳng hạn như nếu p
= 0.01, thì 1 – p = 0.99, và do đó odd = 0.01 / 0.99
= 0.010101. Quay lại với công thức [3], nếu p1 hay
p2thấp, thì OR có thể viết như sau:
Nói cách khác, nếu tỉ lệ mắc bệnh
thấp, thì OR gần bằng với RR. Nhưng nếu tỉ lệ mắc bệnh cao (chẳng hạn như trên
10%) thì chỉ số OR cũng cao hơn chỉ số RR.
Có thể làm một vài tính toán để thấy sự khác
biệt giữa RR và OR qua bảng số liệu sau đây (Bảng 1). Với những trường hợp tỉ
lệ mắc bệnh dưới 5%, OR và RR không khác nhau đáng kể. Nhưng nếu tỉ lệ mắc bệnh
cao hơn 10%, thì OR thường ước tính RR cao hơn thực tế.
Bảng 1. So sánh RR và OR với nhiều tỉ lệ
khác nhau (số liệu mô phỏng)
Chú ý: Bảng trên đây được mô phỏng sao cho RR = 3 để chứng minh rằng OR ước
tính độ ảnh hưởng cao hơn so với thực tế.
RR và OR: ứng dụng
Ví dụ 1: truy tìm ung thư vú. Chương trình truy tìm ung thư vú được khuyến khích
như là một phương cách y tế công cộng nhằm giảm tỉ lệ tử vong từ bệnh này ở phụ
nữ. Một nhóm nghiên cứu ở Thuỵ Điển tiến hành một nghiên cứu lâm sàng đối chứng
ngẫu nhiên, mà trong đó họ tuyển các phụ nữ tuổi 50 trở lên, và chia thành 2
nhóm: nhóm A gồm 66103 phụ nữ được chụp X quang (tức mammography) thường xuyên
(cứ mỗi năm một lần), và nhóm B gồm 66105 phụ nữ không chụp X quang mà chỉ theo
dõi bình thường (tức nhóm đối chứng). Sau 5 năm, nhóm A có 183 người chết vì
ung thư vú và nhóm B có 177 người chết. Số liệu được trình bày trong Bảng 2 sau
đây:
Bảng 2: Truy tìm ung thư vú và tử vong
Nhóm
|
Tổng
số đối tượng tham gia
|
Số
tử vong
|
A – X quang
|
66,103
|
183
|
B – Đối chứng
|
66,105
|
177
|
Với số liệu này, chúng ta có thể thấy tỉ lệ tử vong trong
nhóm A là pA=183/66103=0.002768 và nhóm B là pB=177/66105=0.002678
. Từ đó, RR có thể ước tính bằng công thức [1] như sau:
Nhưng thay vì áp dụng RR, chúng ta cũng có thể
áp dụng OR. Odd tử vong trong nhóm chụp mammography là:
và nhóm đối chứng:
Do đó, OR là:
Như vậy, OR bằng RR. Nhưng cách diễn dịch của
OR khác với RR. Bởi vì đơn vị của RR là tỉ lệ tử vong, cho nên chúng ta có thể
nói rằng nhóm chụp mammography thường xuyên có tỉ lệ tử vong cao hơn nhóm đối
chứng khoảng 3.4%. Nhưng đơn vị của OR là odd, cho nên chúng ta không thể phát
biểu về “tỉ lệ tử vong”, mà chỉ có thể phát biểu rằng “khả năng” tử vong của
nhóm A cao hơn nhóm B khoảng 3.4%. Ở đây, vì tỉ lệ tử vong thấp, cho nên như
công thức [4] cho thấy hai chỉ số này giống nhau, và trong thực tế chúng ta có
thể diễn dịch một OR như là một RR.
Cách phân biệt trên có vẻ máy móc và lí
thuyết, nhưng quan trọng. Để thấy rõ nguy hiểm trong cách diễn dịch OR, tôi sẽ
trình bày một ví dụ sau đây:
Ví dụ 2: sắc tộc và tỉ lệ thông tim
(cardiac catherization). Tập san
New England Journal of Medicine số ra ngày 25/2/1999 (tập 349; trang 618-626)
công bố một nghiên cứu rất thú vị về ảnh hưởng của sắc tộc đến tỉ lệ thông tim.
Trong nghiên cứu này, các nhà nghiên cứu mướn một số diễn viên điện ảnh người
da trắng và da đen đóng vai bệnh nhân. Các diễn viên được chỉ cách trình bày
các triệu chứng và bệnh trạng cẩn thận và đầy đủ, nhưng giống nhau. Họ thu hình
các diễn viên vào video; chọn ngẫu nhiên 720 bác sĩ chuyên khoa tim người da trắng,
cho họ xem các video này, và hỏi “ai cần được thông tim”. Kết quả cho thấy
90.6% bác sĩ đề nghị các bệnh nhân da trắng nên được thông tim, nhưng tỉ lệ này
cho bệnh nhân da đen chỉ 84.7%. Một phần của kết quả có thể tóm lược trong Bảng
3 sau đây:
Bảng 3: Sắc tộc và tỉ lệ thông tim
Nhóm
|
Số
bác sĩ đề nghị thông tim
|
Số
bác sĩ không đề nghị thông tim
|
w - Bệnh nhân da trắng
|
652
|
68
|
b - Bệnh nhân da đen
|
610
|
110
|
Các nhà nghiên cứu kết luận rằng tỉ lệ bệnh
nhân da đen được thông tim thấp hơn tỉ lệ ở bệnh nhân da trắng đến 40%. Sau khi
nghiên cứu này công bố, giới truyền thông rầm rộ bàn về kết quả và ý nghĩa của
nghiên cứu. Không cần nói ra, cũng có thể đoán được trong dư âm và tình trạng
kì thị chủng tộc ở Mĩ còn kéo dài, những nhóm đấu tranh chống kì thị chủng tộc
lấy kết quả này để làm bằng chứng tố cáo rằng các bác sĩ da trắng kì thị bệnh
nhân da đen. Ý nghĩa còn sâu xa hơn: sự kì thị này có thể dẫn đến tử vong. Nói
cách khác, có người diễn dịch rằng đây là một sự giết người có ý đồ!
Nhưng rất tiếc là con số 40% đó đã được diễn
dịch cực kì sai. Không những diễn dịch sai mà cách tính toán cũng sai. Để hiểu
tại sao cách diễn dịch đó sai, chúng ta hãy bắt đầu bằng cách tính OR của các
tác giả. Odd thông tim trong nhóm bệnh nhân da trắng là: oddw=652/68=9.59.
Tính tương tự, odd thông tim trong nhóm bệnh nhân da đen là: oddb=610/110=5.545.
Do đó, OR giữa nhóm da đen và da trắng là:
OR=oddb/oddw=5.545/9.59=0.578
(Chú ý, các nhà nghiên cứu tính số chẵn, nên
OR là khoảng 0.60).
Nhưng nếu thay vì tính bằng odd, chúng ta có
thể tính bằng tỉ lệ đề nghị thông tim cho hai nhóm. Tỉ lệ này cho nhóm bệnh
nhân da trắng là: pw=652/720=0.906 , và
nhóm bệnh nhân da đen: pb=610/720=0.847. Và
RR có thể tính từ hai tỉ lệ này:
Đến đây, chúng ta thấy rõ rằng, tỉ lệ đề nghị
thông tim trong nhóm bệnh nhân da đen thấp hơn tỉ lệ trong nhóm bệnh nhân da
trắng là 6.5% (lấy 1 trừ cho 0.935 và nhân kết quả cho 100), chứ không phải 40%
như các tác giả và giới truyền thông tuyên bố.
Tại sao có sự khác biệt? Tại vì các tác giả và
giới truyền thông nhầm lẫn rằng OR là RR. Trong trường hợp này, OR không phải
là một chỉ số thích hợp để phân tích số liệu, bởi vì con số tỉ lệ quá cao
(84.7% và 90.6%), và vì tỉ lệ quá cao, cho nên OR ước tính RR quá cao hơn thực
tế.
Thật ra, ở đây cách gọi “RR” cũng không chính
xác. RR chỉ sử dụng cho tỉ lệ phát sinh (incidence), nhưng trong trường hợp này
không có tỉ lệ phát sinh, mà là tỉ lệ lưu hành (prevalence). Do đó, thuật ngữ
chính xác để mô tả 0.935 là prevalence ratio (PR). (Đây là một
đề tài khác mà tôi hi vọng sẽ có dịp quay lại để bàn thêm).
Điều ngạc nhiên là sai sót này lại hiện diện
ngay trên giấy trắng mực đen của một tập san y học vào hàng số 1 trên thế giới!
Vấn đề diễn dịch OR
RR là tỉ số của hai tỉ lệ, và tỉ lệ thì chúng
ta có thể hiểu được khá dễ dàng. Nếu nói tỉ lệ mắc bệnh 3%, chúng ta nghĩ ngay
đến 3 trong 100 người mắc bệnh. Vì thế, vấn đề diễn dịch RR khá dễ dàng. Nếu RR
= 2, chúng ta có thể nói rằng tỉ lệ tăng gấp 2 lần. Ai cũng hiểu được mà không
chất vấn gì thêm.
OR là tỉ số của hai odds. Odd phản ảnh “khả
năng” mắc bệnh. Odd = 2 có nghĩa là khả năng mắc bệnh cao hơn khả năng không
mắc bệnh 2 lần. Khó hiểu. Odd đã khó hiểu thì tỉ số của hai odds (hay hai khả
năng) lại càng là một đo lường khó hiểu hơn vì nó quá chung chung, khó cảm nhận
được. Thật ra, một người bình thường (kể cả giới bác sĩ) khó có thể hiểu chính
xác nghĩa của OR. Chúng ta biết OR = 2 không hẳn có cùng nghĩa với RR = 2.
Chính vì thế mà gần đây có “phong trào xét lại” OR trên các tập san y học quốc
tế. Nhiều nhà nghiên cứu, dịch tễ học và thống kê học kêu gọi bỏ OR!
Nhưng bất cứ đo lường nào cũng lợi thế và khiếm
khuyết. RR, dù dễ diễn dịch cũng có khiếm khuyết của nó. Lấy ví dụ đơn giản:
nếu tỉ lệ mắc bệnh ung thư trong nhóm A là 1% và nhóm B là 3%, chúng ta dễ dàng
thấy RR = 3. Nhưng thay vì nói mắc bệnh, chúng ta lật ngược lại vấn đề “không
mắc bệnh”: chúng ta có tỉ lệ cho nhóm A là 99% so với nhóm B là 97%, và như thế
RR = 0.97 / 0.99 = 0.98, tức là tỉ lệ không mắc bệnh trong nhóm B thấp hơn nhóm
A khoảng 2%. (Nhưng nếu dùng “mắc bệnh”, nhóm A mắc bệnh nhiều hơn nhóm B đến 3
lần!) Nói cách khác, RR có thể thiếu tính nhất quán (consistency).
Nhưng OR thì không có vấn đề thiếu nhất quán.
Trong ví dụ trên, nếu lấy chỉ số là “mắc bệnh” làm so sánh, OR là 3.06. Nhưng
nếu lấy “không mắc bệnh” làm chỉ số son sánh, thì OR vẫn là 3.06 (bạn đọc có
thể kiểm tra con số này). Trong toán thống kê, người ta gọi đặc tính của OR là
symmetric (đối xứng), còn đặc tính của RR là asymmetric (bất đối xứng).
OR, RR và thể loại nghiên cứu
Một khác biệt cở bản nữa giữa RR và OR là sự
tùy thuộc vào thể loại nghiên cứu. Nói một cách ngắn gọn, RR chỉ có thể ước
tính từ nghiên cứu xuôi thời gian (cohort prospective study), nhưng OR thì có
thể ước tính từ tất cả thể loại nghiên cứu, nhưng củ yếu là nghiên cứu bệnh –
chứng.
Giả sử chúng ta muốn tìm hiểu mối liên hệ giữa
phơi nhiễm chất độc màu da cam (Agent Orange – AO) và bệnh ung thư. Một cách
nghiên cứu qui mô là tuyển chọn [ngẫu nhiên] một nhóm đối tượng, sau đó phân
nhóm dựa vào tiền sử có bị phơi nhiễm độc chất hay không. Sau đó, theo dõi cả
hai nhóm đối tượng một thời gian (chẳng hạn như 5 năm) và ghi nhận số người bị
ung thư. Kết quả của nghiên cứu như thế có thể tóm lược trong Bảng 4 sau
đây. Trong số 1000 người được thẩm định bị phơi nhiễm lúc ban đầu, có 20 người
(hay 2%) bị ung thư trong thời gian theo dõi; trong số 10,000 người không bị
phơi nhiễm AO, có 100 người (tức 1%) bị ung thư sau đó. Như vậy, RR = 0.02/0.01
= 2. Nhưng nếu tính bằng odd thì OR = 2.02. Hai chỉ số này không khác nhau đáng
kể.
Bảng 4. Một nghiên cứu xuôi thời gian (giả
tưởng)
Nhóm
|
Ung
thư
|
Không
ung thư
|
Tổng
số
|
Phơi nhiễm AO
|
20
|
980
|
1000
|
Không phơi nhiểm AO
|
100
|
9900
|
10000
|
Nhưng theo dõi đối tượng một thời gian dài
thường rất tốn kém. Một phương pháp nghiên cứu khác cũng có thể đáp ứng mục
đích tìm hiểu mối liên hệ giữa AO và ung thư, nhưng cần ít đối tượng hơn và
không cần theo dõi một thời gian dài: đó là nghiên cứu bệnh – chứng. Bảng
5dưới đây trình bày kết quả một nghiên cứu (giả tưởng) như thế. Trong
nghiên cứu này, chúng ta chọn 100 bệnh nhân ung thư và 100 đối tượng không bị
ung thư, nhưng hai nhóm này tương đương nhau về các yếu tố nguy cơ. Sau đó,
chúng ta tìm hiểu qua hồ sơ bệnh lí (hay phỏng vấn) trong mỗi nhóm có bao nhiêu
người bị phơi nhiễm độc chất. Nói cách khác, đây là một nghiên cứu “ngược thời
gian” (so với nghiên cứu “xuôi thời gian” như trình bày trong Bảng 4. Kết quả
nghiên cứu bệnh chứng này được trình bày như sau:
Bảng 5. Một nghiên cứu bệnh - chứng (giả
tưởng)
Nhóm
|
Ung
thư
|
Không
ung thư
|
Phơi nhiễm AO
|
10
|
5
|
Không phơi nhiểm AO
|
90
|
95
|
Tổng số
|
100
|
100
|
Trong nhóm bệnh nhân, có 10 người (hay 10%)
từng bị phơi nhiễm AO; và trong nhóm không ung thư số đối tượng từng bị phơi
nhiễm là 5 người (hay 5%). Ở đây, chúng ta không thể tính tỉ lệ phát sinh bệnh
(incidence), bởi vì số lượng bệnh nhân và đối chứng đã được xác định trước. Vì
không thể ước tính tỉ lệ phát sinh, nghiên cứu bệnh chứng không cho phép chúng
ta ước tính RR. Tuy nhiên, chúng ta có thể tính OR, và OR trong trường hợp này
là một ước tính chỉ số RR.
Số liệu Bảng 5 cho thấy odd
bị phơi nhiễm trong nhóm bệnh nhân là: 10/90 = 0.1111, và nhóm đối chứng:
0.05263. Do đó, OR = 0.1111 / 0.05263 = 2.11. Thật ra, có thể tính đơn giản hơn
bằng công thức “giao chéo”:
Điểm chính để phân biệt hai hình thức nghiên
cứu này là phương pháp chọn mẫu. Với nghiên cứu xuôi thời gian, chúng ta xác
định số lượng đối tượng theo yếu tố nguy cơ ngay từ đầu, và số lượng bệnh phát
sinh là một số ghi nhận. Ngược lại, với nghiên cứu ngược thời gian, chúng ta
xác định số lượng bệnh nhân và đối tượng ngay từ đầu, và số lượng phơi nhiễm
yếu tố nguy cơ là số ghi nhận.
Tuy kết quả nghiên cứu của hai thể loại nghiên
cứu được trình bày rất giống nhau: hai cột và hai dòng (2x2 table), nhưng “câu
chuyện” đằng sau của các số liệu này rất khác nhau. Không am hiểu câu chuyện
đằng sau của một bảng số liệu rất dễ dàng sai lầm trong khi phân tích!
Tóm tắt
Để kết thúc bài viết này, tôi xin nhấn mạnh
một số điểm chính:
·
Cả
hai RR và OR đều là những chỉ số phản ảnh độ tương quan giữa một yếu tố nguy cơ
và bệnh; nhưng RR mới là chỉ số chúng ta cần biết (còn OR chỉ là ước số của
RR).
·
Vì
OR tùy thuộc vào tỉ lệ hiện hành (và khi tỉ lệ hiện hành của bệnh cao – như
trên 10% – thì OR thường cao hơn so với thực tế), cho nên các nghiên cứu này
nên sử dụng prevalence ratio.
·
Các
nghiên cứu bệnh chứng (case-control study) chỉ có thể cung cấp OR, chứ không
phải RR. Các nghiên cứu cắt ngang có thể cung cấp OR, chứ không phải RR.
·
Các
nghiên cứu xuôi thời gian (prospective study) cung cấp cả OR và RR, nhưng RR là
chỉ số có ý nghĩa và dễ diễn dịch.
·
Tuy
nhiên, RR không nhất quán như OR.
0 nhận xét:
Đăng nhận xét