Sai số trong nghiên cứu bệnh chứng

SAI SỐ TIỀM TÀNG TRONG CÁC NGHIÊN CỨU DỊCH TỄ HỌC

Các điều tra dịch tễ học nhằm mục đích cung cấp các đo lường chính xác sự xuất hiện bệnh (hay tình trạng sức khoẻ nào đó). Tuy nhiên có nhiều nguy cơ sai số trong đo lường. Các nhà dịch tễ học đã dành nhiều nỗ lực dành cho việc làm giảm thiểu các sai số này cũng như để đánh giá tác động của các sai số không thể loại bỏ được. Sai số có thể là ngẫu nhiên hoặc hệ thống.

Sai số ngẫu nhiên

Sai số ngẫu nhiên là sự lệch đi, do ngẫu nhiên, may rủi, của một quan sát trên một mẫu so với giá trị thật của quần thể, dẫn đến sự thiếu chính xác trong việc đo lường sự kết hợp. Có ba nguồn sai số ngẫu nhiên chính: 

dao động về mặt sinh học giữa các cá thể, 

sai số chọn mẫu, và           

sai số đo lường.

Sai số ngẫu nhiên không thể loại bỏ hoàn toàn được vì chúng ta chỉ có thể nghiên cứu trên một mẫu của quần thể. Sai số ngẫu nhiên là nguyên nhân của một thực tế là một cỡ mẫu nhỏ không thể đại diện cho tất cả các biến của quần thể. Cách tốt nhất để làm giảm sai số chọn mẫu là tăng cỡ mẫu của nghiên cứu. Sự biến thiên cá thể thường xảy ra và không đo lường nào là chính xác tuyệt đối. Sai số đo lường có thể giảm đi bằng các đề cương chặt chẽ, và bằng cách tạo ra các đo lường cá thể càng chính xác càng tốt. Các nhà điều tra cần hiểu các phương pháp đo lường đang được sử dụng trong nghiên cứu, và các sai số mà các phương pháp này có thể gây ra. Lý tưởng, phòng thí nghiệm có khả năng đưa ra độ tin cậy và tính chính xác của các đo lường của họ bằng các qui trình kiểm soát chất lượng chặt chẽ. 

Cỡ mẫu

Cỡ mẫu cần đủ lớn để nghiên cứu có đủ hiệu lực thống kê phát hiện những khác biệt được cho là quan trọng. Các cách tính cỡ mẫu có thể được thực hiện với công thức chuẩn được cung cấp ở Chương 4. Các thông tin sau đây cần thiết trước khi thực hiện tính toán cỡ mẫu:

Mức ý nghĩa thống kê yêu cầu để phát hiện một sự khác biệt;

Sai số chấp nhận được, hoặc khả năng bỏ lỡ tác động thật;

Mức độ ảnh hưởng của cuộc điều tra;

Tỷ lệ bệnh trong quần thể;

Độ lớn tương đối của các nhóm so sánh.

Trong thực tế, kích thước mẫu thường được quyết định bởi các yếu tố như hậu cần và tài chính và luôn phải cân nhắc giữa việc tăng cỡ mẫu và chi phí. Tổ chức Y tế Thế giới cũng xuất bản hướng dẫn thực hành xác định cỡ mẫu trong các nghiên cứu y tế.22

Tính chính xác của nghiên cứu cũng có thể được cải thiện bằng cách đảm bảo rằng các nhóm có cỡ mẫu tương đối thích hợp. Điều này thường là một vấn đề trong các nghiên cứu bệnh – chứng khi cần quyết định về số lượng chứng với mỗi trường hợp bệnh. Không thể chắc chắn về tỷ số lý tưởng giữa chứng và bệnh vì nó phụ thuộc vào chi phí tập hợp các trường hợp bệnh và chứng. Nếu các trường hợp bệnh là hiếm gặp và các trường hợp chứng là nhiều, sẽ là hợp lý khi tăng tỷ số giữa chứng so với bệnh. Ví dụ trong nghiên cứu bệnh – chứng về tác động của thalidomid (Hộp 3.2), 46

trẻ em bị bệnh so sánh với 300 trẻ bình thường. Tuy nhiên, nhìn chung ít có quan điểm về việc chọn nhiều hơn 4 chứng cho mỗi trường hợp bệnh. Điều quan trọng là đảm bảo rằng sự tương đồng thoả đáng giữa bệnh và chứng khi số liệu được sử dụng để phân tích, ví dụ như về nhóm tuổi hay tầng lớp xã hội; nếu đa phần các trường hợp bệnh và chỉ một số ít các trường hợp chứng ở nhóm tuổi cao, thì nghiên cứu sẽ không có khả năng xem xét đến yếu tố nhiễu là tuổi. 

Sai số hệ thống

Sai số hệ thống (hay sai lệch) xảy ra trong dịch tễ học khi các kết quả nghiên cứu khác một cách có hệ thống so với các giá trị thực. Một nghiên cứu có sai số hệ thống nhỏ được coi là có tính xác thực cao. Tính xác thực không chịu ảnh hưởng của cỡ mẫu.

Các nguồn sai số hệ thống có thể có trong dịch tễ học thì rất nhiều và đa dạng; có hơn 30 loại sai lệch đã được xác định. Các sai lệch chính là:

Sai lệch do chọn;

Sai lệch do đo lường (hay phân loại).

Sai lệch do chọn hay sai số chọn 

Sai số chọn xảy ra khi có một khác biệt có hệ thống giữa các đặc tính của những người được chọn vào nghiên cứu và các đặc tính của những người không được chọn vào nghiên cứu. Sai số chọn hiển nhiên xảy ra khi những người tham gia tự chọn mình vào nghiên cứu, có thể do họ không khoẻ hoặc do họ đặc biệt lo lắng về một tình trạng phơi nhiễm nào đó. Ví dụ, người ta biết rõ là những người chấp nhận lời mời tham gia nghiên cứu về ảnh hưởng của hút thuốc thì khác với những người không chấp nhận tham gia nghiên cứu về các thói quen hút thuốc của họ; những người không tham gia thường là những người hút nhiều hơn. Trong các nghiên cứu về sức khoẻ của trẻ em cần có sự hợp tác của cha mẹ, sai số chọn cũngcó thể xảy ra. Trong một nghiên cứu thuần tập về trẻ sơ sinh,23 tỷ lệ theo dõi thành công trong 12 tháng thay đổi tùy thuộc vào mức thu nhập của cha mẹ. Nếu các cá nhân tham gia vẫn ở lại trong nghiên cứu có những đặc tính khác với những người không được lựa chọn lúc đầu, hoặc những người bỏ cuộc trước khi nghiên cứu hoàn thành, thì nghiên cứu sẽ đưa ra một ước lượng sai lệch về mối liên hệ giữa phơi nhiễm và tình trạng sức khoẻ.

Một sai số chọn quan trọng nữa xảy ra khi chính bệnh hay yếu tố điều tra làm cho người ta không sẵn sàng tham gia cho nghiên cứu. Ví dụ, trong một xí nghiệp mà ở đó công nhân phơi nhiễm với formaldehyde, những công nhân bị đau mắt nhiều thường tự rời bỏ công việc hoặc theo lời khuyên của thầy thuốc. Những công nhân còn lại ít bị ảnh hưởng hơn và nếu nghiên cứu cắt ngang ở nơi làm việc về mối liên quan giữa phơi nhiễm với formaldehyde và bệnh đau mắt rất có thể bị sai lệch.

Trong các nghiên cứu dịch tễ học về bệnh nghề nghiệp như vậy, sai số chọn quan trọng này được gọi là hiệu ứng công nhân khoẻ mạnh. Các công nhân phải có đủ sức khoẻ thực hiện công việc của họ; những người ốm rất nặng và bị tàn tật thường bị loại khỏi môi trường làm việc. Tương tự như vậy, nếu một nghiên cứu được thực hiện thông qua việc khám sức khoẻ tại một trung tâm y tế và không tiến hành theo dõi những người không quay trở lại, thì các kết quả sai lệch có thể nảy sinh: những người bị bệnh nặng có thể nằm ở nhà họ hay ở bệnh viện. Tất cả các thiết kế nghiên cứu dịch tễ học cần phải chú ý đến sai số chọn này.

Sai số đo lường

Sai số đo lường xảy ra khi việc đo lường các cá thể hay phân loại bệnh hoặc tình trạng phơi nhiễm không chính xác – có nghĩa là không đo lường được đúng cái cần đo lường. Có rất nhiều nguồn sai số đo lường và những ảnh hưởng của chúng ở các mức độ khác nhau. Ví dụ các đo lường hoá sinh hay sinh lý thường không bao giờ chính xác hoàn toàn và các phòng thí nghiệm khác nhau thường cho các kết quả khác nhau trên cùng mẫu xét nghiệm. Nếu các mẫu xét nghiệm của nhóm phơi nhiễm và nhóm đối chứng được phân tích ngẫu nhiên tại các phòng thí nghiệm khác nhau, thì sẽ có ít khả năng xảy ra sai số hệ thống này hơn là khi toàn bộ các mẫu từ nhóm phơi nhiễm được phân tích trong một phòng thí nghiệm và toàn bộ các mẫu trong nhóm chứng được phân tích trong một phòng thí nghiệm khác.

Một dạng sai số đo lường đặc biệt quan trọng trong nghiên cứu bệnh – chứng được gọi là sai số nhớ lại. Sai số này xảy ra khi có sự nhớ lại các thông tin khác nhau giữa các trường hợp bệnh và chứng; chẳng hạn, các trường hợp bệnh có nhiều khả năng nhớ tình trạng phơi nhiễm trong quá khứ tốt hơn, đặc biệt nếu tình trạng phơi nhiễm được biết rộng rãi là có liên quan tới bệnh đang nghiên cứu – ví dụ, không tập thể dục và bệnh tim. Sai số nhớ lại cũng có thể hoặc làm làm tăng thêm độ lớn của sự kết hợp giữa phơi nhiễm và bệnh – như những bệnh nhân bị bệnh tim thường có nhiều khả năng nhận là trước đây ít tập thể dục –  hoặc ước lượng thấp về độ lớn của sự kết hợp – nếu các trường hợp bệnh có xu hướng phủ nhận tình trạng phơi nhiễm trước đây hơn so với các trường hợp chứng.

Nếu sai số đo lường xảy ra tương tự trong các nhóm được so sánh với nhau thì hầu như luôn dẫn đến một ước lượng thấp về độ mạnh thực sự của mối quan hệ. Hình thức sai số không khác biệt này có thể giải thích một vài sự không nhất quán giữa các kết quả nghiên cứu dịch tễ học khác nhau.

Nếu nhà điều tra, nhân viên phòng thí nghiệm hoặc người tham gia nghiên cứu biết được tình trạng phơi nhiễm, kiến thức này có thể ảnh hưởng đến các đo lường và gây ra sai số quan sát. Để tránh được sai số này, các đo lường có thể được thực hiện theo cách làm mù đơn hoặc làm mù kép. Một nghiên cứu làm mù đơn nghĩa là các nhà điều tra không biết những người tham gia được phân loại như thế nào. Một nghiên cứu làm mù kép nghĩa là cả các nhà điều tra lẫn người tham gia đều không biết tình trạng phân loại.

NHIỄU

Nhiễu là một vấn đề quan trọng khác trong các nghiên cứu dịch tễ học. Trong một nghiên cứu về sự kết hợp giữa một phơi nhiễm với một căn nguyên (hay yếu tố nguy cơ) và sự xuất hiện bệnh, thì nhiễu có thể xảy ra khi một yếu tố phơi nhiễm khác tồn tại trong quần thể nghiên cứu và có liên quan tới cả bệnh và yếu tố phơi nhiễm mà nghiên cứu quan tâm. Một vấn đề nảy sinh nếu như yếu tố ngoại lai này – chính bản thân nó là một yếu tố quyết định hay là một yếu tố nguy cơ đối với tình trạng sức khoẻ – được phân bố không đồng đều giữa các nhóm nhỏ có phơi nhiễm. Nhiễu xảy ra khi các tác động của hai phơi nhiễm (các yếu tố nguy cơ) không được tách biệt và vì vậy đi đến kết luận không chính xác rằng tác động quan sát được là do một biến này chứ không phải một biến khác gây ra. Để trở thành một yếu tố nhiễu cần đáp ứng hai tiêu chí (Hình 3.10).

Nhiễu nảy sinh do sự phân bố không ngẫu nhiên của các yếu tố nguy cơ trong quần thể nguồn cũng xảy ra trong quần thể nghiên cứu và vì vậy đưa đến các ước lượng sai lệch về tác động (xem Hộp 3.7). Trong trường hợp này, có thể xuất hiện sai số, nhưng trên thực tế nó không phải kết quả của sai số hệ thống trong thiết kế nghiên cứu.25

Tuổi và tầng lớp xã hội thường là các yếu tố nhiễu trong các nghiên cứu dịch tễ học. Một mối liên hệ giữa huyết áp cao và bệnh mạch vành có thể đại diện cho những thay đổi đi cùng nhau của hai biến theo mức tăng của tuổi; tác động của yếu tố nhiễu tiềm tàng là tuổi cần phải được xem xét, và khi thực hiện điều này thì người ta quan sát thấy huyết áp cao thực sự làm tăng nguy cơ của bệnh mạch vành.

Hộp 3.7. Yếu tố nhiễu: khó kiểm soát

Sai số trong nghiên cứu bệnh chứng

Một điều cũng đã được biết rõ là hút thuốc lá là nguyên nhân của bệnh mạch vành tim. Vì có thể mối liên hệ giữa uống cà phê và bệnh mạch vành chỉ phản ánh mối liên hệ đã biết giữa hút thuốc lá và bệnh tim. Trong tình huống này, hút thuốc lá làm nhiễu mối liên hệ giữa uống cà phê và bệnh mạch vành, vì hút thuốc liên quan đến uống cà phê và là một yếu tố nguy cơ thậm chí cho những người không uống cà phê. 

Kiểm soát nhiễu

Có một vài phương pháp để kiểm soát nhiễu, có thể ở giai đoạn thiết kế nghiên cứu hoặc ở trong giai đoạn phân tích kết quả.

Các phương pháp thường được sử dụng để kiểm soát nhiễu trong giai đoạn thiết kế một nghiên cứu dịch tễ học là:

Phân bổ ngẫu nhiên

Giới hạn

Ghép cặp

Trong giai đoạn phân tích thì nhiễu có thể được kiểm soát bằng cách:

Phân tầng

Lập mô hình thống kê

Phân bổ ngẫu nhiên

Trong các nghiên cứu thực nghiệm, phân bổ ngẫu nhiên là một biện pháp lí tưởng để đảm bảo rằng các biến nhiễu tiềm tàng được phân bố đồng đều vào các nhóm được so sánh với nhau. Các cỡ mẫu phải đủ lớn để tránh sự không phân bố ngẫu nhiên các biến số này. Phân bổ ngẫu nhiên tránh được mối quan hệ giữa các biến nhiễu tiềm tàng và yếu tố phơi nhiễm đang được nghiên cứu.

Giới hạn

Giới hạn có thể được dùng để hạn chế nghiên cứu ở những người có những đặc tính cụ thể. Ví dụ trong một nghiên cứu về ảnh hưởng của cà phê đến bệnh mạch vành, những người tham gia nghiên cứu có thể được giới hạn ở những người không hút thuốc lá, vì vậy loại bỏ được ảnh hưởng tiềm tàng do tình trạng hút thuốc lá.

Ghép cặp

Ghép cặp được sử dụng để kiểm soát nhiễu bằng cách chọn lựa những người tham gia nghiên cứu sao cho đảm bảo rằng các biến nhiễu tiềm tàng được phân bố đồng đều vào 2 nhóm được so sánh với nhau. Ví dụ, trong một nghiên cứu bệnh – chứng để tìm hiểu về mối quan hệ giữa tập thể dục và bệnh mạch vành, thì mỗi một bệnh nhân có bệnh tim có thể được ghép cặp với một trường hợp chứng cùng nhóm tuổi và giới tính để đảm bảo rằng nhiễu do tuổi và giới tính không xảy ra. Mặc dù ghép cặp được sử dụng rất nhiều trong các nghiên cứu bệnh – chứng, nhưng nó lại có thể dẫn tới các vấn đề trong lựa chọn các trường hợp chứng nếu các tiêu chuẩn để ghép cặp quá chặt chẽ hoặc quá nhiều; điều này được gọi là ghép cặp quá mức.

Ghép cặp có thể tốn kém và mất nhiều thời gian, nhưng ghép cặp đặc biệt có ích nếu không có sự chồng chéo giữa các trường hợp bệnh và chứng, chẳng hạn như các trường hợp bệnh thường già hơn các trường hợp chứng.

Phân tầng và lập mô hình thống kê

Trong các nghiên cứu lớn người ta thường kiểm soát nhiễu ở giai đoạn phân tích chứ không phải ở giai đoạn thiết kế. Nhiễu sau đó có thể được kiểm soát bằng phân tầng, để đo lường độ mạnh của sự kết hợp trong từng tầng thuần nhất và được định nghĩa rõ ràng theo biến nhiễu. Nếu tuổi là một yếu tố nhiễu, thì mối liên hệ có thể được đo lường, giả sử, trong các nhóm tuổi với khoảng cách là 10 năm; nếu giới tính hay chủng tộc là một yếu tố nhiễu, thì sự kết hợp được đo lường riêng rẽ ở nam giới và nữ giới hoặc ở trong các nhóm chủng tộc khác nhau. Các phương pháp hiện có thể giúp tổng hợp sự kết hợp chung bằng cách đưa ra một trung bình được hiệu chỉnh của các ước lượng tính cho mỗi tầng riêng biệt.

Mặc dù việc phân tầng đơn giản về mặt khái niệm và tương đối dễ thực hiện, nhưng nó thường bị hạn chế bởi cỡ mẫu nghiên cứu và nó không thể đồng thời kiểm soát được nhiều yếu tố. Trong trường hợp này mô hình thống kê (phân tích đa biến) được sử dụng để ước lượng độ mạnh của sự kết hợp trong khi vẫn đồng thời kiểm soát cho một số yếu tố nhiễu; rất nhiều các kỹ thuật thống kê hiện được sử dụng để phân tích (Chương 4).

Tính giá trị 

Tính giá trị là mức độ mà một xét nghiệm có khả năng đo lường cái mà nó dự định đo lường. Một nghiên cứu có giá trị nếu các kết quả của nó tương ứng với sự thật; nghiên cứu không được có sai số hệ thống, và sai số ngẫu nhiên càng nhỏ càng tốt. Hình 3.11 mô tả mối quan hệ giữa giá trị thật và các giá trị đo lường ở mức giá trị và độ tin cậy cao và thấp. Với độ tin cậy thấp nhưng tính giá trị cao thì các giá trị đo lường phân tán, nhưng trung bình của các giá trị đo lường thì gần với giá trị thật. Ngược lại, độ tin cậy cao (hay tính lặp lại) của các đo lường không đảm bảo tính giá trị bởi vì các giá trị đó có thể khác xa với giá trị thật. Có hai loại tính giá trị: nội tại và ngoại suy.

Tính giá trị nội tại

Tính giá trị nội tại là mức độ mà các kết quả của một quan sát là chính xác cho một nhóm người cụ thể được nghiên cứu. Ví dụ, các đo lường hàm lượng huyết sắc tố phải phân biệt được chính xác những người tham gia bị thiếu máu như đã định nghĩa trong nghiên cứu. Phân tích máu ở một phòng thí nghiệm khác có thể cho các kết quả khác do sai số hệ thống, nhưng đánh giá về các mối quan hệ với bệnh thiếu máu, như được đo lường ở một phòng thí nghiệm, có thể vẫn có tính giá trị nội tại.

Đối với một nghiên cứu vì bất kỳ mục đích gì đều cần giá trị nội tại, mặc dù một nghiên có tính giá trị nội tại có thể không có kết quả gì bởi vì các kết quả của nó không thể so sánh được với các nghiên cứu khác. Tính giá trị nội tại có thể bị đe doạ bởi các nguồn sai số hệ thống nhưng có thể được cải thiện nhờ thiết kế tốt và thận trọng. 

Tính ngoại suy

Tính ngoại suy hoặc khái quát là phạm vi mà các kết quả của một nghiên cứu áp dụng được cho những người không thuộc nghiên cứu (ví dụ: cho các phòng thí nghiệm không liên quan đến nghiên cứu). Tính giá trị nội tại là cần thiết, nhưng không thể đảm bảo, cho tính khái quát và nó dễ đạt được hơn. Tính khái quát đòi hỏi việc kiểm soát chất lượng bên ngoài của các đo lường và những phán đoán về mức độ mà các kết quả nghiên cứu có thể ngoại suy được. Điều này không đòi hỏi là mẫu nghiên cứu phải đại diện cho một quần thể tham khảo. Ví dụ, bằng chứng về ảnh hưởng của việc hạ thấp lượng cholesterol trong máu của nam giới cũng có liên quan đến bằng chứng của phụ nữ, nhưng nó đòi hỏi phải có sự phán đoán về tính khái quát của các nghiên cứu trên nam giới. Tính khái quát được hỗ trợ bởi các thiết kế nghiên cứu kiểm định giả thuyết rõ ràng ở trong những quần thể được định nghĩa rõ ràng. Giá trị ngoại suy của một nghiên cứu được khẳng định nếu có kết quả tương tự từ các nghiên cứu ở các quần thể khác.24

Vấn đề đạo đức

Vấn đề đạo đức liên quan đến các hành động và các chính sách là đúng hay sai, công bằng hay không công bằng. Tình trạng khó xử về đạo đức nảy sinh thường xuyên trong thực hành dịch tễ và các nguyên tắc đạo đức chi phối thực hành dịch tễ, cũng như trong tất cả các hoạt động của con người. Các hướng dẫn tiến hành nghiên cứu chung về con người được thảo luận trong Chương 11. Nghiên cứu và giám sát là chủ yếu để đảm bảo các nhà điều tra y tế công cộng không có những hậu quả không chủ định nghiêm trọng và có hại như đã từng xảy ra ở Bangladesh khi đào và xây dựng giếng nước (Hộp 3.8).

Hộp 3.8. Các hậu quả không chủ định: arsenic trong giếng khoan tại Băngladesh

Sai số trong nghiên cứu bệnh chứng

Tất cả các nghiên cứu dịch tễ học cần được hội đồng đạo đức xem xét và chấp thuận (xem Chương 11). Các nguyên tắc đạo đức áp dụng trong thực hành dịch tễ và nghiên cứu bao gồm:

Đồng thuận tham gia

Bí mật

Tôn trọng quyền con người

Đảm bảo tính khoa học        

Đồng thuận tham gia

Cần có sự đồng thuận tham gia tự do và tự nguyện từ các thành viên tham gia các nghiên cứu dịch tễ và họ có quyền rút khỏi nghiên cứu vào bất cứ thời điểm nào. Tuy nhiên, sự đồng thuận tham gia là không thực tế khi tiếp cận các hồ sơ y tế định kỳ. Trong những trường hợp này, cũng như khái niệm trong bất kỳ nghiên cứu nào, các nhà dịch tễ học cần tôn trọng sự riêng tư cá nhân và tính bí mật tại bất cứ thời gian nào. Họ có nghĩa vụ thông báo cho cộng đồng họ đang làm gì và tại sao, và chuyển những kết quả nghiên cứu cũng như những ý nghĩa của chúng đến cộng đồng có liên quan. Tất cả các đề cương của các nghiên cứu dịch tễ học cần được nộp cho hội đồng đạo đức trước khi nghiên cứu bắt đầu.

Đảm bảo tính khoa học

Tất cả các nhà khoa học đều có tiềm năng cư xử theo cách không đúng nguyên tắc, có lẽ một phần bởi áp lực thành công. Các nhà dịch tễ học cũng có thể có hành vi không đúng nguyên tắc. Ví dụ bao gồm các kết quả nghiên cứu rõ ràng bị mâu thuẫn lợi ích ảnh hưởng và công bố số liệu bịa đặt.28,29 Việc làm giảm thiểu các hành vi không đúng nguyên tắc đòi hỏi sự thận trọng trong hội đồng đạo đức và sự quan tâm chú ý tới đánh giá của các bài báo khác.30 Quá trình đào tạo và kinh nghiệm của các nhà dịch tễ học cần bao gồm những thảo luận nghiêm túc và nhắc lại về những vấn đề này.

Bệnh viện Nguyễn Tri Phương - Đa khoa Hạng I Thành phố Hồ Chí Minh

Sai số trong nghiên cứu bệnh chứng
  facebook.com/BVNTP

Sai số trong nghiên cứu bệnh chứng
  youtube.com/bvntp