Phương pháp nghiên cứu khoa học - Bài 6: Biến số
Bạn đang xem tài liệu "Phương pháp nghiên cứu khoa học - Bài 6: Biến số", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- phuong_phap_nghien_cuu_khoa_hoc_bai_6_bien_so.doc
Nội dung text: Phương pháp nghiên cứu khoa học - Bài 6: Biến số
- Biến số Mục tiêu 1. Xác định biến số là gì và tại sao việc chọn lựa biến số là quan trọng 2. Phân biệt được biến số định tính (categorical) và biến số định lượng (numerical) 3. Phân biệt được sự khác biệt giữa biến số độc lập và biến số phụ thuộc và chúng được sử dụng trong nghiên cứu như thế nào 4. Xác định được các biến số được đo lường trong dự án nghiên cứu đang được thiết kế và cho biết: - Biến số nào có thể đo lường trực tiếp - Biến số nào không thể đo lường trực tiệp và phải sử dụng định nghĩa cụ thể(operation definition) - Biến số nào không thể đo lường được vào thời điểm hiện tại. Biến số Do nghiên cứu khoa học là việc thu thập, phân tích và lí giải số liệu để giải quyết vấn đề nghiên cứu hay trả lời một câu hỏi nghiên cứu (Varkevisser et al., 1991) nên nghiên cứ khoa học cần phải thu thập thông tin các đặc tính hay các đại lượng của đối tượng. Các đặc tính hay đại lượng này được gọi là biến số. Nói cách khác: Biến số là những đại lượng hay những đặc tính có thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm khác. Biến số định tính và biến số định lượng Như vậy biến số có thể thể hiện đại lượng hay đặc tính. Nếu nó thể hiện một đại lượng nó được gọi là biến số định lượng. Nếu nó nhằm thể hiện một đặc tính nó được gọi là biến số định tính. Biến số định tính còn được chia làm 2 loại: biến số danh định và biến số thứ tự. Biến số danh định là biến số mà giá trị của nó không thể biểu thị bằng số mà phải biểu diễn bằng một tên gọi (danh: tên) và các giá trị này không thể sắp đặt theo một trật tự từ thấp đến cao. Thí dụ: Biến số dân tộc với các giá trị: Kinh, Khmer, Hoa, Chăm, là biến số định tính vì chúng ta không thể sắp xếp các giá trị này từ theo một trật tự từ thấp đến cao hay ngược lại. Một số thí dụ khác của biến số danh định là tình trạng hôn nhân (có 4 giá trị: độc thân, có gia đình, li dị, góa) nhóm máu (A, B, AB và O). Trong phân tích thống kê, để tiện việc nhập số liệu hay lí giải kết quả, người ta có thể ánh xạ (mapping) các giá trị của biến danh định vào các con số. Việc này được gọi là mã hóa và cần hiểu rằng việc mã hóa này hoàn toàn có tính chất áp đặt và các con số được dùng trong mã hóa không phản ánh bản chất của biến số danh định. Giới tính là biến số danh định và có hai giá trị là nam và nữ. Chúng ta có thể mã hóa giới tính và quy ước Nam là 1 và Nữ là 2. Tuy nhiên việc mã hóa này là áp đặt và chúng ta hoàn toàn có thể quy ước Nam là 1 và Nữ là 0. Việc mã hóa chỉ nhằm giúp việc nhập số liệu và xử lí số liệu trở nên dễ dàng hơn chứ không nhằm phản ánh bản chất của biến số đó (do đó hoàn toàn vô căn cứ nếu cho rằng mã hóa Nam=1 và Nữ=0 là phản ánh thái độ phong kiến "Nhất nam viết hữu - Thập nữ viết vô).
- Biến số thứ tự là biến số danh định nhưng có thể sắp xếp thứ tự được. Thí dụ: tình trạng kinh tế xã hội (giàu, khá, trung bình, nghèo, rất nghèo) là biến số thứ tự bởi vì người giàu có điều kiện kinh tế tốt hơn người khá, người khá hơn người trung bình, trung bình hơn nghèo, v.v Những thí dụ khác là học lực của học sinh (giỏi, khá, trung bình, kém), tiên lượng (tốt, khá, xấu, tử vong). Theo phân loại tăng huyết áp của Tổ chức Y tế Thế giới được trình bày như sau, thì phân loại huyết áp với các giá trị huyết áp bình thường, huyết áp cao nhẹ, vừa và nặng là biến số thứ tự. Huyết áp bình thường: HA tâm thu (139 và HA tâm trương ( 89 Tăng huyết áp nhẹ: HA tâm thu ( 179 hay HA tâm trương ( 104 Tăng huyết áp vừa: HA tâm thu ( 180 hay HA tâm trương (114 Tăng huyết áp nặng: HA tâm thu (180 và HA tâm trương ( 115 mmHg Biến số định lượng nhằm thể hiện một đại lượng và do đó có giá trị là những con số. Thí dụ: tuổi là biến số liên tục bởi vì ta có thể nói người này 20 tuổi, người kia 32 tuổi, v.v. Những thí dụ khác là đường huyết, hemoglobin, hematocrite, chiều cao, cân nặng, thu nhập, v.v Khi chúng ta quan tâm đến việc lí giải nguyên nhân của sự việc chúng ta chia biến số thành biến số độc lập và biến số phụ thuộc. Biến số dùng để mô tả hay đo lường vấn đề nghiên cứu được gọi là biến số phụ thuộc. Biến số dùng để mô tả hay đo lường các yếu tố được cho là gây nên (hay gây ảnh hưởng đến) vấn đề nghiên cứu được gọi là biến số độc lập Cần phân biệt sự khác biệt giữa biến số và giá trị của biến số (còn gọi là yếu tố): Giới tính là biến số nhưng Nữ không phải là biến số mà là một giá trị của biến số (hay còn gọi là yếu tố). Thời gian chờ đợi để được sử dụng dịch vụ y tế là biến số nhưng thời gian chờ đợi lâu là giá trị của biến số. Kiến thức về các cây con thuốc là biến số nhưng ít hiểu biết về các cây con thuốc là yếu tố. Ta có thể nói biến số mức độ hút thuốc lá có liên quan đến nguy cơ ung thư phổi nhưng phải nói hút thuốc lá nặng là yếu tố nguy cơ của ung thư phổi. Biến số (đại lượng hay đặc tính được quan tâm) được chia làm 3 loại: - Biến số có thể đo lường trực tiếp - chiều cao, cân nặng, tuổi, tình trạng hôn nhân.v.v - Biến số không thể đo lường trực tiếp được như tình trạng dinh dưỡng, mức độ đắc khí, mức độ hài lòng của bệnh nhân, kiến thức của bà mẹ về thực hành chăm sóc trẻ. - Biến số không đo lường được trong nghiên cứu hiện tại. Trên nguyên tắc, mọi biến số đều có thể đo lường được nhưng trong một nghiên cứu cụ thể có thể có một số biến số không đo lường được do hạn chế của điều kiện kĩ thuật hay không thống nhất về định nghĩa cụ thể (thí dụ nồng độ endorphine gia tăng sau khi châm cứu, mức độ hữu dụng của những bệnh nhân bị tàn tật, chất lượng dân số) Ðịnh nghĩa cụ thể Thông thường, nhà nghiên cứu bắt đầu với một quan điểm tương đối mơ hồ về cách đo lường các biến số nghiên cứu. Thí dụ, nếu nhà nghiên cứu muốn đo lường mức độ đau thì nhà nghiên cứu phải chuyển đổi khái niệm đau thành một mệnh đề chặt chẽ xác định cách đo lường biến số này. Phụ thuộc vào cách lí giải trừu tượng của khái niệm đau và yêu cầu cụ thể của nghiên cứu, chúng ta có thể chọn lựa một phương pháp đo lương mức độ đau đớn.
- Ðịnh nghĩa cụ thể của biến số là một mệnh đề về cách người nghiên cứu của một nghiên cứu nào đó chọn cách đo lường biến số đó. Nó phải không được mơ hồ và chỉ có một cách lí giải duy nhất. Thí dụ, một nhà nghiên cứu cho rằng việc điều trị của bà ta có thể giúp cải thiện việc "kiểm soát vận động", câu hỏi chúng ta cần đặt ra ngay là "kiểm soát vận động" có ý nghĩa như thế nào. Nhà nghiên cứu có thể trả lời là bà ta quan tâm đến việc kiểm soát vận động được đo lường bởi Plunkett Motor Dexterity Task Score. Một nhà nghiên cứu khác có thể không chấp nhận định nghĩa này và cho rằng việc kiểm soát vận động nên được tự đánh giá bởi bệnh nhân. Cả hai định nghĩa này được gọi là định nghĩa cụ thể. Một định nghĩa cụ thể tốt là định nghĩa cung cấp đủ thông tin để cho phép một nhà nghiên cứu khác có thể lập lại kĩ thuật đo lường, nếu người đó muốn. Trong mô tả nghiên cứu nhà nghiên cứu nên bao gồm trong định nghĩa cụ thể những công cụ đo lường và quy trình nghiên cứu để người đọc có thể rõ ràng về những việc đã làm. Biến số độc lập - phụ thuộc - gây nhiễu Việc xác định biến số nào là biến số độc lập hay biến số phụ thuộc được xác định trong phần đặt vấn đề và mục tiêu của nghiên cứu. Do đó trong khi thiết kế nghiên cứu cần phải xác định rõ ràng biến số nào là độc lập và biến số nào là phụ thuộc. Thí dụ nếu nghiên cứu mối quan hệ giữa ung thư phổi và hút thuốc lá thì hút thuốc lá là biến số độc lập và ung thư phổi là biến số phụ thuộc Nếu nhà nghiên cứu muốn tìm hiểu tại sao thanh niên hút thuốc thì hút thuốc là biến số phụ thuộc và "áp lực của bạn bè" là biến số độc lập. Biến số gây nhiễu (confounding variable) là biến số cung cấp một giải thích khác của mối liên hệ giữa biến số độc lập và biến số phụ thuộc. Một biến số được đánh giá là biến số gây nhiễu khi có 3 đặc tính sau: - Có liên quan đến biến số phụ thuộc (là yếu tố nguy cơ của vấn đề nghiên cứu) - Có liên quan đến biến số độc lập (phân bố không đều giữa các giá trị của biến độc lập) - Không nằm trong cơ chế tác động của biến độc lập lên biến phụ thuộc Thí dụ: Số Cân lần nặng khá con m lúc thai sinh (Biế (Biế n số n số Thu độc phụ nhập lập) thuộ Có mối - c) liên hệ Học giữa số lần khám tiền sản và sanh con nhẹ hơn 2500 gram. Tuy nhiên thu nhập của gia vấn đình cũng có thể ảnh hưởng đến số lần khám tiền sản và việc sanh con nhẹ cân. Như vậy gia thu nhập của gia đình là yếu tố gây nhiễu. đình (biế n số gây nhiễ u)
- Kiểm soát yếu tố gây nhiễu Ðể khắc phục yếu tố gây nhiễu người ta có thể sử dụng: - Phương pháp hạn chế: thí dụ chỉ nghiên cứu những bà mẹ trong gia đình có thu nhập trung bình, không nghiên cứu những bà mẹ trong gia đình nghèo - Phương pháp bắt cặp trong chọn mẫu và phân tầng trong phân tích mẫu: - Phương pháp phần tầng: gồm tiến hành phân tích số liệu riêng biệt cho nhóm bà mẹ nghèo, cho nhóm bà mẹ trung bình và nhóm bà mẹ giàu rồi tổng hợp kết quả lại. Thực chất phương pháp phân tầng gồm là sự tổng hợp của nhiều nghiên cứu hạn chế (mỗi nghiên cứu được hạn chế cho một giá trị của biến số gây nhiễu) - Phương pháp mô hình hóa sử dụng phương pháp hồi quy đa biến để tách riêng tác động của từng biến số có liên quan trong mô hình. Khi đó hệ số của các biến số trong mô hình đánh giá tác động của biến số đó, không bị ảnh hưởng hay gây nhiễu bởi các yếu tố khác (bởi vì trong hồi quy đa biến, hệ số B 1 của biến số X 1 nêu lên sự thay đổi của biến phụ thuộc Y khi X1 thay đổi một đơn vị và các biến số liên quan khác như X 1 , X2 , không thay đổi). - Phương pháp chia nhóm ngẫu nhiên: chỉ sử dụng được cho nghiên cứu thực nghiệm nhưng đây là phương pháp khử yếu tố gây nhiễu toàn diện nhất và không cần xác định hay đo lường toàn bộ các yếu tố gây nhiễu. Biến số nền (background variables) Trong bất cứ nghiên cứu nào, có những biến số nền tảng thí dụ như tuổi, giới, trình độ giáo dục, tình trạng kinh tế, tình trạng hôn nhân, tôn giáo, v.v. Những biến số này thường có ảnh hưởng đến vấn đề nghiên cứu (biến số phụ thuộc) và có tác động như biến số gây nhiễu. Nếu biến số nền có ảnh hưởng quan trọng đến nghiên cứu cần phải thu thập thông tin về biến số nền. Nhưng không nên thu thập quá nhiều biến số nền để tránh làm tăng kinh phí nghiên cứu một cách vô ích.
- Bài tập: 1. Giả sử chúng ta có khung ý niệm (conceptual framework) về mối liên hệ giữ kém vận động và bệnh mạch vành như sau: Hút thuố c lá Kém Tăn Bện vận g h động LDL mạc - h Xem chol vành Trong các yếu tố: Hút thuốc lá, Tăng estertiLDL-cholesterol, vi Xem ti vi nhiều, yếu tố nào được xem là yếu tố gây nhiễu? nhiềol u 2. Một nghiên cứu đoàn hệ được tiến hànhGiả ở Anh quốc, những người tham gia được ghi nhận mức độ hoạt động tình dục cao ở mđầu nghiên cứu (được đánh giá bằng tần suất có khoái cảm) có nguy cơ tử vong trongHD 10 năm thấp hơn những người được ghi nhận có mức độ hoạt động tình dục thấp. 1 Giả L-sử điều này là đúng, anh chị có lời khuyên gì về việc hoạt động tình dục để giảm thiểu cholnguy cơ tử vong. ester Một số nhà khoa học cho rằng kết luận của nghiên cứu có thể là không đúng. Họ giải ol thích rằng những người có quan hệ tình dục thường xuyên là những người có sức khoẻ tổng quát tốt hơn, do đó, có nguy cơ tử vong thấp hơn. Theo các anh chị, những nhà khoa học này cho rằng tình trạng sức khoẻ tổng quát là yếu tố biến đổi hậu quả hay yếu tố gây nhiễu? Nếu điều này được chứng minh là đúng thì anh chị sẽ có lời khuyên gì đối với mọi người để giảm thiểu nguy cơ tử vong. Các bác sĩ lâm sàng có kinh nghiệm lại đưa ra lời giải thích khác. Họ cho rằng ở những người khoẻ mạnh, quan hệ tình dục thường xuyên là có lợi cho sức khoẻ và làm giảm nguy cơ tử vong còn ở người ở tình trạng sức khoẻ tổng quát đã kém việc quan hệ tình dục thường xuyên lại khiến đối tượng dễ bị tử vong hơn. Theo các anh chị, nếu kinh nghiệm lâm sàng này là đúng thì tình trạng sức khoẻ tổng quát là yếu tố biến đổi hậu quả hay yếu tố gây nhiễu? Nếu điều này là đúng thì anh chị sẽ có lời khuyên gì đối với mọi người để giảm thiểu nguy cơ tử vong. 1. Davey Smith G, Frankel S, Yarnell J. Sex and death: are they related? Findings from the Caerphilly Cohort study. BMJ. 1997; 315: 1641-1644 2. Gần như tất cả các nghiên cứu quan sát cho thấy sự giảm nguy cơ tử vong bệnh tim ở các phụ nữ sử dụng oestrogen. Một nghiên cứu gộp (meta-analysis) của 25 nghiên cứu đã xuất bản tìm thấy nguy cơ tương đối chung là 0.70 đối với bệnh mạch tim ở các phụ nữ có sử dụng estrogen (so với nhóm không dùng oestrogen); trong 7 nghiên cứu khác đánh giá hiệu quả của việc sử dụng oestrogen và progestogen, nguy cơ ước lượng là 0.66.2 Tuy nhiên, gần đây, Hemminki and McPherson đã tổng kết 22 nghiên cứu thử nghiệm ngẫu nhiên của việc sử dụng trị liệu oestrogen và thấy rằng các biến cố tim mạch lại là nguyên nhân chủ yếu của việc bỏ cuộc hay phản ứng ngoại ý.3 Tỉ số nguy cơ tóm tắt là
- (1.39) trong nhóm sử dụng estrogen so với nhóm không sử dụng. Điều này cho thấy estrogen không có tác dụng có lợi, nếu không phải là có hại, lên nguy cơ bệnh tim mạch. Anh chị tin vào kết quả nghiên cứu của loại nghiên cứu nào hơn? Anh chị cho rằng điều trị hormone thay thế ở phụ nữ mãn kinh có lợi hay có hại cho sức khỏe tim mạch? Tại sao anh chị lại tin như vậy? 1. Barrett-Connor E. Hormone Replacement Therapy. BMJ 1998;317:457-461 . 2. Barrett-Connor E, Grady D. Hormone replacement therapy, heart disease, and other considerations. Annu Rev Public Health 1998; 19: 55-72. 3. Hemminki E, McPherson K. Impact of postmenopausal hormone therapy on cardiovascular events and cancer: pooled data from clinical trials. BMJ 1997; 315: 149-153
- Bias in stud ies of 4 use . of oest Wroge r n i and t hear i t n dise g ase1 GBias r in o who u is p pres cribe f d o oestr r ogen : t M h o e r e P E e P d I u c T a r t i e a d l H . i g E h f e f r e c s t o s c i o a l c l a s s O s t e o p o r o s i s * N o d i a b e t e s , h e a r t d i s e a s e , o r h y p e r t e n s i o n H e a l t h i e r b e f o r e t r e a t e d Bias in who take s oestr ogen : C o m p l i a n t w o m e n
- f estrogen or estrogen/progestin regimens on heart disease risk factors in postmenopausal women. JAMA 1995; 273: 199-208 3. Một nghiên cứu thực nghiệm trên khỉ chimpanzee cho thấy lượng estrogen giúp khỉ chimpanzee cái được bảo vệ và có nguy cơ bị sốt rét thấp hơn so với khỉ đực. Một nhà nghiên cứu quan tâm đến đề tài này và thực hiện một nghiên cứu bệnh chứng để xác định mối liên hệ giữa giới tính và sốt rét. Nhà nghiên cứu này tìm được 150 trường hợp bệnh (trong đó có 88 nam) và 150 chứng (trong đó có 68 nam). Tỉ số số chênh thô tính được là 1,71. Nhà nghiên cứu này cũng biết chút ít về dịch tễ và cho rằng những hoạt động nghề nghiệp ngoài nhà là yếu tố gây nhiễu và do đó, thu thập thông tin về nghề nghiệp hoạt động ngoài nhà ở các đối tượng, sử dụng phương pháp phân tầng và ghi nhận được các kết quả sau: Nhóm nghề nghiệp ngoài nhà Nhóm nghề nghiệp trong nhà Bệnh Chứng Tổng số Bệnh Chứng Tổng số Nam 53 15 68 Nam 35 53 88 Nữ 10 3 13 Nữ 52 79 131 Tổng số 63 18 81 Tổng số 87 132 219 Theo các anh chị, nghề nghiệp (ngoài nhà và trong nhà) có phải là yếu tố gây nhiễu trong nghiên cứu này hay không? tại sao? Nhà nghiên cứu đang viết bài báo cáo và dự định sẽ công bố giá trị OR hiệu chỉnh theo nghề nghiệp. Tình cờ có một chuyên viên dịch tễ của Tổ Chức Y tế Thế giới đọc được bản thảo của nghiên cứu này và cho ý kiến phản biến. Theo ông, do nghề nghiệp là hậu quả của giới tính nên chuỗi giới tính - nghề nghiệp - sốt rét có thể được xem như là cơ chế tác động của giới tính lên nguy cơ mắc bệnh sốt rét. Do đó nghề nghiệp không phải là yếu tố gây nhiễu. Ông ta khuyên nên báo cáo giá trị OR thô (không hiệu chỉnh cho nghề nghiệp). Theo anh chị, nhà nghiên cứu có nên nghe theo lời khuyên của chuyên gia dịch tễ hay không?