Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu - Hoàng Văn Minh

pdf 30 trang hapham 2280
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu - Hoàng Văn Minh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_phuong_phap_chon_mau_va_tinh_toan_co_mau_hoang_van.pdf

Nội dung text: Bài giảng Phương pháp chọn mẫu và tính toán cỡ mẫu - Hoàng Văn Minh

  1. 1/12/2015 PHƯƠNG PHÁP CHỌN MẪU VÀ TÍNH TOÁN CỠ MẪU PGS. TS. Hoàng Văn Minh Đại học Y Hà nội NỘI DUNG 1. Một số khái niệm cơ bản 2. Phương pháp chọn mẫu 3. Phương pháp tính toán cỡ mẫu 1
  2. 1/12/2015 Quần thể và mẫu Bao gồm toàn bộ các cá thể Quần thể mà chúng ta đang quan tâm Mẫu Là 1 phần của quần thể, bao gồm những cá thể mà chúng ta sẽ nghiên cứu Chọn mẫu và ngoại suy Quần thể Chọn mẫu Ngoại suy Mẫu Nghiên cứu 2
  3. 1/12/2015 Ngoại suy Mẫu Quần thể Sai số (Errors) Sai số hệ thống Sai số ngẫu nhiên (Sai chệch) (May rủi) Chọn mẫu Cỡ mẫu Xác định đối tượng nghiên cứu Xác định phương pháp chọn mẫu Tính toán cỡ mẫu Tuyển chọn đối tượng nghiên cứu theo phương pháp chọn mẫu và cỡ mẫu đã được xác định 3
  4. 1/12/2015 Xác định đối tượng nghiên cứu Quẩn thể Đối tượng nghiên nghiên cứu cứu Là đối tượng đích của nghiên cứu Có các đặc tính chúng ta đang quan tâm (được nêu trong mục tiêu nghiên cứu) Xác định đối tượng nghiên cứu Đối tượng Nguồn số nghiên cứu liệu Nguồn số liệu có thể là người cung cấp số liệu, cơ sở dữ liệu, báo cáo, bệnh án chứa các số liệu 4
  5. 1/12/2015 Đối tượng nghiên cứu Tiêu chuẩn lựa chọn Tiêu chuẩn loại trừ (Đã có đủ tiêu chuẩn lựa chọn) o Đặc điểm cá nhân: Phụ o Khó khăn trong việc cung nữ dưới 65 tuổi cấp thông tin: Không có o Đặc điểm lâm sàng: khả năng giao tiếp, Được chẩn đoán mắc không hợp tác tăng huyết áp theo tiêu o Có thể bị mất theo dõi: chuẩn JNC7 Có thể chuyển sang nơi o Đặc điểm địa dư (hành khác sinh sống, nhà xa chính): Sống tại Hà nội, điều trị tại Viện tim mạch o Đặc điểm thời gian: Thời gian điều trị từ 1/1/2014-31/12/2014 Chọn mẫu • Là quy trình chọn cá thể đại diện cho quần thể để tham gia vào nghiên cứu • Điều kiện – Mẫu phải đại diện cho quần thể – Cỡ mẫu đủ lớn 5
  6. 1/12/2015 Chọn mẫu Xác suất Không xác suất Chọn mẫu không xác suất • Khái niệm: Xác suất các cá thể được lựa chọn vào mẫu là không giống nhau • Phương pháp: – Chọn mẫu thuận tiện: Tình nguyện tham gia – Chọn mẫu chỉ tiêu: ½ nam + ½ nữ – Chọn mẫu bóng tuyết: Giới thiệu người tiếp theo tham gia nghiên cứu • Ưu điểm: Đơn giản, nhanh, không tốn kém • Nhược điểm: Gây ra sai chệch lựa chọn • Ứng dụng: Thường chỉ sử dụng trong nghiên cứu thử, nghiên cứu trường hợp hoặc nghiên cứu định tính 6
  7. 1/12/2015 Chọn mẫu xác suất • Khái niệm: Xác suất các cá thể được lựa chọn vào mẫu là không giống nhau • Phương pháp: 1. Chọn mẫu ngẫu nhiên đơn (Simple random sampling) 2. Chọn mẫu ngẫu nhiên hệ thống (Systematic random sampling) 3. Chọn mẫu phân tầng (Stratifed sampling) 4. Chọn mẫu theo cụm (chùm) (Cluster sampling) 5. Chọn mẫu nhiều giai đoạn (Multi-stage sampling) Chọn mẫu ngẫu nhiên đơn Cỡ mẫu Xác suất lựa chọn = Tổng số cá thể của quần thể 7
  8. 1/12/2015 Chän mÉu ngÉu nhiªn ®¬n QuÇn thÓ =N P   p X s MÉu =n Chọn mẫu ngẫu nhiên đơn • Ưu điểm: – Đơn giản, dễ làm – Có tính ngẫu nhiên và đại diện cao. – Dễ phân tích số liệu – Là cơ sở của các kỹ thuật chọn mẫu khác. • Hạn chế: – Tốn kém trong quá trình thu thập số liệu (trong các điều tra cộng đồng) – Cần danh sách cá thể trong quần thể 8
  9. 1/12/2015 Chọn mẫu ngẫu nhiên hệ thống • Xác định khung mẫu và đánh số đơn vị mẫu • Xác định khoảng cách mẫu: k= N/n • Xác định đơn vị mẫu đầu tiên (i) nằm giữa 1 và k bằng PP ngẫu nhiên đơn. • Đơn vị mẫu tiếp theo: Cộng k với đơn vị mẫu đầu tiên, tiếp tục cho đến khi đủ số mẫu: i + 1k; i + 2k; i + 3k Chän mÉu ngÉu nhiªn hÖ thèng k k k k k k i i + k i + 2k i + 3k i + (n-1)k Sè ngÉu nhiªn ®îc chän gi÷a 1 vµ k 9
  10. 1/12/2015 Chọn mẫu ngẫu nhiên hệ thống • Ưu điểm: – Nhanh và dễ áp dụng – Ít tốn kém – Đơn giản trong điều kiện thực địa • Hạn chế: – Đơn vị mẫu không xếp ngẫu nhiên hoặc trùng với k, thiếu đại diện. Chọn mẫu phân tầng • Chia quần thể các tầng(strata). Các cá thể trong mỗi tầng tương đồng về đặc tính nào đó • Chọn mẫu ngẫu nhiên đơn hay chọn mẫu hệ thống ở mỗi tầng • Cỡ mẫu mỗi tầng có thể – Bằng nhau (chọn mẫu phân tầng không tỷ lệ với kích cỡ quần thể) – Không bằng nhau: Tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân tầng tỷ lệ với kích cỡ quần thể ) 10
  11. 1/12/2015 Chän mÉu ph©n tÇng TÊt c¶ bÖnh viÖn B/V lín B/V võa B/V nhá n1 n2 n3 Tầng 1 Tầng 2 N1= 2000 N2 = 6000 n1=400 n2=400 11
  12. 1/12/2015 Tầng 1 Tầng 2 N1= 2000 N2 = 6000 n1=200 n2=600 Chọn mẫu phân tầng • Ưu điểm: – Đảm bảo tính đại diện của mỗi nhóm trong tổng mẫu – Dễ thu thập số liệu • Hạn chế: – Thiếu chính xác khi số lượng đơn vị mẫu ở mỗi tầng quá ít 12
  13. 1/12/2015 Chọn mẫu theo cụm (chùm) • Xác định cụm (Dựa trên nơi sinh sống, đơn vị hành chính). • Lập danh sách cụm • Chọn cụm ngẫu nghiên từ danh sách. • Chọn cá thể: – Lấy tất cả các cá thể (nếu không có danh sách) của các chùm (chùm 1 bậc) – Lập danh sách, chọn cá thể bằng PP ngẫu nhiên đơn hoặc hệ thống (chùm 2 bậc). Chän mÉu chïm n2 n1 n3 13
  14. 1/12/2015 Chọn mẫu theo cụm (chùm) • Ưu điểm – Có thể áp dụng trong điều tra có phạm vi rộng, phân tán, không có được danh sách các đơn vị nghiên cứu. – Khung mẫu đơn giản (danh sách các cụm), dễ lập. – Điều tra dễ & nhanh=> Có hiệu quả kinh tế (kinh phí, thời gian) • Hạn chế: – Tính đại diện thấp (hệ số thiết kế) – Phân tích số liệu phức tạp Chọn mẫu nhiều giai đoạn • Là dạng phức tạp của chọn mẫu cụm (Chọn mẫu cụm là chọn mẫu 2 giai đoạn) • Ví dụ: Chọn tỉnh=> huyện=> xã=>làng 14
  15. 1/12/2015 Phân biệt Chọn mẫu Chọn mẫu tầng cụm Có đại diện của Chỉ 1 số cụm tất cả các tầng được lựa chọn trong mẫu vào mẫu 15
  16. 1/12/2015 hoangvanminh@hmu.edu.vn Cỡ mẫu chính xác 16
  17. 1/12/2015 Cỡ mẫu Kinh phí Cỡ mẫu = Chi phí 1 mẫu Cỡ mẫu 1. Loại biến số được phân tích (định lượng, định tính) 2. Mục tiêu phân tích (xác định tỷ lệ hay kiểm định sự khác biệt ) 3. Mức ý nghĩa thống kê ( =5%, 1%) 4. Độ mạnh (mức độ ngoại suy) (1-=80%,90%) 5. Mức độ sai số giữa các tham số mẫu và tham số quần thể 6. Kết quả từ NC trước đây, NC thử, ước tính, mong muốn 7. Một số yếu tố khác 17
  18. 1/12/2015 Biến số Định lượng Định tính Đường máu Có bệnh-không có bệnh Mục tiêu phân tích Xác định So sánh Xác định tỷ lệ cao huyết So sánh tỷ lệ khỏi bệnh áp ở bệnh nhân ĐTĐ của 2 ph. pháp điều trị 18
  19. 1/12/2015 Kiểm định giả thuyết Giả thuyết Ho: Không có sự khác biệt Giả thuyết Ha: Có sự khác biệt Sai lầm Thực tế H0 đúng H0 sai  Quyết định Chấp nhận H0  Sai lầm II () Loại bỏ H0 Sai lầm I ( )  19
  20. 1/12/2015 Mức ý nghĩa thống kê Loại bỏ sai lầm loại I = 0.05 p = probability= Xác suất để giả thuyết Ho đúng P 95% = Ha xảy ra là chắc chắn = Chấp nhận Ha P>0.05 = ??? Độ mạnh Loại bỏ sai lầm loại II 1-  = 80% Thường dùng trong tính toán cỡ mẫu 20
  21. 1/12/2015 Mức ý nghĩa z (1- /2) thống kê ( ) .01 (99) 2.576 .02 (98) 2.326 .05 (95) 1.960 .10 (90) 1.645 Độ mạnh z (1-) (1-) .80 0.842 .85 1.036 .90 1.282 .95 1.645 Sai số (mức chính xác) Mức sai số giữa kết quả tính toán từ mẫu so với kết quả thực của quần thể • Tuyệt đối (hiệu số): hoặc d • Tương đối (thương số): 21
  22. 1/12/2015 Cỡ mẫu xác định 1 tỷ lệ Xác định tỷ lệ mắc bệnh X trong số người đến khám sức khỏe. Biết rằng 1 NC trước đây báo cáo tỷ lệ 10%. Mức ý nghĩa thống kê =5% 22
  23. 1/12/2015 Cỡ mẫu xác định 1 tỷ lệ n: Cỡ mẫu tối thiểu z (1- /2)= 1,96 P: Tỷ lệ mong đợi : Độ chính xác tương đối Cỡ mẫu so sánh 2 tỷ lệ Một phương pháp điều trị hiện tại cho tỉ lệ đáp ứng là 30%. Giả thuyết rằng phương pháp điều trị mới sẽ có tỉ lệ đáp ứng là 40%. Xác định cỡ mẫu cho nghiên cứu này nếu mức ý nghĩa thống kê là 95% và độ mạnh là 80% 23
  24. 1/12/2015 Cỡ mẫu so sánh 2 tỷ lệ n: cỡ mẫu tối thiểu P1: Tỷ lệ đáp ứng với phương pháp cũ P2: Tỷ lệ đáp ứng với phương pháp mới P: =(P1+P2)/2 z (1- /2)= 1,96 z (1-)= 0,842 Cỡ mẫu so sánh 2 số trung bình Xác định cỡ mẫu cho nghiên cứu đánh giá tác dụng giảm huyết áp của 2 loại thuốc. Giả sử sự khác biệt ước đoán là 10mmHg, độ lệch chuẩn là 10mmHg. Chọn mức ý nghĩa thống kê là 95% và độ mạnh là 80% 24
  25. 1/12/2015 Cỡ mẫu so sánh 2 số trung bình Độ lệnh chuẩn σ =10 0- a =10 z (1- /2)= 1,96 z (1-)= 0,842 Một số yếu tố khác Khống chế tỷ lệ không trả lời Khống chế tỷ lệ mất đối tượng Hệ số thiết kế khi chọn mẫu cụm Các phân tích nâng cao 25
  26. 1/12/2015 Cỡ mẫu khác nhau giữa 2 nhóm • N’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh • k: tỷ số giữa 2 nhóm (thường KHÔNG QUÁ 2) Cỡ mẫu khác nhau giữa 2 nhóm • N’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh=1200 • k: tỷ số giữa 2 nhóm=2 26
  27. 1/12/2015 Cỡ mẫu khống chế không trả lời • N’’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh • q: tỷ số không trả lời Cỡ mẫu khống chế không trả lời • N’’: Cỡ mẫu điều chỉnh • N: Cỡ mẫu chưa điều chỉnh=52 • q: tỷ số không trả lời=10% 27
  28. 1/12/2015 Cỡ mẫu nghiên cứu tính giá trị Thực tế (Chuẩn vàng) Có bệnh Không bệnh Test Dương tính a b (Dương tính thật) (Dương tính giả) Âm tính c d (Âm tính giả) (Âm tính thật) Độ nhạy= a/(a+c) Độ đặc hiệu = d/(b+d) 28
  29. 1/12/2015 Cỡ mẫu nghiên cứu tính độ nhạy N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SN: Độ nhạy mong đợi Z: 1,96 ( =5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh Cỡ mẫu nghiên cứu tính độ nhạy N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SN: Độ nhạy mong đợi=95% Z: 1,96 ( =5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh 29
  30. 1/12/2015 Cỡ mẫu nghiên cứu tính giá trị N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SP: Độ đặc hiệu mong đợi Z: 1,96 ( =5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh Cỡ mẫu nghiên cứu tính độ đặc hiệu N: Cỡ mẫu TP: Số dương tính thật FN: Số âm tính giả SP: Độ đặc hiệu mong đợi=80% Z: 1,96 ( =5%) W: Sai số (5%) P: Tỷ lệ mắc bệnh 30