Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 10: Kiểm định phi tham số- Nguyễn Việt Dũng

pdf 17 trang hapham 1690
Bạn đang xem tài liệu "Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 10: Kiểm định phi tham số- Nguyễn Việt Dũng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_ung_dung_trong_kinh_doanh_chuong_10_kiem.pdf

Nội dung text: Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 10: Kiểm định phi tham số- Nguyễn Việt Dũng

  1. CHƯƠNG 10 KIỂM ĐỊNH PHI THAM SỐ Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn
  2. CÁC NỘI DUNG CHÍNH 10.1 KĐ dấu và hạng Wilcoxon về trung vị của một tổng thể 10.2 KĐ dấu và hạng Wilcoxon trên 2 tổng thể, trường hợp lấy mẫu cặp 10.3 KĐ tổng hạng Wilcoxon trên 2 tổng thể, trường hợp lấy mẫu độc lập 10.4 KĐ Kruskal - Wallis 10.5 KĐ Chi bình phương về mối liên hệ giữa hai biến định tính 10.6 KĐ Chi bình phương trên một mẫu © Nguyễn Tiến Dũng Thống kê ứng dụng 2
  3. 10.1 KĐ dấu và hạng Wilcoxon về trung vị của tổng thể Gọi trung vị tổng thể là M, giá trị cần so sánh HMM00: là M0. HMM: ● B1: Lập giả thuyết 10 ● B2: Lựa chọn mức ý nghĩa α ● B3: Tính các chênh lệch di: 푖 = 푖 − 0 ● B4: Loại bỏ các di = 0, tính giá trị tuyệt đối của các chênh lệch |di| và xếp hạng các |di| ● |di| nhỏ nhất cĩ hạng là 1. ● Nếu cĩ hạng ngang nhau thì tính hạng TB. ● Cỡ mẫu rút gọn n’ = n – số trường hợp cĩ di bằng 0 ● B5: Tách các hạng vừa xếp thành 2 cột. ● Nếu di > 0 thì đặt vào cột R+. ● Nếu di < 0 thì đặt vào cột R- © Nguyễn Tiến Dũng Thống kê ứng dụng 3
  4. Quan điểm 1: SGK ● B6: Tính chỉ tiêu KĐ ● Nếu n’ ≤ 20, chỉ tiêu KĐ là W ● KĐ 2 bên: W = min(ΣR+; ΣR-) ● KĐ bên phải: W = ΣR+ W  ● KĐ bên trái: W =ΣR- z W  ● Nếu n’ > 20, chỉ tiêu KĐ là z W nn'.( ' 1)  ● B7: Bác bỏ H0 W 4 ● Nếu n’ ≤ 20: W 20: 24 ● KĐ 1 bên: z < -zα ● KĐ 2 bên: z < -zα/2 © Nguyễn Tiến Dũng Thống kê ứng dụng 4
  5. W  Quan điểm 2 (khuyên dùng) z W  W nn'.( ' 1) ● B6: Tính chỉ tiêu KĐ,  W 4 + ● Nếu n’ ≤ 20, chỉ tiêu KĐ là W = ΣR . n'.( n ' 1).(2 n ' 1)  2 ● Nếu n’ > 20, chỉ tiêu KĐ là z. W 24 ● B7: Bác bỏ H0 ● Nếu n’ ≤ 20, tra bảng tìm WL (cận dưới) và WU (cận trên) ● Nếu KĐ 2 bên: Bác bỏ H0 nếu W WU ● Nếu KĐ bên trái: Bác bỏ H0 nếu W WU ● Nếu n’ > 20, bác bỏ H0 ● KĐ bên trái: z zα ● KĐ 2 bên: z zα/2 © Nguyễn Tiến Dũng Thống kê ứng dụng 5
  6. Wilcoxon Signed-Rank Test Table © Nguyễn Tiến Dũng Thống kê ứng dụng 6
  7. 10.2 KĐ tổng hạng Wilcoxon về TB của 2 mẫu độc lập ● B1: Chọn mẫu làm Mẫu 1 (n1 <n2) và lập cặp giả thuyết TK. Nếu 2 mẫu cĩ cỡ mẫu bằng nhau, thì coi mẫu nào là Mẫu 1 cũng được. Gọi M1, M2 là trung vị của tổng thể thứ nhất và thứ hai HMM0: 1 2 HMM0: 1 2 HMM0: 1 2 HMM: HMM: 1 1 2 HMM1: 1 2 1 1 2 ● B2: Gộp chung 2 mẫu thành 1 danh sách chung và sắp xếp từ nhỏ tới lớn. Xác định hạng của các quan sát theo nguyên tắc là QS cĩ giá trị nhỏ nhất sẽ cĩ hạng là 1, giá trị càng lớn thì hạng càng lớn. Nếu cĩ 2 quan sát cĩ giá trị bằng nhau, thì lấy hạng TB. © Nguyễn Tiến Dũng Thống kê ứng dụng 7
  8. ● B3: Xác định chỉ tiêu KĐ nn( 1) ● Nếu cỡ mẫu nhỏ (n ≤ 10 và n ≤ 10) thì chỉ tiêu  1 1 2 T 1 2 KĐ là T1. ● T1 là tổng hạng của Mẫu 1. n12 n( n 1) ● n = n1+ n2.  T 1 12 ● Nếu cỡ mẫu lớn (n1 > 10 hoặc n2 > 10) thì chỉ tiêu KĐ là z T  z 1 T1 ● B4: Bác bỏ H0  T1 ● Nếu cỡ mẫu nhỏ: ● KĐ 2 bên: T1 > WU hoặc T1 WU ● Nếu cỡ mẫu lớn: KĐ bên trái: z zα; KĐ hai bên: z zα/2 © Nguyễn Tiến Dũng Thống kê ứng dụng 8
  9. 10.3 KĐ dấu và hạng Wilcoxon với 2 mẫu cặp ● B1: Xác định các chênh lệch di = x1i – x2i và lập cặp giả thuyết KĐ HMM0: 1 2 HMM0: 1 2 HMM0: 1 2 HMM: HMM: 1 1 2 HMM1: 1 2 1 1 2 HM0 :0D HM0 :0D HM0 :0D HM:0 HM:0 1 D HM1 :0D 1 D © Nguyễn Tiến Dũng Thống kê ứng dụng 9
  10. ● B2: Xác định các giá trị tuyệt đối |di| ● B3: Loại bỏ các |di| bằng 0, sắp hạng các |di| từ nhỏ tới lớn. Giá trị |di| nhỏ nhất cĩ hạng là 1. Nếu cĩ nhiều |di| bằng nhau, thì tính hạng trung bình. ● n’ = n – số trường hợp cĩ di = 0 ● B4: Tách riêng các hạng của |di| thành 2 loại, hạng R+ và hạng R- theo dấu của di gốc. Nếu di> 0, xếp vào cột R+. Nếu di < 0, xếp vào cột R-. ● B5: Tính giá trị KĐ W = Ri+ ● B6: Áp dụng quy tắc bác bỏ H0 ● Nếu n’ ≤ 20 ● KĐ bên trái: W < WL ● KĐ hai bên: W ≤ WL hoặc W ≥ WU ● KĐ bên phải: W ≥ WU © Nguyễn Tiến Dũng Thống kê ứng dụng 10
  11. ● Nếu n’ > 20 thì W xấp xỉ PP bình thường. Khi đĩ sẽ biến đổi chuẩn hố W và kiểm định theo chỉ tiêu z. ● Quy tắc bác bỏ H0 tương tự như bài tốn KĐ TB của một tổng thể, trường hợp biết  nn'( ' 1)  W 4 n'( n ' 1)(2 n ' 1)  W 24 W  z W  W © Nguyễn Tiến Dũng Thống kê ứng dụng 11
  12. 10.4 KĐ Kruskal – Wallis trên nhiều mẫu độc lập ● Mục đích: so sánh TB của k mẫu độc lập (k >2) 12 k R 2 ● Gọi n = n1 + n2 + + nk W  i 3(n 1) n( n 1) i 1 ni ● H0: M1 = M2 = = Mk Bác bỏ H0 nếu ● Chỉ tiêu KĐ W 2 W> k 1; ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 12
  13. 10.5 KĐ Chi bình phương về mối liên hệ giữa 2 biến định tính ● Biến 1: Biến hàng ● Biến 2: Biến cột ● Lập bảng tần số kết hợp 2 biến ● Tại ơ mà cĩ hàng i cột j -> tính tần số thực Oij ● Tính các tổng theo hàng Ri và tổng theo cột Cj ● Tính ra các tần số kỳ vọng Eij = Ri x Cj / n 2 ● Tính (Oij – Eij) /Eij -> tổng lại là Chi-square ● Bác bỏ H0 theo chỉ tiêu đánh giá Chi-square © Nguyễn Tiến Dũng Thống kê ứng dụng 13
  14. Ngắn TB Dài Tổng hàng H.phúc O11=38 O12 = 58 O13 = 54 R1 = 150 E11 = 45 E12 = 60 E13 = 45 Khơng HP O21 = 12 O22 = 14 O23 = 4 R2 = 30 E21 = 9 E22 = 12 E23 = 9 Ly dị / Ly thân O31 = 10 O32 = 8 O33 = 2 R3 = 20 E31 = 6 E32 = 8 E33 = 6 C1 = 60 C2 = 80 C3 = 60 n = 200 RC rc 2 ij 2 ()OEij ij Eij  n  ij 11 Eij 22 Bác bỏ H0 nếu  df ; df ( r 1).( c 1) © Nguyễn Tiến Dũng Thống kê ứng dụng 14
  15. 2 2 ij Oij Eij Oij-Eij (Oij-Eij) (Oij-Eij) /Ei 11 38 45 -7 49 1,0889 12 58 60 -2 4 0,0667 13 54 45 9 81 1,8000 21 12 9 3 9 1,0000 22 14 12 2 4 0,3333 23 4 9 -5 25 2,7778 31 10 6 -4 16 2,6667 32 8 8 0 0 - 33 2 6 -4 16 2,6667 Tổng 200 12,4000 Chi-square tính = 12,4 Chi-square tra bảng (df = 2 x 2 = 4; alpha = 0,05) = 9,4877 Bác bỏ Ho © Nguyễn Tiến Dũng Thống kê ứng dụng 15
  16. 10.6 KĐ Chi bình phương về sự phù hợp ● Goodness-of-fit Test ● Mục đích: Kiểm tra sự phân phối tần số cĩ phù hợp với một tần số lý thuyết hay khơng ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 k 2 2 ()OEii  Stat  i 1 Ei 22 Bác bỏ H0 nếu Stat df ; df k 1 © Nguyễn Tiến Dũng Thống kê ứng dụng 16
  17. 2 2 i Thứ Oi Ei Oi-Ei (Oi-Ei) (Oi-Ei) /Ei 1 Hai 7 5,333 1,667 2,7889 0,5211 2 Ba 3 5,333 -2,333 5,4289 1,0206 3 Tư 3 5,333 -2,333 5,4289 1,0206 4 Năm 2 5,333 -3,333 11,0889 2,0830 5 Sáu 5 5,333 -0,333 0,1089 0,0208 6 Bảy 12 5,333 6,667 44,4889 8,3347 Tổng 32 13,0008 © Nguyễn Tiến Dũng Thống kê ứng dụng 17