Giáo trình Xác suất và thống kê - Chương 7: Kiểm định giả thuyết thống kê

pdf 47 trang hapham 2160
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Xác suất và thống kê - Chương 7: Kiểm định giả thuyết thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_xac_suat_va_thong_ke_chuong_7_kiem_dinh_gia_thuye.pdf

Nội dung text: Giáo trình Xác suất và thống kê - Chương 7: Kiểm định giả thuyết thống kê

  1.  Chương 7. Kiểm định Giả thuyết Thống kê §1. Khái niệm về kiểm định giả thuyết thống kê §2. Kiểm định so sánh đặc trưng với một số §3. Kiểm định so sánh hai đặc trưng §1. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 1.1. Khái niệm chung • Mơ hình tổng quát của bài tốn kiểm định là: ta nêu lên hai mệnh đề trái ngược nhau, một mệnh đề được gọi là giả thuyết H và mệnh đề cịn lại được gọi là nghịch thuyết (hay đối thuyết) H . • Giải quyết một bài tốn kiểm định là: bằng cách dựa vào quan sát mẫu, ta nêu lên một quy tắc hành động, ta chấp nhận giả thuyết H hay bác bỏ giả thuyết .
  2.  Chương 7. Kiểm định Giả thuyết Thống kê • Khi ta chấp nhận giả thuyết H , nghĩa là ta tin rằng đúng; khi bác bỏ , nghĩa là ta tin rằng sai. Do chỉ dựa trên một mẫu quan sát ngẫu nhiên, nên ta khơng thể khẳng định chắc chắn điều gì cho tổng thể. • Trong chương này, ta chỉ xét loại kiểm định tham số (so sánh đặc trưng với 1 số, so sánh hai đặc trưng của hai tổng thể). 1.2. Các loại sai lầm trong kiểm định Khi thực hiện kiểm định giả thuyết, ta dựa vào quan sát ngẫu nhiên một số trường hợp rồi suy rộng ra cho tổng thể. Sự suy rộng này cĩ khi đúng, cĩ khi sai. Thống kê học phân biệt 2 loại sai lầm sau:
  3.  Chương 7. Kiểm định Giả thuyết Thống kê a) Sai lầm loại I • Sai lầm loại 1 là loại sai lầm mà ta phạm phải trong việc bác bỏ giả thuyết H khi H đúng. • Xác suất của việc bác bỏ H khi H đúng là xác suất của sai lầm loại 1 và được ký hiệu là . b) Sai lầm loại II • Sai lầm loại 2 là loại sai lầm mà ta phạm phải trong việc chấp nhận giả thuyết H khi H sai. • Xác suất của việc chấp nhận giả thuyết H khi H sai là xác suất của sai lầm loại 2 và được ký hiệu là .
  4.  Chương 7. Kiểm định Giả thuyết Thống kê c) Mối liên hệ giữa hai loại sai lầm • Khi thực hiện kiểm định, ta luơn muốn xác suất phạm phải sai lầm càng ít càng tốt. Tuy nhiên, nếu hạ thấp thì sẽ tăng lên và ngược lại. Trong thực tế, giữa hai loại sai lầm này, loại nào tác hại hơn thì ta nên tránh. • Trong thống kê, người ta quy ước rằng sai lầm loại 1 tác hại hơn loại 2 nên cần tránh hơn. Do đĩ, ta chỉ xét các phép kiểm định cĩ khơng vượt quá một giá trị ấn định trước, thơng thường là 1%; 3%; 5%; Giá trị cịn được gọi là mức ý nghĩa của kiểm định.
  5.  Chương 7. Kiểm định Giả thuyết Thống kê 1.3. Cơ sở lý thuyết của kiểm định • Để giải quyết bài tốn kiểm định, ta quan sát mẫu ngẫu nhiên XX1, , n và đưa ra giả thuyết H . • Từ mẫu trên, ta chọn thống kê T f( X10 , , Xn ; ) sao cho nếu khi H đúng thì phân phối xác suất của T hồn tồn xác định. • Với mức ý nghĩa , ta tìm được khoảng tin cậy (hay khoảng ước lượng) [;]ab cho T ở độ tin cậy 1 . Khi đĩ: . nếu t[;] a b thì ta chấp nhận giả thuyết H ; . nếu t[;] a b thì ta bác bỏ giả thuyết .
  6.  Chương 7. Kiểm định Giả thuyết Thống kê • Nếu hàm mật độ của T đối xứng qua trục Oy thì ta chọn khoảng đối xứng [;]tt, với: P()() T t P T t . 2 Vậy, khi xét nửa bên phải của trục Oy thì ta được: . nếu tt thì ta chấp nhận giả thuyết H ; . nếu tt thì ta bác bỏ giả thuyết . • Nếu hàm mật độ của T khơng đối xứng qua trục Oy thì ta chọn khoảng tin cậy [0;C ], với PTC(). . Nếu tC thì ta chấp nhận giả thuyết H , và . nếu tC thì ta bác bỏ giả thuyết .
  7.  Chương 7. Kiểm định Giả thuyết Thống kê §2. KIỂM ĐỊNH SO SÁNH ĐẶC TRƯNG CỦA TỔNG THỂ VỚI MỘT SỐ 2.1. Kiểm định so sánh trung bình với một số Với số μ0 cho trước, ta đặt giả thuyết H : 0. a) Trường hợp 1. Với n 30, 2 đã biết. 1 • Từ mức ý nghĩa ()ttB . 2 x • Tính giá trị thống kê tn0 . • Nếu tt thì ta chấp nhận H , nghĩa là 0; nếu tt thì ta bác bỏ H , nghĩa là 0.
  8.  Chương 7. Kiểm định Giả thuyết Thống kê b) Trường hợp 2. Với n 30, 2 chưa biết. Ta làm như trường hợp 1 nhưng thay bằng s . c) Trường hợp 3. Với n 30, 2 đã biết và X cĩ phân phối chuẩn, ta làm như trường hợp 1. d) Trường hợp 4. Với n 30, 2 chưa biết và X cĩ phân phối chuẩn. • Từ cỡ mẫu n và mức ý nghĩa tra bảng C tn 1. x • Tính giá trị thống kê tn0 . s • Nếu ttn 1 thì ta chấp nhận giả thuyết H ; ttn 1 thì ta bác bỏ giả thuyết H .
  9.  Chương 7. Kiểm định Giả thuyết Thống kê Chú ý Trong tất cả các trường hợp bác bỏ, ta so sánh x và 0: . Nếu x 0 thì ta kết luận 0. . Nếu x 0 thì ta kết luận 0.
  10.  Chương 7. Kiểm định Giả thuyết Thống kê VD 1. Sở Điện lực A báo cáo rằng: trung bình một hộ hàng tháng phải trả 250 ngàn đồng tiền điện, với độ lệch chuẩn là 20 ngàn. Người ta khảo sát ngẫu nhiên 500 hộ thì tính được trung bình hàng tháng một hộ trả 252 ngàn đồng tiền điện. Trong kiểm định giả thuyết H : “trung bình một hộ phải trả hàng tháng là 250 ngàn đồng tiền điện” với mức ý nghĩa 1%, hãy cho biết giá trị thống kê t và kết luận ?
  11.  Chương 7. Kiểm định Giả thuyết Thống kê
  12.  Chương 7. Kiểm định Giả thuyết Thống kê VD 2. Nhà Giáo dục học B muốn nghiên cứu xem số giờ tự học trung bình hàng ngày của sinh viên cĩ thay đổi khơng so với mức 1 giờ/ngày cách đây 10 năm. Ơng B khảo sát ngẫu nhiên 120 sinh viên và tính được trung bình là 0,82 giờ/ngày với sˆ 0,75 giờ/ngày. Với mức ý nghĩa 3%, hãy cho biết kết luận của ơng B ?
  13.  Chương 7. Kiểm định Giả thuyết Thống kê
  14.  Chương 7. Kiểm định Giả thuyết Thống kê VD 3. Trong một nhà máy gạo, trọng lượng đĩng bao theo quy định của một bao gạo là 50 kg và độ lệch chuẩn là 0,3 kg. Cân thử 296 bao gạo của nhà máy này thì thấy trọng lượng trung bình là 49,97 kg. Kiểm định giả thuyết H : “trọng lượng mỗi bao gạo của nhà máy này là 50 kg” cĩ giá trị thống kê t và kết luận là: A. t 1,7205; chấp nhận với mức ý nghĩa 6%. B. ; bác bỏ , trọng lượng thực tế của bao gạo nhỏ hơn 50 kg với mức ý nghĩa 6%. C. t 1,9732; chấp nhận với mức ý nghĩa 4%. D. ; bác bỏ , trọng lượng thực tế của bao gạo nhỏ hơn 50 kg với mức ý nghĩa 4%. Đáp án đúng: A.
  15.  Chương 7. Kiểm định Giả thuyết Thống kê VD 4. Một cơng ty cho biết mức lương trung bình của một kỹ sư ở cơng ty là 5,7 triệu đồng/tháng với độ lệch chuẩn 0,5 triệu đồng/tháng. Kỹ sư A dự định xin vào làm ở cơng ty này và đã thăm dị 18 kỹ sư thì thấy lương trung bình là 5,45 triệu đồng/tháng. Kỹ sư quyết định rằng: nếu mức lương trung bình bằng với mức cơng ty đưa ra thì nộp đơn xin làm. Với mức ý nghĩa 2%, cho biết kết luận của kỹ sư ?
  16.  Chương 7. Kiểm định Giả thuyết Thống kê
  17.  Chương 7. Kiểm định Giả thuyết Thống kê VD 5. Người ta kiểm tra ngẫu nhiên 38 cửa hàng của cơng ty A và cĩ bảng doanh thu trong 1 tháng là: X (triệu đồng/tháng) 200 220 240 260 Số cửa hàng 8 16 12 2 Kiểm định giả thuyết H : “doanh thu trung bình hàng tháng của một cửa hàng cơng ty là 230 triệu đồng”, mức ý nghĩa tối đa để giả thuyết được chấp nhận là: A. 3,4%; B. 4,2%; C. 5,6%; D. 7,8%.
  18.  Chương 7. Kiểm định Giả thuyết Thống kê
  19.  Chương 7. Kiểm định Giả thuyết Thống kê VD 6. Điểm trung bình mơn Tốn của sinh viên năm trước là 5,72. Năm nay, theo dõi 100 SV được số liệu: Điểm 3 4 5 6 7 8 9 Số sinh viên 3 5 27 43 12 6 4 Kiểm định giả thuyết H : “điểm trung bình mơn Tốn của sinh viên năm nay bằng năm trước”, mức ý nghĩa tối đa để H được chấp nhận là: A. 13,94%; B. 13,62%; C. 11,74%; D. 11,86%. Hướng dẫn x 5,9 và s 1,2102. Đáp án đúng là B .
  20.  Chương 7. Kiểm định Giả thuyết Thống kê VD 7. Thời gian X (phút) giữa hai chuyến xe bus trong một thành phố là biến ngẫu nhiên cĩ phân phối chuẩn. Cơng ty xe bus nĩi rằng: trung bình cứ 5 phút lại cĩ 1 chuyến xe bus. Người ta chọn ngẫu nhiên 8 thời điểm và ghi lại thời gian (phút) giữa hai chuyến xe bus là: 5,3; 4,5; 4,8; 5,1; 4,3; 4,8; 4,9; 4,7. Với mức ý nghĩa 5%, hãy kiểm định lời nĩi trên ?
  21.  Chương 7. Kiểm định Giả thuyết Thống kê
  22.  Chương 7. Kiểm định Giả thuyết Thống kê VD 8. Chiều cao cây giống X (m) trong một vườm ươm là biến ngẫu nhiên cĩ phân phối chuẩn. Người ta đo ngẫu nhiên 25 cây giống này và cĩ bảng số liệu: X (m) 0,8 0,9 1,0 1,1 1,2 1,3 Số cây 1 2 9 7 4 2 Theo quy định của vườn ươm, khi nào cây cao hơn 1 m thì đem ra trồng. Với mức ý nghĩa 5%, kiểm định giả thuyết H : “cây giống của vườn ươm cao 1 m” cĩ giá trị thống kê và kết luận là: A. t 2,7984, khơng nên đem cây ra trồng. B. , nên đem cây ra trồng. C. t 1,9984, khơng nên đem cây ra trồng. D. , nên đem cây ra trồng.
  23.  Chương 7. Kiểm định Giả thuyết Thống kê
  24.  Chương 7. Kiểm định Giả thuyết Thống kê 2.2. Kiểm định so sánh tỉ lệ với một số • Với số p0 cho trước, ta đặt giả thuyết H: p p0. 1 • Từ mức ý nghĩa ()ttB . 2 m • Từ mẫu cụ thể, ta tính tỉ lệ mẫu f và n f p0 giá trị thống kê tn, qp001 . p00q . Nếu tt thì chấp nhận H , nghĩa là pp0. . Nếu tt thì bác bỏ H , nghĩa là pp0. Khi đĩ: f p00 p p ; f p00 p p .
  25.  Chương 7. Kiểm định Giả thuyết Thống kê VD 9. Một báo cáo cho biết cĩ 58% người tiêu dùng Việt Nam quan tâm đến hàng Việt. Khảo sát ngẫu nhiên 1.000 người dân Việt Nam thấy cĩ 536 người được hỏi là cĩ quan tâm đến hàng Việt. Với mức ý nghĩa 5%, hãy kiểm định lại báo cáo trên ?
  26.  Chương 7. Kiểm định Giả thuyết Thống kê
  27.  Chương 7. Kiểm định Giả thuyết Thống kê VD 10. Khảo sát ngẫu nhiên 400 sinh viên về mức độ nghiêm túc trong giờ học thì thấy 13 sinh viên thừa nhận cĩ ngủ trong giờ học. Trong kiểm định giả thuyết H : “cĩ 2% sinh viên ngủ trong giờ học”, mức ý nghĩa tối đa là bao nhiêu để được chấp nhận ?
  28.  Chương 7. Kiểm định Giả thuyết Thống kê
  29.  Chương 7. Kiểm định Giả thuyết Thống kê VD 11. Để kiểm tra một loại súng thể thao, người ta cho bắn 1.000 viên đạn vào 1 tấm bia thấy cĩ 670 viên trúng mục tiêu. Sau đĩ, người ta cải tiến kỹ thuật và kiểm tra lại thì thấy tỉ lệ trúng của súng lúc này là 70%. Trong kiểm định giả thuyết H : “tỉ lệ bắn trúng của súng thể thao này là 70%”, với mức ý nghĩa 3% cĩ giá trị thống kê t và kết luận là: A. t 2,0702 và cải tiến kỹ thuật là tốt. B. và cải tiến kỹ thuật là chưa tốt. C. t 2,0176 và cải tiến kỹ thuật là tốt. D. t 2,0176 và cải tiến kỹ thuật là chưa tốt. Đáp án đúng là B.
  30.  Chương 7. Kiểm định Giả thuyết Thống kê VD 12. Cơng ty A tuyên bố rằng cĩ 40% người tiêu dùng ưa thích sản phẩm của mình. Một cuộc điều tra 400 người tiêu dùng thấy cĩ 179 người ưa thích sản phẩm của cơng ty A. Trong kiểm định giả thuyết H : “cĩ 40% người tiêu dùng thích sản phẩm của cơng ty A”, mức ý nghĩa tối đa để được chấp nhận là: A. 7,86%; B. 6,48%; C. 5,24%; D. 4,32%. Đáp án đúng là C.
  31.  Chương 7. Kiểm định Giả thuyết Thống kê §3. KIỂM ĐỊNH SO SÁNH HAI ĐẶC TRƯNG CỦA HAI TỔNG THỂ 3.1. So sánh hai trung bình của hai tổng thể X, Y Ta cĩ 4 trường hợp và việc chấp nhận hay bác bỏ H ta đều làm như kiểm định so sánh trung bình với 1 số (cả 4 trường hợp ta đều đặt giả thuyết H : xy). 22 a) Trường hợp 1. nnxy, 30 và xy, đã biết. xy Ta tính thống kê t và so sánh với t . 2 2 x y nnxy
  32.  Chương 7. Kiểm định Giả thuyết Thống kê 22 b) Trường hợp 2. nnxy, 30 và xy, chưa biết. 22 22 Ta thay xy, bằng ssxy, trong trường hợp 1. 22 c) Trường hợp 3. nnxy, 30 và xy, đã biết đồng thời X , Y cĩ phân phối chuẩn. Ta làm như trường hợp 1.
  33.  Chương 7. Kiểm định Giả thuyết Thống kê 22 d) Trường hợp 4. nnxy, 30 và xy, chưa biết đồng thời X , Y cĩ phân phối chuẩn. • Tính phương sai chung của 2 mẫu: (n 1) s22 ( n 1) s s2 x x y y . nnxy2 xy • Tính giá trị thống kê t . 11 s. nnxy nn2 • Từ tra bảng C t xy và so sánh với t .
  34.  Chương 7. Kiểm định Giả thuyết Thống kê VD 1. Người ta tiến hành bĩn hai loại phân X , Y cho cây cà chua. Với 60 cây được bĩn phân X thì thu được trung bình 32,2 quả và độ lệch chuẩn 8,5 quả; 72 cây được bĩn phân thu được trung bình 28,4 quả và độ lệch chuẩn 9,3 quả. Với mức ý nghĩa 5%, hãy cho biết kết luận về hai loại phân bĩn trên ? Giải Ta cĩ: nx 60, x 32,2, sx 8,5; ny 72, x 28,4, sy 9,3. Bài tốn thuộc trường hợp thứ 2. Đặt giả thuyết H : xy (quả).
  35.  Chương 7. Kiểm định Giả thuyết Thống kê Giá trị thống kê: xy 32,2 28,4 t 2,4501. 2 s2(8,5) 2 (9,3) 2 sx y 60 72 nnxy Do tt 1,96, xy nên ta bác bỏ H và kết luận là khi bĩn phân X thì cây cà chua cho trái nhiều hơn.
  36.  Chương 7. Kiểm định Giả thuyết Thống kê VD 2. Để so sánh mức lương trung bình của nhân viên nữ X (USD/giờ) và nam Y (USD/giờ) ở một cơng ty đa quốc gia, người ta tiến hành khảo sát ngẫu nhiên 100 nữ và 75 nam thì cĩ kết quả: x 7,23, sx 1,64 và y 8,06, sy 1,85. Với mức ý nghĩa 3%, kiểm định giả thuyết H : “mức lương trung bình của nữ và nam ở cơng ty này là như nhau” cĩ giá trị thống kê và kết luận là: A. t 4,0957, mức lương của nữ và nam như nhau. B. t 4,0957, mức lương của nữ thấp hơn nam. C. t 3,0819, mức lương của nữ và nam như nhau. D. t 3,0819, mức lương của nữ thấp hơn nam. Đáp án đúng là D.
  37.  Chương 7. Kiểm định Giả thuyết Thống kê VD 3. Tuổi thọ (năm) của pin là biến ngẫu nhiên cĩ phân phối chuẩn. Một cơng ty sản xuất thử nghiệm 10 chiếc pin loại X và 12 chiếc pin loại Y thì cĩ kết quả: x 4,8, sx 1,1 và y 4,3, sy 0,3. Với mức ý nghĩa 1%, ta cĩ thể kết luận tuổi thọ của loại pin cao hơn loại pin Y được khơng ?
  38.  Chương 7. Kiểm định Giả thuyết Thống kê
  39.  Chương 7. Kiểm định Giả thuyết Thống kê VD 4. Tuổi thọ (tháng) của thiết bị là biến ngẫu nhiên cĩ phân phối chuẩn. Người ta kiểm tra ngẫu nhiên tuổi thọ của 15 thiết bị loại A, cĩ kết quả: 114; 78; 96; 137; 78; 103; 126; 86; 99; 114; 72; 104; 73; 86; 117. Kiểm tra tuổi thọ của 17 thiết bị loại B thấy cĩ trung bình là 84 tháng và độ lệch chuẩn là 19 tháng. Kiểm định giả thuyết H : “tuổi thọ của thiết bị loại A và B là như nhau với mức ý nghĩa 3%” cĩ giá trị thống kê và kết luận là: A. t 2,1616; tuổi thọ của hai loại thiết bị là như nhau. B. ; tuổi thọ của loại thiết bị lớn hơn. C. t 2,4616; tuổi thọ của hai loại thiết bị là như nhau. D. t 2,4616; tuổi thọ của loại thiết bị lớn hơn.
  40.  Chương 7. Kiểm định Giả thuyết Thống kê 3.2. So sánh hai tỉ lệ của hai tổng thể X, Y Ta thực hiện các bước sau: • Đặt giả thuyết H:. pxy p m mm mx y xy • Từ 2 mẫu ta tính fx , fy , p0 . nx ny nnxy ffxy • Tính giá trị thống kê t . 11 pq00 nnxy
  41.  Chương 7. Kiểm định Giả thuyết Thống kê • Kết luận: . Nếu tt thì ta chấp nhận H ppxy. . Nếu tt và ffxy thì ta bác bỏ H ppxy. . Nếu tt và ffxy thì ta bác bỏ H ppxy.
  42.  Chương 7. Kiểm định Giả thuyết Thống kê VD 5. Từ hai tổng thể X và Y người ta tiến hành kiểm tra 2 mẫu cĩ kích thước nx 1000, ny 1200 về một tính chất A thì được fx 0,27 và fy 0,3. Với mức ý nghĩa 9%, hãy so sánh hai tỉ lệ ppxy, của hai tổng thể ?
  43.  Chương 7. Kiểm định Giả thuyết Thống kê
  44.  Chương 7. Kiểm định Giả thuyết Thống kê VD 6. Kiểm tra 120 sản phẩm ở kho I thấy cĩ 6 phế phẩm; 200 sản phẩm ở kho II thấy cĩ 24 phế phẩm. Hỏi chất lượng hàng ở hai kho cĩ khác nhau khơng với: 1) mức ý nghĩa 5%; 2) mức ý nghĩa 1%.
  45.  Chương 7. Kiểm định Giả thuyết Thống kê
  46.  Chương 7. Kiểm định Giả thuyết Thống kê VD 7. Một cơng ty điện tử tiến hành điều tra thị trường về sở thích xem tivi của cư dân trong 1 thành phố. Điều tra ngẫu nhiên 400 người ở quận X thì thấy cĩ 270 người xem tivi ít nhất 1 giờ trong 1 ngày; 600 người ở quận Y cĩ 450 người xem tivi ít nhất 1 giờ trong 1 ngày. Trong kiểm định giả thuyết H : “tỉ lệ cư dân xem tivi ít nhất 1 giờ trong 1 ngày ở quận X và Y như nhau”, mức ý nghĩa tối đa để được chấp nhận là: A. 0,96%; B. 2,84%; C. 4,06%; D. 6,14%. Đáp án đúng: A.
  47.  Chương 7. Kiểm định Giả thuyết Thống kê VD 8. Trước bầu cử, người ta thăm dị 1000 cử tri thì thấy cĩ 400 người nĩi rằng sẽ bỏ phiếu cho ơng A. Một tuần sau (vẫn chưa bầu cử), người ta tổ chức 1 cuộc thăm dị khác và thấy cĩ 680 trong số 1500 cử tri được hỏi sẽ bỏ phiếu cho ơng . Kiểm định giả thuyết H : “tỉ lệ cử tri ủng hộ ơng A ở hai lần là như nhau”, với mức ý nghĩa 1% cĩ giá trị thống kê và kết luận là: A. t 2,6356; cử tri ngày càng ủng hộ ơng . B. ; cử tri ủng hộ ơng khơng thay đổi. C. t 2,1349; cử tri ngày càng ủng hộ ơng . D. ; cử tri ủng hộ ơng khơng thay đổi. Đáp án đúng: A.