Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 8: Kiểm định giả thuyết về tham số của tổng thể - Nguyễn Việt Dũng
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 8: Kiểm định giả thuyết về tham số của tổng thể - Nguyễn Việt Dũng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_thong_ke_ung_dung_trong_kinh_doanh_chuong_8_kiem_d.pdf
Nội dung text: Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 8: Kiểm định giả thuyết về tham số của tổng thể - Nguyễn Việt Dũng
- CHƯƠNG 8 KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ CỦA TỔNG THỂ Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn
- MỤC TIÊU CỦA CHƯƠNG ● Sau khi học xong chương này, người học sẽ ● Hiểu được kiểm định là gì và biết cách lập cặp giả thuyết KĐ phù hợp với các bài tốn KĐ 2 bên, bên trái và bên phải ● Nắm được quy trình KĐGT tổng quát ● Kể tên được các chỉ tiêu KĐ với bài tốn KĐGT trên một tổng thể (trung bình, tỷ lệ, phương sai) ● Biết cách xác định xác suất tới hạn để bác bỏ H0 p-value ● Phát biểu và nêu được chỉ tiêu KĐ với các bài tốn KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương sai) © Nguyễn Tiến Dũng Thống kê ứng dụng 2
- CÁC NỘI DUNG CHÍNH 8.1 Các vấn đề chung về kiểm định 8.2 KĐ giả thuyết trên một tổng thể 8.3 KĐ giả thuyết trên hai tổng thể © Nguyễn Tiến Dũng Thống kê ứng dụng 3
- 8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH ● 8.1.1 Đặt giả thuyết về tham số tổng thể ● Cặp giả thuyết H0 (giả thuyết khơng) và H1(Ha) (giả thuyết đối) ● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ giữa thời gian tự học và KQ học tập (GPA) ● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học và GPA cĩ mối liên hệ ● H0: Giữa thời gian tự học và GPA KHƠNG cĩ mối liên hệ ● H1: Giữa thời gian tự học và GPA cĩ mối liên hệ ● Để chứng minh nghi vấn của người NC là đúng, thì người NC sẽ phải: thu thập DL bác bỏ H0. © Nguyễn Tiến Dũng Thống kê ứng dụng 4
- ● 8.1.2 Một số nguyên tắc liên quan đến việc đặt giả thuyết ● H0: ● trạng thái bình thường; trạng thái gốc, khơng cĩ dữ liệu chứng minh ● phải cĩ dấu bằng, khơng cĩ liên hệ; ● H1: ● trạng thái ngược lại H0, khơng cĩ dấu bằng, cĩ liên hệ, thể hiện nghi vấn của người nghiên cứu ● địi hỏi dữ liệu, bằng chứng để chứng minh ● Bác bỏ H0 tức chấp nhận H1 là đúng ● TD: Khối lượng gĩi ngũ cốc µ = 368g © Nguyễn Tiến Dũng Thống kê ứng dụng 5
- 8.1.3 Logic của bài tốn kiểm định ● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng trực giác cĩ thể bác bỏ H0 mà khơng cần KĐ ● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy tắc nhất quán để bác bỏ H0. © Nguyễn Tiến Dũng Thống kê ứng dụng 6
- 8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II ● Sai lầm Kiểu I ● Sai lầm Kiểu II ● Sai lầm alpha ● Sai lầm beta ● Alpha = P(Bác bỏ ● Beta = P(Chấp nhận H0/H0 đúng) H0/H0 sai) ● ● ● Giảm alpha Giảm ● Hiệu lực của KĐ Sai lầm Kiểu I ● Chấp nhận H0 -> Tăng nguy cơ mắc nguy mắc sai lầm Sai lầm Kiểu II kiểu II ● Bác bỏ được H0, chỉ mắc Sai lầm Kiểu I © Nguyễn Tiến Dũng Thống kê ứng dụng 7
- 8.1.5 Mức ý nghĩa của KĐ ● 8.1.5 Mức ý nghĩa của KĐ (Significance level) ● Alpha: sai lầm phạm phải khi bác bỏ H0 ● CL = (1 – α).100% là độ tin cậy của KĐ ● Giá trị thường dùng: CL = 95% hay α = 0,05 © Nguyễn Tiến Dũng Thống kê ứng dụng 8
- 8.1.6 Xác suất tới hạn (p-value) ● Khi giảm α, khoảng ước lượng rộng ra khả năng bác bỏ H0 giảm ● Xác suất tới hạn p-value = giá trị nhỏ nhất của α mà tại đĩ khơng thể bác bỏ H0 được nữa ● TD: n=100; s=10 H 0 : 368 ● α1 = 0,1 (90%) z α1/2= 1,645 H1 : 368 ● α2 = 0,05 (95%) z α2/2= 1,96 x 366,3 © Nguyễn Tiến Dũng Thống kê ứng dụng 9
- 8.1.7 KĐ một bên và KĐ hai bên H 00: H 00: H 00: H10: H10: H10: Kiểm định bên trái Kiểm định hai bên Kiểm định bên phải © Nguyễn Tiến Dũng Thống kê ứng dụng 10
- 8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ ● 8.2.1 KĐGT về TB tổng thể ● 8.2.2 KĐGT về tỷ lệ tổng thể ● 8.2.3 KĐGT về phương sai tổng thể © Nguyễn Tiến Dũng Thống kê ứng dụng 11
- 8.2.1 KĐGT về TB tổng thể ● Quy trình KĐ 1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài tốn KĐ là hai bên, bên trái hay bên phải 2. Chọn mức ý nghĩa a 3. XĐ giá trị tính tốn (giá trị thống kê) của chỉ tiêu KĐ: zStat, tStat (SGK: ztt, ttt ) 4. Cĩ 2 cách tiếp cận: ● Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu KĐ: za, za/2, ta, ta/2 ● Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ tính -> tính ra p-value. 5. Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác bỏ hay chấp chận H0 ● Cách 1: So sánh giá trị tính tốn với giá trị tra bảng của chỉ tiêu KĐ ● Cách 2: So sánh p-value và a 6. Kết luận © Nguyễn Tiến Dũng Thống kê ứng dụng 12
- 8.2.1.1 Trường hợp biết phương sai tổng thể x 0 ● Chỉ tiêu KĐ z zStat Stat / n ● Quy tắc bác bỏ H0 (theo giá trị tới hạn) H 00: H 00: H 00: H10: H10: H10: zzStat a zzStat a /2 zzStat a zzStat a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 13
- 8.2.1.2 Trường hợp khơng biết phương sai tổng thể, cỡ mẫu lớn (n≥30) ● Chỉ tiêu KĐ chính xác cần là tStat ● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn x 0 giản -> cChỉ tiêu KĐ zStat zStat ● Thay PS tổng thể bằng PS mẫu s/ n ● Quy tắc bác bỏ H0 H 00: H 00: H 00: H10: H10: H10: Bác bỏ H0 nếu Bác bỏ H0 nếu Bác bỏ H0 nếu zzStat a zzStat a /2 zzStat a zzStat a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 14
- 8.2.1.3 Trường hợp khơng biết phương sai tổng thể, cỡ mẫu nhỏ (n< 30) ● Chỉ tiêu KĐ tStat x 0 tStat ● Quy tắc bác bỏ H0 s/ n H 00: H 00: H 00: H10: H10: H10: tt n 1;a tt n 1;a /2 tt n 1;a tt n 1;a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 15
- 8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0 ● Tính chỉ tiêu KĐ zStat hoặc tStat (tính) ● Tìm xác suất P tương ứng với bài tốn KĐ (hai bên, bên trái, bên phải). Đĩ chính là p- value ● KĐ hai bên: p-value = 2.P(z ≥ |zStat|) ● KĐ bên trái: p-value = P(z ≤ zStat) ● KĐ bên phải: p-value = P(z ≥ zStat) ● So sánh giá trị p-value với α ● Nếu p-value < α thì bác bỏ H0 ● Nếu p-value ≥ α thì chấp nhận H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 16
- 8.2.2 KĐGT về tỷ lệ tổng thể ● Điều kiện cỡ mẫu đủ lớn: ● np ≥ 5 pp 0 ● n(1-p) ≥ 5 zStat p(1 p ) / n ● Chỉ tiêu KĐ 00 ● Quy tắc bác bỏ H0 H00: pˆ p H00: pˆ p H00: pˆ p H10: pˆ p H10: pˆ p H10: pˆ p zzStat a zzStat a /2 zzStat a zzStat a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 17
- 8.2.3 KĐGT về phương sai tổng thể (ns 1) 2 ● Chỉ tiêu KĐ 2 Stat 2 0 ● Quy tắc bác bỏ H0 KĐ bên trái KĐ hai bên KĐ bên phải 22 22 22 0 0 0 22 22 22 0 0 0 22 22 22 Stat n 1;1 a Stat n 1;a /2 Stat n 1;a 22 Stat n 1;1a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 18
- Phân phối Chi bình phương © Nguyễn Tiến Dũng Thống kê ứng dụng 19
- KĐ Chi bình phương KĐ bên trái KĐ hai bên KĐ bên phải © Nguyễn Tiến Dũng Thống kê ứng dụng 20
- © Nguyễn Tiến Dũng Thống kê ứng dụng 21
- 8.3 KĐGT TRÊN HAI TỔNG THỂ ● 8.3.1 KĐGT về chênh lệch của 2 TB tổng thể ● 8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể ● 8.3.3 KĐGT về tính bằng nhau của 2 phương sai tổng thể © Nguyễn Tiến Dũng Thống kê ứng dụng 22
- 8.3.1 KĐGT về chênh lệch của hai TB tổng thể ● 8.3.1.1 Trường hợp 2 ()xxd mẫu độc lập, biết PS z 120 22 ● Giả thuyết KĐ 12 nn12 ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 Hd0: 1 2 0 Hd0: 1 2 0 Hd0: 1 2 0 Hd1: 1 2 0 Hd1: 1 2 0 Hd1: 1 2 0 zz a zz a /2 zz a zz a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 23
- 8.3.1.2 Trường hợp 2 mẫu độc lập, khơng biết PS, cỡ mẫu lớn ● Thay PS tổng thể bằng PS mẫu ()x x d z 1 2 0 ss22 12 nn12 Hd0: 1 2 0 Hd0: 1 2 0 Hd0: 1 2 0 Hd1: 1 2 0 Hd1: 1 2 0 Hd1: 1 2 0 zz a zz a /2 zz a zz a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 24
- 8.3.1.3 Trường hợp 2 mẫu độc lập, khơng biết phương sai, cỡ mẫu nhỏ ● Giả định 2 tổng thể cĩ phân phối normal ● Trường hợp A: PS 2 tổng thể bằng nhau thay 2 PS mẫu bằng 1 PS chung 22 2 (n1 1) s 1 ( n 2 1) s 2 s p nn12 2 ()x x d t 1 2 0 Stat 11 s p nn12 © Nguyễn Tiến Dũng Thống kê ứng dụng 25
- ● Quy tắc bác bỏ H0 Hd: Hd0: 1 2 0 Hd0: 1 2 0 0 1 2 0 Hd: Hd: Hd1: 1 2 0 1 1 2 0 1 1 2 0 tt tt tt nn 2;a nn12 2;a nn12 2;a /2 12 tt nn12 2;a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 26
- 8.3.1.3 Trường hợp 2 mẫu độc lập, khơng biết PS tổng thể, cỡ mẫu nhỏ (tiếp) ● Trường hợp B: 2 PS tổng thể khác nhau ● Chỉ tiêu KĐ t ● Số bậc tự do df 2 ss22 12 2 ss22 ()x1 x 2 d 0 nn12 xx12 t df 2 2 4 4 22 22 ss ssxx 12 ss12 12 nn12 nnnn 11 12 12 nn12 11 © Nguyễn Tiến Dũng Thống kê ứng dụng 27
- ● Quy tắc bác bỏ H0 Hd: Hd0: 1 2 0 Hd0: 1 2 0 0 1 2 0 Hd: Hd1: 1 2 0 Hd1: 1 2 0 1 1 2 0 tt tt df ;a tt df ;a /2 df ;a tt df ;a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 28
- 8.1.3.4 Trường hợp 2 mẫu cặp ● Tổng thể 1: x1 ● Tổng thể 2: x2 ● Tạo biến chênh lệch d = x1 – x2 hay di = x1i – x2i ● Trở về trường hợp KĐGT trên 1 tổng thể d ● Nếu n ≥ 30 thì chỉ tiêu KĐ là z ● Nếu n < 30 thì chỉ tiêu KĐ là t ● TD Trang 236 về so sánh tốc độ xử lý của 2 phần mềm dd dd 0 0 t z hoặc snd / snd / 1 n 1 n s22 () d d dd i di n i 1 n 1 i 1 © Nguyễn Tiến Dũng Thống kê ứng dụng 29
- ● Quy tắc bác bỏ H0 (n <30) Hd0: 1 2 0 Hd0: 1 2 0 Hd0: 1 2 0 Hd1: 1 2 0 Hd1: 1 2 0 Hd1: 1 2 0 Hd00: D Hd00: D Hd00: D Hd10: D Hd10: D Hd10: D tt n 1;a tt n 1;a /2 tt n 1;a tt n 1;a /2 © Nguyễn Tiến Dũng Thống kê ứng dụng 30
- 8.3.1.5 Ứng dụng Excel ● Data Analysis ● MegaStat © Nguyễn Tiến Dũng Thống kê ứng dụng 31
- 8.3.2 KĐGT về chênh lệch giữa 2 tỷ lệ tổng thể ● 8.3.2.1 Phương pháp dùng phân phối Z ● Kiểm tra GT cỡ mẫu đủ lớn ● n1p1 ≥ 5; n1.(1-p1) ≥ 5 ● n2p2 ≥ 5; n2.(1-p2) ≥ 5 ● Giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 © Nguyễn Tiến Dũng Thống kê ứng dụng 32
- ˆˆ ˆˆ H0:0 pˆˆ 1 p 2 H0:0 p 1 p 2 H0:0 p 1 p 2 H:0 pˆˆ p H:0 pˆˆ p H1:0 pˆˆ 1 p 2 1 1 2 1 1 2 zz a zz a /2 zz a zz a /2 pp 11 z 12 s2 p(1 p )( ) s nn12 n p n p p 1 1 2 2 nn12 © Nguyễn Tiến Dũng Thống kê ứng dụng 33
- 8.3.3 KĐGT về tính bằng nhau của 2 PS tổng thể 22 22 22 H 0 : H : H : 12 0 12 0 12 22 22 22 H1 : H : H : 12 1 12 1 12 FF df, df ,1 a FF 12 FF df, df ,1 a /2 df12,, df a 12 FF df12, df ,a /2 2 s 1 F 1 F s2 df12, df ,1 a F 2 df21,, df a ● Quy tắc thuận tiện: KĐ 2 bên hoặc KĐ bên phải © Nguyễn Tiến Dũng Thống kê ứng dụng 34