Bài giảng Xác suất và thống kê
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất và thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
bai_giang_xac_suat_va_thong_ke.pdf
Nội dung text: Bài giảng Xác suất và thống kê
- BỘ CÔNG THƯƠNG TRƯỜNG CAO ĐẲNG KỸ THUẬT CAO THẮNG Bài giảng:XÁC SUẤT và THỐNG KÊ (Lưu hành nội bộ) TP. HỒ CHÍ MINH 2010
- Mục lục Chương 1. GIẢI TÍCH TỔ HỢP 1 1.1. TậpHợp 1 1.1.1. Cáckháiniệmcơbản 1 1.1.2. Cácphéptoántậphợp 2 1.2. GiảiTíchTổHợp 2 1.2.1. Quytắcnhân 2 1.2.2. Chỉnhhợp 3 1.2.3. Hoánvị 3 1.2.4. Tổhợp 4 1.2.5. Hoánvịlặp 4 1.2.6. Chỉnhhợplặp 4 1.2.7. NhịthứcNewton 5 Chương 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 6 2.1. KháiNiệmBiếnCố 6 2.1.1. Phépthử,khônggianmẫu. . . . . . . . . . . . . . . . . . . . . . . 6 i
- MỤC LỤC 2.1.2. Biếncố 6 2.1.3. Cácphéptoáncủabiếncố . . . . . . . . . . . . . . . . . . . . . . . 7 2.1.4. Quanhệgiữacácbiếncố. . . . . . . . . . . . . . . . . . 7 2.1.5. Tínhchất 8 2.2. ĐịnhNghĩaXácSuất 9 2.2.1. Địnhnghĩa(cổđiển) 9 2.2.2. Địnhnghĩaxácsuấttheothốngkê . . . . . . . . . . . . . . . . . . 9 2.2.3. Địnhnghĩatheohìnhhọc . . . . . . . . . . . . . . . . . . . . . . . 9 2.2.4. Tínhchất 9 2.3. CôngThứcXácSuất 10 2.3.1. Côngthứccộng 10 2.3.2. Xácsuấtcóđiềukiện. . . . . . . . . . . . . . . . . . . . 10 2.3.3. Côngthứcnhân 11 2.4. CôngThứcXácSuấtĐầyĐủ . . . . . . . . . . . . . . . . . . . 11 2.4.1. Côngthứcxácsuấtđầyđủ. . . . . . . . . . . . . . . . . . . . . . . 11 2.4.2. CôngthứcBayès 11 2.4.3. CôngthứcBernoulli . . . . . . . . . . . . . . . . . . . . 11 Chương 3. ĐẠI LƯỢNG NGẪU NHIÊN 13 3.1. KháiNiệmĐạiLượngNgẫuNhiên . . . . . . . . . . . . . . . . . . . . . . 13 3.2. HàmPhânPhốiXácSuất 13 3.2.1. Định nghĩa và tính chất của hàm phân phối . . . . . . . . . . . . . 13 3.2.2. Bảngphânphốixácsuất. . . . . . . . . . . . . . . . . . . . . . . . 14 Khoa Giáo Dục Đại Cương ii Xác Suất Và Thống Kê
- MỤC LỤC 3.2.3. Hàm mật độ của đại lượng ngẫu nhiên liên tục . . . . . . . . . . 16 3.3. CácĐặcTrưngCủaĐạiLượngNgẫuNhiên . . . . . . . . . . . . . . . . . 16 3.3.1. Kỳvọng 16 3.3.2. Phươngsai 18 3.3.3. Modevàtrungvị 19 3.4. Các Quy Luật Phân phối Xác Suất Thông Dụng . . . . . . . . . . . . . 20 3.4.1. Phân phối xác suất của đại lượng ngẫu nhiên rời rạc . . . . 20 3.4.2. Phân phối xác suất của đại lượng ngẫu nhiên liên tục . . . 23 3.5. ĐịnhLíGiớiHạnTrungTâm . . . . . . . . . . . . . . . . . . . 29 3.6. Véctơ Ngẫu Nhiên - Đại Lượng Ngẫu Nhiên 2 Chiều . . . . . . . . . 31 3.6.1. Hàm phân phối xác suất của đại lượng ngẫu nhiên 2 chiều . 31 3.6.2. Phân phối xác suất của đại lượng ngẫu nhiên 2 chiều . . . . 32 3.6.3. HệSốTươngQuan 35 Chương 4. LÝ THUYẾT MẪU 36 4.1. MẫuNgẫuNhiên 36 4.1.1. Kháiniệmtổngthểvàmẫu . . . . . . . . . . . . . . . . . . . . . . 36 4.1.2. Cácphươngphápchọnmẫu . . . . . . . . . . . . . . . . . . . . . . 36 4.1.3. Mẫungẫunhiên,mẫucụthể. . . . . . . . . . . . . . . . . . . . . . 37 4.1.4. Cácđặctrưngmẫu 37 4.2. Phươngpháptínhthamsốmẫucụthể . . . . . . . . . . . . . . . . . . . . 39 Khoa Giáo Dục Đại Cương iii Xác Suất Và Thống Kê
- MỤC LỤC Chương 5. ƯỚC LƯỢNG THAM SỐ 40 5.1. ƯớcLượngĐiểm 40 5.1.1. Bàitoánướclượngđiểm . . . . . . . . . . . . . . . . . . . . . . . . 40 5.1.2. Ướclượngkhôngchệch . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.2. ƯớcLượngKhoảng 41 5.2.1. Kháiniệmướclượngkhoảng. . . . . . . . . . . . . . . . . . . . . . 41 5.2.2. Phươngphápướclượngkhoảng . . . . . . . . . . . . . . . . . . . . 41 Chương 6. LÝ THYẾT KIỂM ĐỊNH 46 6.1. KháiNiệm 46 6.1.1. Kháiniệmvàđịnhnghĩa . . . . . . . . . . . . . . . . . . . . . . . . 46 6.1.2. Cácbướckiểmđịnhgiảthiết: . . . . . . . . . . . . . . . . . . . . . 46 6.2. KiểmĐịnhGiảThiết 47 6.2.1. Kiểmđịnhgiảthiếtvềtỉlệ . . . . . . . . . . . . . . . . . . . . . . 47 6.2.2. Kiểm định giả thiết về trung bình . . . . . . . . . . . . . . . . . . . 47 6.2.3. Kiểm định giả thiết về phương sai . . . . . . . . . . . . . . . . . . . 49 6.3. KiểmĐịnhSoSánhCácThamSố. . . . . . . . . . . . . . . . . . . . . . . 51 6.3.1. Sosánhhaitỉlệ 51 6.3.2. Sosánhhaigiátrịtrungbình . . . . . . . . . . . . . . . . . . . . . 51 6.3.3. Sosánhhaiphươngsai. . . . . . . . . . . . . . . . . . . . . . . . . 53 Khoa Giáo Dục Đại Cương iv Xác Suất Và Thống Kê
- Chương 1 GIẢI TÍCH TỔ HỢP 1.1 Tập Hợp 1.1.1 Các khái niệm cơ bản Tập hợp là một khái niệm cơ bản của Toán học, không được định nghĩa. Ví dụ như khái niệm tập hợp sinh viên của một trường Đại học, tập hợp các nghiệm của phương trình x3 x +6=0, tập hợp N các số tự nhiên, − Nếu a là một phần tử thuộc tập hợp A ta viết a A, ngược lại ta viết a / A. ∈ ∈ Tập hợp không chứa bất kỳ phần tử nào được gọi là tập rỗng, ký hiệu . ∅ Để xác định một tập hợp ta có thể dùng một trong hai cách thông dụng sau: Cách 1: Xác định tập hợp bằng cách liệt kê các phần tử của nó như A = 0, 1, 2, , 9 , B∗= a , a , a , { } { 1 2 3} Cách 2: Xác định tập hợp bằng cách chỉ ra tính chất đặc trưng của phần tử thuộc nó. Chẳng∗ hạn, S = x R : x3 5x +1=0 , T = n N : n là ước của 26 , { ∈ − } { ∈ } Tập hợp A gọi là con của B, nếu mọi phần tử của tập A đều là phần tử của tập B, ký hiệu A B. ⊂ A B x A x B ⊂ ⇔ {∀ ∈ ⇒ ∈ } Nếu A B và B A thì ta nói A, B là hai tập bằng nhau và viết A = B. ⊂ ⊂ A = B x A x B ⇔{ ∈ ⇔ ∈ } 1
- CHƯƠNG 1. GIẢI TÍCH TỔ HỢP 1.1.2 Các phép toán tập hợp Cho A và B là hai tập hợp tùy ý. a. Phép hợp: Hợp của của A và B là tập gồm các phần tử hoặc thuộc A hoặc thuộc B, ký hiệu là A B. ∪ A B = x/x A x B ∪ { ∈ ∨ ∈ } b. Phép giao: Giao của A và B là tập gồm các phần tử vừa thuộc A vừa thuộc B, ký hiệu A B. ∩ A B = x/x A x B ∩ { ∈ ∧ ∈ } c. Phép hiệu: Hiệu của tập X đối với tập A là tập hợp gồm các phần tử thuộc X nhưng không thuộc A. Ký hiệu: X A. \ X A = x/x X x / A \ { ∈ ∧ ∈ } Đặc biệt, nếu A X thì X A gọi là phần bù của A trong X và ký hiệu A. Vậy X A = A. ⊂ \ \ 1.2 Giải Tích Tổ Hợp 1.2.1 Quy tắc nhân Một công việc có thể được thực hiện qua 2 giai đoạn I và II. Trong đó: Giai đoạn I có n cách thực hiện, Giai đoạn II có m cách thực hiện. Khi đó, để hoàn thành công việc có n m cách thực hiện. × Ví Dụ 1.1. Để đi từ tỉnh A đến tỉnh B có thể đi bằng: ôtô, tàu cao tốc hoặc máy bay. Đi từ tỉnh B đến tỉnh C có thể đi bằng: ôtô, tàu cao tốc, tàu hỏa hoặc máy bay. Hỏi có bao nhiêu cách đi từ tỉnh A đến tỉnh C, bắt buộc phải ghé qua tỉnh B? Khoa Giáo Dục Đại Cương 2 Xác Suất Và Thống Kê
- CHƯƠNG 1. GIẢI TÍCH TỔ HỢP ôtô ôtô tàu cao tốc tàu cao tốc A B máy bay C máy bay tàu hỏa Tổng quát: Một công việc được thực hiện qua k giai đoạn 1, 2, 3, , k. Trong đó: Giai đoạn 1 có n1 cách thực hiện, Giai đoạn 2 có n cách thực hiện, 2 Giai đoạn 3 có n3 cách thực hiện, Giai đoạn k có nk cách thực hiện. k Khi đó, để hoàn thành công việc có n n n nk = ni cách thực hiện. 1 × 2 × 3 × × i=1 Ví Dụ 1.2. Một người có 5 cái quần 3 cái áo 4 đôi giày. MỗiQ lần đi chơi người đó chọn một quần, một áo và một đôi giày. Hỏi có bao nhiêu cách để lựa chọn? 1.2.2 Chỉnh hợp Định Nghĩa 1.1. Một cách chọn lần lượt không hoàn lại (không lặp, có thứ tự) k phần tử từ một tập hợp có n phần tử, được gọi là một chập hợp chập k của n phần tử. k Định Lí 1.1. Số các chỉnh hợp chập k của một tập hợp có n phần tử, ký hiệu là An và được tính bởi công thức sau: Ak = n(n 1)(n 2) [n (k 1)] (Quy ước 0!=1) n − − − − Ta có thể viết gọn lại là n(n 1)(n 2) [n (k 1)](n k)[n (k + 1)] 3.2.1 n! Ak = − − − − − − = n (n k)[n (k + 1)] 3.2.1 (n k)! − − − Ví Dụ 1.3. Có 20 đội bóng tham dự một giải bóng đá. Biết rằng, các đội sẽ thi đấu vòng tròn 2 lượt (lượt đi và lượt về). Hỏi để chọn được đội vô địch thì phải tổ chức tất cả bao nhiêu trận đấu? 1.2.3 Hoán vị Định Nghĩa 1.2. Một phép hoán vị của n (n 1) phần tử phân biệt là một cách sắp ≥ thứ tự của n phần tử đó. Khoa Giáo Dục Đại Cương 3 Xác Suất Và Thống Kê
- CHƯƠNG 1. GIẢI TÍCH TỔ HỢP Ví Dụ 1.4. Một kệ sách có thể sắp được 5 quyển sách. Hỏi có thể có bao nhiêu cách sắp xếp 5 quyển sách lên kệ. 1.2.4 Tổ hợp Định Nghĩa 1.3. Một cách chọn k (0 <k n) phần tử không để ý thứ tự, không lặp từ ≤ một tập có n phần tử được gọi là một tổ hợp chập k của n phần tử. k Định Lí 1.2. Số các tổ hợp chập k của n phần tử, ký hiệu là Cn và được cho bởi biểu thức: Ak n! Ck = n = n k! k!(n k)! − Ví Dụ 1.5. Một lớp có 30 sinh viên. Hỏi có bao nhiêu cách chọn ra 3 sinh viên để làm ban cán sự lớp. Tính Chất 1.1. Cho n, k N. khi đó: ∈ k n k i) C = C − với 0 k n; n n ≤ ≤ k k 1 k ii) C + C − = C với 1 k n. n n n+1 ≤ ≤ 1.2.5 Hoán vị lặp Định Nghĩa 1.4. Một cách sắp thứ tự của n phần tử mà trong đó có k (k = n) phần tử 6 giống nhau được gọi là một hoán vị lặp. Ký hiệu là Pn(k) và được xác định bởi biểu thức: n! P (k)= n k! Ví Dụ 1.6. Từ các chữ số 1, 2, 3, 4 có thể lập được bao nhiêu số có 6 chữ số, biết rằng trong số đó chữ số 3 xuất hiện 3 lần và các chữ số còn lại đều khác nhau. 1.2.6 Chỉnh hợp lặp Định Nghĩa 1.5. Một cách chọn có lặp k phần tử có thứ tự từ một tập có n phần tử được gọi là một chỉnh hợp lặp chập k của n phần tử. Định Lí 1.3. Số các chỉnh hợp lặp chập k của n phần tử được tính theo công thức: k k An = n Ví Dụ 1.7. Có 6 quyển sách xếp tùy ý vào 3 ngăn trên kệ, hỏi rằng có tất cả bao nhiêu e cách sắp xếp? Khoa Giáo Dục Đại Cương 4 Xác Suất Và Thống Kê
- CHƯƠNG 1. GIẢI TÍCH TỔ HỢP 1.2.7 Nhị thức Newton n 0 n 0 1 n 1 1 2 n 2 2 k n k k n 0 n (a + b) =Cna b + Cna − b + Cna − b + + Cna − b + + Cn a b n n i n i i i i n i = Cna − b = Cna b − , i=0 i=0 X X khai triển trên gọi là nhị thức Newton. Khoa Giáo Dục Đại Cương 5 Xác Suất Và Thống Kê
- Chương 2 BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 2.1 Khái Niệm Biến Cố 2.1.1 Phép thử, không gian mẫu Phép thử: Khi ta làm một thí nghiệm hay quan sát một hiện tượng mà có chú ý đến kết quả thì gọi là phép thử. Ký hiệu phép thử là: T. Không gian mẫu: Tập hợp tất cả các kết quả có thể có của một phép thử được gọi là không gian mẫu. Ký hiệu: Ω. 2.1.2 Biến cố Biến cố: Tập con A của Ω, được gọi là biến cố. Ví Dụ 2.1. Xét một số ví dụ về biến cố sau đây: Gieo một con xúc xắc thì việc xuất hiện số chấm lẻ là một biến cố; Tung một đồng xu là một phép thử, biến cố là mặt xấp xuất hiện hay mặt ngữa xuất hiện. a. Biến cố sơ cấp: Mỗi phần tử ω của Ω được gọi là biến cố sơ cấp. 6
- CHƯƠNG 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ b. Biến cố chắc chắn: Là biến cố luôn luôn xảy ra khi thực hiện phép thử. Ký hiệu: Ω c. Biến cố không thể: Là biến cố không bao giờ xảy ra khi thực hiện phép thử. Ký hiệu: ∅ Ví Dụ 2.2. Tung một con xúc xắc. Ta có: Không gian mẫu là Ω= 1, 2, 3, 4, 5, 6 . Các biến cố sơ cấp là: 1 , 2 , 3 , 4 , 5 , 6 . Biến cố chẵn: A = 2, 4,{6 . Biến cố chắc} chắn: B = Ω. Biến cố{ không} { } thê:{ } C{ =} {7}. { } { } { } d. Biến cố đồng khả năng: Là những biến cố có khả năng xuất hiện như nhau khi thực hiện phép thử. Trong một phép thử mà mọi biến cố sơ cấp đều có khả năng xảy ra như nhau thì số phần tử của không gian mẫu được gọi là số trường hợp dồng khả năng. 2.1.3 Các phép toán của biến cố a. Phép tổng: Biến cố C được gọi là tổng của hai biến cố A và B nếu C xảy ra khi và chỉ khi hoặc A hoặc B xảy ra. Ký hiệu C = A + B = A B. ∪ Ví Dụ 2.3. Hai xạ thủ cùng bắn vào một bia. A là biến cố người thứ nhất bắn trúng bia, B là biến cố người thứ hai bắn trúng bia. Nếu gọi C là biến cố bia bị trúng đạn thì khi đó C = A + B. b. Phép tích: Biến cố C gọi là tích của hai biến cố A và B nếu C xảy ra khi và chỉ khi cả A và B cùng xảy ra. Ký hiệu C = A.B = A B. ∩ Ví Dụ 2.4. Một sinh viên dự thi hai môn văn và toán. Gọi A là biến cố sinh viên thi đậu môn văn, B là biến cố sinh viên thi đậu môn toán và C la biến cố sinh viên thi đậu cả hai môn. Khi đó C = A.B 2.1.4 Quan hệ giữa các biến cố a. Biến cố xung khắc: Hai biến cố A và B gọi là xung khắc nếu chúng không thể cùng xảy ra trong một phép thử. Ký hiệu A B = . ∩ ∅ Ví Dụ 2.5. Tung một con xúc xắc. Gọi A là biến cố xuất hiện số nút chẵn, B là biến cố xuất hiện số nút lẽ. Khi đó A và B là hai biến cố xung khắc. b. Họ các biến cố xung khắc: Họ các biến cố A1, A2, , An được gọi là họ xung khắc nếu một biến cố bất kỳ trong họ xảy ra thì các biến cố còn lại không xảy ra. Nghĩa là: Ai.Aj = , i, j(i = j) ∅ ∀ 6 Khoa Giáo Dục Đại Cương 7 Xác Suất Và Thống Kê
- CHƯƠNG 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ c. Biến cố đối lập: Hai biến cố A và B được gọi là đối lập, nếu: i) A và B xung khắc. ii) A + B = Ω Hai biến cố A và B trong ví dụ trên là đối lập. d. Họ đầy đủ Họ các biến cố A1, A2, , An được gọi là một họ đầy đủ nếu chúng thỏa: i) Họ xung khắc: Ai.Aj = , i, j(i = j) ∅ ∀ 6 ii) A1 + A2 + + An = Ω e. Biến cố độc lập: Hai biến cố A và B gọi là độc lập nếu biến cố này xảy ra hay không thì không phụ thuộc vào biến cố kia. Ví Dụ 2.6. Bắn hai phất đạn vào bia. Gọi A là biến cố phát thứ nhất trúng bia, B là biến cố phát thứ hai trúng bia. Khi đó A và B là hai biến cố độc lập. 2.1.5 Tính chất Cho A,B,C Ω. Khi đó: ⊂ a. A+A = A; A.A = A; AΩ= A; A+B = B+A; A.B = B.A; A+(B+C)=(A+B)+C b. A B B A; A A + B; A.B B ⊂ ⇒ ⊂ ⊂ ⊂ c. A.(B + C)= AB + AC; A.B = A + B; A + B = A.B Ví Dụ 2.7. Kiểm tra 3 sản phẩm. Gọi Ak là biến cố sản phẩm thứ k tốt. Hãy trình bày các cách biểu diễn qua Ak các biến cố sau: a. A: tất cả các sản phẩm đều xấu. b. B: có ít nhất một sản phẩm xấu. c. C: có ít nhất một sản phẩm tốt. d. D: không phải tất cả sản phẩm đều tốt. e. E: có đúng một sản phẩm xấu. f. F : có ít nhất 2 sản phẩm tốt. Khoa Giáo Dục Đại Cương 8 Xác Suất Và Thống Kê
- CHƯƠNG 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 2.2 Định Nghĩa Xác Suất 2.2.1 Định nghĩa (cổ điển) Định Nghĩa 2.1. Gia sử một phép thử có n trường hợp đồng khả năng. Trong đó có m trường hợp thuận lợi cho biến cố A. Khi đó, xác suất của biến cố A. Ký hiệu P (A) và xác đinh bởi công thức. m Số trương hợp thuận lợi P (A)= = n Số trường hợp đông khả năng Ví Dụ 2.8. Một hộp chứa 10 sản phẩm tốt và 3 phế phẩm. Chọn ngẫu nhiên 2 sản phẩm. Tính xác suất hai sản phẩm được chọn là sản phẩm tốt. 2.2.2 Định nghĩa xác suất theo thống kê Định Nghĩa 2.2. Giả sử phép thử được thực hiện n lần độc lập trong đó biến cố A xuất m hiện m lần. Khi đó, m được gọi là tần số xuất hiện của biến cố A và tỉ số A = f (A) A A n n được gọi là tần suất (tần số tương đối) của biến cố A. Ví Dụ 2.9. Qua thống kê dân số, người ta tổng kết được xác suất để một em bé ra đời 1 là trai hay gái xấp xỉ . 2 2.2.3 Định nghĩa theo hình học Định Nghĩa 2.3. Cho miền Ω. Khi đó độ đo của miền Ω có thể là độ dài, điện tích hoặc thể tích. Gọi A là biến cố điểm M S Ω. độ đoS ∈ ⊂ P (A)= . độ đoΩ Ví Dụ 2.10. Tìm xác suất của điểm M rơi vào tam giác đều nội tiếp đường tròn bán kính là 1. 2.2.4 Tính chất i) A Ω, 0 P (A) 1, ∀ ⊂ ≤ ≤ ii) Nếu A B thì P (A) P (B). Do đó, nếu A B (A = B) thì P (A)= P (B) ⇒ ≤ ⇔ iii) Nếu A = Ω thì P (A)=1 và nếu A = thì P (A)=0. ∅ Khoa Giáo Dục Đại Cương 9 Xác Suất Và Thống Kê
- CHƯƠNG 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 2.3 Công Thức Xác Suất 2.3.1 Công thức cộng Cho A , A , A , , An là hệ các biến cố tùy ý. Khi đó ta có công thức sau { 1 2 3 } n n n 1 P ( Ai)= P (Ai) P (AiAj)+ P (AiAjAk)+ +( 1) − P (A An) − ··· − 1 i=1 i=1 1 i 0. Xác suất của biến cố A được tính với ⊂ điều kiện biến cố B đã xảy ra được gọi là xác suất có điều kiện của biến cố A đối với biến cố B. Ký hiệu: P (A/B). Khi đó: P (AB) P (A/B)= , (P (B) = 0) P (B) 6 Ví Dụ 2.12. Gieo một con xúc xắc. Gọi A là biến cố xuất hiện mặt hai chấm, B là biến cố xuất hiện mặt một chấm. Tính P (A/B) và P (B/A) Khoa Giáo Dục Đại Cương 10 Xác Suất Và Thống Kê
- CHƯƠNG 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 2.3.3 Công thức nhân Cho 2 biến cố A và B. Ta có: P (A.B)= P (A).P (A/B)= P (B).P (B/A). Cho A , A , A , , An là hệ các biến cố tùy ý. Khi đó ta có công thức sau { 1 2 3 } P (A1.A2.A3 An)= P (A1)P (A2/A1)P (A3/A1A2) P (An/A1A2 An 1), − gọi là công thức nhân xác suất. Ví Dụ 2.13. Trong 1 hộp có 100 phiếu, trong đó có 10 phiếu trúng thưởng. Tính xác suất để người thứ nhất, người thứ hai và người thứ ba đều rút được phiếu trúng thưởng? 2.4 Công Thức Xác Suất Đầy Đủ 2.4.1 Công thức xác suất đầy đủ Giả sử, hệ các biến cố A , A , A , , An là đầy đủ và B là một biến cố bất kỳ. Khi đó: { 1 2 3 } P (B) = P (A1)P (B/A1)+ P (A2)P (B/A2)+ P (A3)P (B/A3)+ + P (An)P (B/An) n ··· = i=1 P (Ai)P (B/Ai), gọi là côngP thức xác suất đầy đủ. Ví Dụ 2.14. Giả sử có 3 hãng H1,H2 và H3 sản xuất cùng một loại sản phẩm. Trong đó tỉ lệ phần trăm sản phẩm của mỗi hãng trên thị trường lần lượt là 60%, 10% và 30% với tỉ lệ sản phẩm bị khuyết tật tương ứng là 1%, 5% và 3%. Mua ngẫu nhiên một sản phẩm, tính xác suất sản phẩm được mua bị khuyết tật? 2.4.2 Công thức Bayès Cũng với giả thiết như ở trên, ta có công thức sau gọi là công thức xác suất Bayès P (Ak)P (B/Ak) P (Ak/B)= n , với k = 1, n. i=1 P (Ai)P (B/Ai) Ví Dụ 2.15. Từ Ví dụ ở trên, giảP sử sản phẩm đã mua bị khuyết tật. Hãy tính xác suất để sản phẩm đó thuộc hãng H3? 2.4.3 Công thức Bernoulli a. Dãy phép thử Bernoulli Khoa Giáo Dục Đại Cương 11 Xác Suất Và Thống Kê
- CHƯƠNG 2. BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ Định Nghĩa 2.5. Dãy phép thử Bernoulli là dãy n phép thử thỏa mãn 3 điều kiện sau: i) Các phép thử của dãy độc lập với nhau. Nghĩa là, kết quả của phép thử sau không phụ thuộc vào các phép thử trước đó; ii) Trong mỗi phép thử chỉ có hai biến cố A hoặc A xảy ra; iii) Xác suất để biến cố A xảy ra là cố định: P (A) = p với 0 <p< 1 nên P (A) = 1 p = q. − Ví Dụ 2.16. Một hộp có 12 viên bi, trong đó có 4 bi màu xanh còn lại là bi trắng. Lần lượt rút có hoàn lại 7 bi. Gọi A là biến cố lấy được bi xanh trong mỗi lần rút. Lúc đó ta 4 1 2 được một dãy thử Bernoulli với n =7,p = P (A)= = và q =1 p = . 12 3 − 3 b. Công thức Xác suất Bernoulli để trong n phép thử, biến cố A xảy ra k lần với xác suất mỗi lần A xảy ra là p. Được ký hiệu là B(k,n,p) và cho bởi công thức sau đây: k k n k B(k,n,p)= Cnp q − gọi là công thức Bernoulli. Ví Dụ 2.17. Với giả thiết như ở Ví dụ trên. Ta tính được xác suất để trong 7 lần rút bi 1 3 1 3 2 4 có 3 bi xanh là: B(3, 7, 3 )= C7 ( 3 ) ( 3 ) =0, 256 Khoa Giáo Dục Đại Cương 12 Xác Suất Và Thống Kê
- Chương 3 ĐẠI LƯỢNG NGẪU NHIÊN 3.1 Khái Niệm Đại Lượng Ngẫu Nhiên Đại lượng ngẫu nhiên (ĐLNN) là đại lượng mà giá trị của nó là ngẫu nhiên. Đại lượng ngẫu nhiên thường được ký hiệu bằng những chữ in hoa như X, Y, Z, và dùng chữ in thường như x1, x2, x3, để ký hiệu cho những giá trị cụ thể của nó. Đại lượng ngẫu nhiên được chia thành 2 loại: Đại lượng ngẫu nhiên rời rạc: là đại lượng chỉ nhận hữu hạn hoặc vô hạn đếm được các giá trị. Ví Dụ 3.1. Gieo n hạt lúa. Gọi X là số hạt nảy mầm. Khi đó X là một đại lượng ngẫu nhiên rời rạc và X có thể nhận một trong các gia trị sau X = 0, 1, 2, , n . { } Đại lượng ngẫu nhiên liên tục: là đại lượng mà giá trị của nó lấp kín cả 1 đoạn; 1 khoảng hay toàn bộ trục số. Ví Dụ 3.2. Bắn một viên đạn vào bia. Gọi X là khoảng cách từ điểm chạm của viên đạn đến bia. Khi đó X là một đlnn liên tục 3.2 Hàm Phân Phối Xác Suất 3.2.1 Định nghĩa và tính chất của hàm phân phối Định Nghĩa 3.1. Hàm phân phối xác suất của đại lượng ngẫu nhiên X, ký hiệu F (x), là hàm số thực được xác định như sau: F (x)= P [X < x], x R. ∀ ∈ 13
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Tính Chất 3.1. Tính chất: i) 0 6 F (x) 6 1, x R; ∀ ∈ ii) F (x) không giảm. Nghĩa là nếu x1 6 x2 thì F (x1) 6 F (x2). iii) F ( ) = limx F (x)=0, F (+ ) = limx + F (x) = 1; −∞ →−∞ ∞ → ∞ iv) P [a 6 X 6 b]= F (b) F (a). − 3.2.2 Bảng phân phối xác suất Cho đại lượng ngẫu nhiên rời rạc X có các giá trị là x1, x2, , xn với xác suất tương ứng là P [X = x1]= p1,P [X = x2]= p2, , P [X = xn]= pn. Khi đó, luật phân phối xác suất của X gọi là bảng phân phối xác suất và được cho như sau: X x1 x2 xn P p1 p2 pn n Với pi > 0 và i=1 pi =1. Ở đây n có thể hữu hạn hoặc vô hạn đếm được. Xác suất để PX nhận giá trị trong cả đoạn: P [xi 6 X 6 xj]= pk. x 6x 6x i Xk j Nếu n hữu hạn thì hàm phân phối F (x) có dạng: 0 nếu x 6 x1 F (x)= p1 + p2 + + pk 1 nếu xk 1 1 − − ∀ 1 nếu x > xn Nếu n vô hạn thì hàm phân phối F (x) có dạng: 0 nếu x 6 x F (x)= 1 p1 + p2 + + pk 1 nếu xk 1 1 − − ∀ Ví Dụ 3.3. Một hộp có 12 sản phẩm, trong đó có 3 phế phẩm. Lấy ngẫu nhiên 2 sản phẩm từ hộp để kiểm tra. Gọi X là số phế phẩm lấy được. Lập bảng phân phối xác suất của X và tính P [ 1 6 X 6 1]? − Ví Dụ 3.4. Cũng giá trị như ở Ví dụ trên nhưng ta lần lượt lấy có hoàn lại 2 sản phẩm. Gọi Y là số phế phẩm lấy được. Lập bảng phân phối xác suất của Y. Giải: Khoa Giáo Dục Đại Cương 14 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Do lấy lần lượt có hoàn lại các sản phẩm nên ta có dãy phép thử Bernoulli với n = 2 3 1 và p = = , các xác suất được tính theo công thức Bernoulli: 12 4 1 3 9 1 3 3 P [Y =0]= C0.( )0.( )2 = ; P [Y =1]= C1.( )1.( )1 = ; 2 4 4 16 2 4 4 8 1 3 1 P [Y =2]= C2.( )2.( )0 = 2 4 4 16 Y 0 1 2 Do đó, ta có bảng phân phối xác suất như sau: 9 3 1 P 16 8 16 Ví Dụ 3.5. Một phân xưởng có 2 máy hoạt động độc lập. Xác suất trong 1 ngày làm việc các máy đó hỏng tương ứng là 0,2 và 0,3. Gọi X là số máy hỏng trong 1 ngày làm việc. Lập hàm phân phối xác suất của X và vẽ đồ thị của nó. Giải: Lập hàm phân phối xác suất của X. ◦ Gọi Ai là biến cố máy thứ i (i =1, 2) bị hỏng. Đại lượng ngẫu nhiên X chỉ có thể nhận các giá trị là 0;1;2. Do đó: ĐL P [X =0] = P [A1A2] = P [A1]P [A2]=0, 7.0, 8=0, 56 XK ĐL P [X =1] = P [A1A2 + A1A2] = P [A1A2]+ P [A1A2] = P [A1]P [A2]+ P [A1]P [A2] =0, 2.0, 7+0, 8.0, 3=0, 38 ĐL P [X =2] = P [A1A2] = P [A1]P [A2]=0, 2.0, 3=0, 06 X 0 1 2 Bảng phân phối xác suất của X: P 0,56 0,38 0,06 0 nếu x 6 0 0, 56 nếu 0 2 Đồ thị: ◦ 1 0.94 0.56 0 1 2 Khoa Giáo Dục Đại Cương 15 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN 3.2.3 Hàm mật độ của đại lượng ngẫu nhiên liên tục Định Nghĩa 3.2. Cho X là một đại lượng ngẫu nhiên liên tục có hàm phân phối xác suất F (x), x R. Hàm số: ∈ f(x)= F 0(x) được gọi là hàm mật độ xác suất của X. Tính Chất 3.2. i) f(x) > 0, x R; ∀ ∈ + ii) ∞ f(x)dx =1; −∞ R b iii) P [a 0, x R và ∞ f(x)dx =1 thì nó là hàm ∀ ∈ mật độ của 1 đại lượng ngẫu nhiên liên tục nào đó. −∞ R Ví Dụ 3.6. Cho đại lượng ngẫu nhiên liên tục X có hàm mật độ xác suất π 0 nếu x f(x)= π 2 a sin 2x nếu 0 x ≤ ≤ 2 π π Xác định a và tính P [ X ]. − 4 ≤ ≤ 4 3.3 Các Đặc Trưng Của Đại Lượng Ngẫu Nhiên 3.3.1 Kỳ vọng Định Nghĩa 3.3. Kỳ vọng của đại lượng ngẫu nhiên X ký hiệu là E(X) và được tính như sau: - Nếu X là đlnn rời rạc có bảng phân phối xác suất X x1 x2 xn P p1 p2 pn Khoa Giáo Dục Đại Cương 16 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN n thì E(X)= x1p1 + x2p2 + x3p3 + + xnpn = i=1 xipi (n có thể vô hạn). P + - Nếu X là đlnn liên tục có hàm mật độ xác suất f(x) thì E(X)= ∞ xf(x)dx. −∞ Nhận Xét 3.2. Nếu lấy trung bình k giá trị quan sát độc lập của XRthì: n x + n x + + n x X = 1 1 2 2 k k , k n = n n i=1 i n1 n2 nk = x1 + x2 + + xk P n n n n = x f + x f + + x f , f = i , i = 1,k 1 1 2 2 k k i n Khi n đủ lớn: X ≈ x1p1 + x2p2 + + xkpk = E(X) (Đinh nghĩa xác suất theo thống kê) Ý Nghĩa 3.1. Từ định nghĩa và qua nhận xét trên ta rút ra ý nghĩa của kỳ vọng như sau: Kỳ vọng là giá trị trung bình của đại lượng ngẫu nhiên đó. Tính Chất 3.3. i) E(C)= C (C là hằng số) ii) E(CX)= CE(X) iii) E(X + Y )= E(X)+ E(Y ) iv) Nếu X và Y là hai đại lượng ngẫu nhiên độc lập (2 biến cố X < x , Y <y độc lập x, y) thì E(XY )= E(X)E(Y ). { } { } ∀ i ϕ(xi)pi với X rời rạc v) Nếu Y = ϕ(X) thì E(Y )= + ∞ ϕ(x)f(x)dx với X liên tục P−∞ Ví Dụ 3.7. Cho bảng phân phối xácR suất của X là: X 0 1 2 P 0,56 0,38 0,06 a. Tính E(X); b. Tính E(Y ) với Y = 500X. 1 với x (1;2), Ví Dụ 3.8. Giả sử đại lượng ngẫu nhiên X có hàm mật độ f(x)= x2 ∈ ( 0 vix (1;2). 6∈ 1 a. Tính E(X); b. Tính E(Y ) với Y = X3 . − X Khoa Giáo Dục Đại Cương 17 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN 3.3.2 Phương sai Định Nghĩa 3.4. Phương sai của đại lượng ngẫu nhiên X, ký hiệu là D(X) hoặc V(X) và được xác định như sau: 2 2 i(xi µ) pi với X rời rạc D(X)= E[(X E(X)) ]= + − − ∞(x µ)2f(x)dx với X liên tục, P−∞ − ở đây µ = E(X). R Nhận Xét 3.3. Trong thực tế người ta hay dùng công thức sau để tính phương sai của đại lượng ngẫu nhiên X. 2 2 2 2 i xi pi D(X)= E(X ) [E(X)] , với E(X )= + − ∞ x2f(x)dx P−∞ Công thức trên được suy ra từ định nghĩa phương sai. ThậtR vậy: D(X) = E[(X E(X))2] = E(X2 − 2XE(X) + [E(X)]2) − = E(X2) 2E[XE(X)] + E[E(X)]2 = E(X2) − 2E(X)E(X) + [E(X)]2 = E(X2) − [E(X)]2 − Ý Nghĩa 3.2. Ta thấy, X E(X) là sai số của X so với trung bình nó, do đó phương sai E[(X E(X))2] chính là trung− bình của bình phương sai số đó và được gọi tắt là phương sai. Nó− đo mức độ phân tán của đại lượng ngẫu nhiên quanh giá trị trung bình. Nghĩa là phương sai nhỏ thì độ phân tán nhỏ nên độ tập trung lớn và ngược lại. Trong kỹ thuật phương sai đặc trưng cho độ sai số của thiết bị, trong kinh doanh nó đặc trưng cho độ rủi ro của các quyết định, còn trong trồng trọt nó biểu thị cho mức độ ổn định của năng suất, Tính Chất 3.4. Phương sai có những tính chất sau i) D(C)=0 (C là hằng số) ii) D(CX)= C2D(X) iii) Nếu X và Y độc lập thì D(X Y )= D(X)+ D(Y ). Do đó D(X C)= D(X). ± ± Ví Dụ 3.9. Năng suất của 2 máy tương ứng là các đại lượng ngẫu nhiên X, Y (đơn vị: sản phẩm/phút) và có bảng phân phối xác suất: X 1 2 3 4 Y 2 3 4 5 P 0,3 0,1 0,5 0,1 P 0,1 0,4 0,4 0,1 Nếu phải chọn mua một trong 2 máy trên thì ta nên chọn mua máy nào? Khoa Giáo Dục Đại Cương 18 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Định Nghĩa 3.5. Độ lệch chuẩn của đại lượng ngẫu nhiên X, ký hiệu là σ(X) và được xác định như sau: σ(X)= D(X) Ví Dụ 3.10. Trọng lượng củap 1 loại sản phẩm là X (đơn vị kg), có hàm mật độ xác suất như sau: 3 (x2 1) với x [2; 4], f(x)= 16 − ∈ ( 0 vớix [2; 4]. 6∈ Tính trọng lượng trung bình và độ lệch chuẩn của X. 3.3.3 Mode và trung vị a. Mode của X: Định Nghĩa 3.6. Mode của ĐLNN X ký hiệu là ModX. Nếu X là đại lượng ngẫu nhiên rời rạc thì Mod(X) là giá trị của X ứng với xác suất lớn nhất. Hay: Mod(X)= xi pi =max p ,p ,p ⇔ { 1 2 3 } Nếu X là đại lượng ngẫu nhiên liên tục thì Mod(X) là giá trị làm cho hàm mật độ xác suất đạt giá trị lớn nhất. Hay: Mod(X)= c f(c)=max f(x), x R ⇔ { ∈ } Ví Dụ 3.11. Cho đlnn X rời rạc và có bảng phân phối xác suất như sau: X 0 1 3 4 6 P 0, 35 0, 15 0, 2 0, 14 0, 16 thì Mod(X)=0. Ví Dụ 3.12. Cho đlnn X liên tục và có đồ thị của hàm mật độ xác suất f(x) như sau: f(x) O a x thì lúc đó Mod(X)= a. b. Trung vị (Median): Là điểm m, ký hiệu là Med(X) thỏa: Khoa Giáo Dục Đại Cương 19 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN 1 1 P [X > m] và P [X 2 ≤ Nên F (1) = 0, 35 0, 5 và F (2) = 0,65 0, 5 do đó Med(X)=1 ≤ ≥ Ta có: X E(X) < 1 1 < X E(X) < 1 | − | ⇔ − | − | E(X) 1 <X<E(X)+1 ⇔ − Với E(X)= 1.0, 15+0.0, 2+1.0, 1+2.0, 35=0, 65 X E(X−) < 1 0, 65 1 <X< 0, 65+1 0, 35 <X< 1, 65 ⇒| − | ⇔ − ⇔ − Do đó: P [ X E(X) < 1] = P [0, 35 <X< 1, 65] = 0, 2+0, 3=0, 5 | − | 3.4 Các Quy Luật Phân phối Xác Suất Thông Dụng 3.4.1 Phân phối xác suất của đại lượng ngẫu nhiên rời rạc A. Phân phối nhị thức Bài toán: Giả sử X là số lần xuất hiện biến cố A trong dãy n phép thử Bernoulli với P (A)= p. Lập bảng phân phối xác suất của X. Giải: k k (n k) Ta thấy, X nhận các giá trị: 0, 1, 2, , n và P [X = k]= Pn(k)= Cnp q − . Từ nhị thức Newton: n k k (n k) k k (n k) (p+q) = ∞ C p q − cho p+q =1 thì ∞ C p q − =1 ∞ P [X = k]=1. k=0 n k=0 n ⇔ k=0 P P P Khoa Giáo Dục Đại Cương 20 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Định Nghĩa 3.7. Phân phối nhị thức là phân phối của đại lượng ngẫu nhiên rời rạc X nhận n +1 giá trị 0, 1, 2, , n với xác suất tương ứng là k k n k Pk = P [X = k]= C p (1 p) − , (k = 0, n) n − Phân phối nhị thức được ký hiệu là X ∼ B(n; p). Các Đặc Trưng 3.1. E(X)= np, D(X)= npq, Mod(X)= x với np q x np+p. 0 − ≤ 0 ≤ Ví Dụ 3.14. Một xí nghiệp có 12 máy hoạt động độc lập. Xác suất để 1 máy bất kỳ hoạt động tốt trong ngày là 0,95. Hãy tính xác suất để trong ngày có 9 máy hoạt động tốt. Ví Dụ 3.15. Một người mỗi ngày đi bán hàng ở 10 địa điểm khác nhau. Xác suất bán được hàng ở mỗi nơi là 0,3. a. Tìm xác suất người đó bán được hàng trong 1 ngày. b. Mỗi năm người đó đi bán hàng 300 ngày, tìm số ngày bán được hàng nhiều khả năng nhất trong 1 năm. B. Phân phối siêu bội Bài toán: Giả sử một tập hợp có N phần tử, trong đó NA phần tử có tính chất A. Từ tập hợp trên lấy n phần tử. Gọi X là số phần tử có tính chất A lẫn trong n phần tử này. Lập luật phân phối của X? NA NA k n N Giải: Ta nhận thấy X có thể nhận các giá trị 0, 1, 2, , n ta sẽ tính xác suất để trong n phần tử lấy ra có k phần tử có tính chất A (n k phần tử không có tính chất A). Nghĩa là X − nhận giá trị bằng k. Lấy n phần tử từ tập N phần tử có Cn cách. ◦ N Lấy n phần tử trong đó có k phần tử mang tính chất A được thành 2 giai đoạn: ◦ k Gđ1: Lấy k phần tử có tính chất A từ NA phần tử có CNA cách. Khoa Giáo Dục Đại Cương 21 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN n k − Gđ2: Lấy n k phần tử không có tính chất A từ N NA phần tử có CN NA cách. k − n k − − − Suy ra có CNA .CN NA cách lấy được k phần tử có tính chất A. − k n k − CNA .CN NA − Vậy nên Pk = P [X = k]= n . CN Ta có bảng phân phối xác suất của X: X 0 1 k n 0 n 1 n 1 k n k n 0 − − CNA CN NA CNA CN NA CNA CN NA CNA CN NA − − − − P n n n n CN CN CN CN Qua bài toán trên ta đinh nghĩa phân phối siêu bội như sau: Định Nghĩa 3.8. Phân phối siêu bội là phân phối của đại lượng ngẫu nhiên rời rạc X nhận các giá trị 0, 1, 2, , n với xác suất tương ứng là: k n k − CNA .CN NA − Pk = P [X = k]= n CN Phân phối siêu bội được ký hiệu là X ∼ H(N, NA, n). N n NA N n Các Đặc Trưng 3.2. E(X)= np, D(X)= npq − với p = , q =1 p và − N 1 N − N 1 là hệ số hiệu chỉnh. − − Ví Dụ 3.16. Một sọt cam có 100 quả, trong đó có 10 quả bị hư. Tính xác suất để trong 8 quả lấy ra có 5 quả hư. Định Lí 3.1 (Định lí liên hệ giữa phân phối siêu bội với phân phối nhị thức). Nếu NA X ∼ H(N, NA, n), N và p (p =0,p = 1) thì X B(n; p). −→ ∞ N −→ 6 6 −→ C. Phân phối Poisson Bài toán: Gọi X là số lần xuất hiện biến cố A tại những thời điểm ngẫu nhiên trong khoảng thời gian (t1, t2) thỏa mãn: + Số lần xuất hiện biến cố A trong khoảng thời gian (t1, t2) không ảnh hưởng tới xác suất xuất hiện A trong khoảng thời gian kế tiếp. + Số lần xuất hiện biến cố A trong khoảng thời gian (t1, t2) tỉ lệ với độ dài của khoảng thời gian đó. Khi đó X có phân phối Poisson, kí hiệu X ∼ P (λ) với λ = c(t t ), c gọi 2 − 1 là cường độ xuất hiện biến cố A. Định Nghĩa 3.9. Phân phối Poisson với tham số λ (λ > 0) là luật phân phối của đại lượng ngẫu nhiên rời rạc X, nhận các giá trị nguyên không âm 0, 1, 2, , k, với xác suất tương ứng là: e λ.λk P = P [X = k]= − , k =0, 1, k k! Ký hiệu là X ∼ P (λ). Khoa Giáo Dục Đại Cương 22 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Các Đặc Trưng 3.3. E(X)= D(X)= λ, Mod(X)= x với λ 1 x λ. 0 − ≤ 0 ≤ Ví Dụ 3.17. Số khách đến mua hàng tại một quầy hàng là ngẫu nhiên, độc lập; trung bình cứ 3 phút có 1 người. Tính xác suất trong 30 giây có 2 khách đến mua hàng. ~ Xấp xỉ phân phối nhị thức bằng phân phối Poisson: Định Lí 3.2. Xn ∼ B(n; p). Nếu số phép thử n và xác suất P (A) 0 sao cho → ∞ → np = λ thì Xn p(λ). → Ý Nghĩa 3.3. i) Trong thực hành khi X ∼ B(n, p) với n khá lớn, p khá bé (sao cho x λ λ npq np) thì P [X = x] e− với λ = np ' ' x! ii) Vì n lớn, p rất bé nên từ định lí trên người ta còn nói luật phân phối Poisson là luật phân phối của biến cố hiếm. 3.4.2 Phân phối xác suất của đại lượng ngẫu nhiên liên tục A. Phân phối chuẩn Định Nghĩa 3.10. Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với tham số µ và σ2 (σ > 0), ký hiệu X ∼ N(µ, σ2) nếu hàm mật độ xác suất của nó có dạng: 1 (x−µ)2 f(x)= e− 2σ2 , x R σ√2π ∀ ∈ + f(x) là hàm mật độ xác suất vì f(x) 0 và ∞ f(x)dx =1. ≥ −∞ R Đồ thị của f(x) có dạng hình chuông, trục đối xứng x = µ, các điểm uốn (µ 1 ± σ; ), nhận trục hoành làm tiệm cận ngang. σ√e2π f(x) Đồ thị: 1 σ√2π 1 σ√e2π O µ σ µ µ + σ x − 2 x 1 x (t−µ) Hàm phân phối xác suất của X có dạng: F (x)= f(t)dt = e− 2σ2 dt −∞ σ√2π −∞ R R Khoa Giáo Dục Đại Cương 23 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN và không biểu diễn được thành hàm sơ cấp. Đồ thị có tâm đối xứng (µ;0, 5) như hình vẽ: F (x) 1 0, 5 O µ x Các Đặc Trưng 3.4. Mod(X)=Med(X)=µ; E(X)= µ; D(X)= σ2; σ(X)= σ. Định Nghĩa 3.11. Phân phối chuẩn có kỳ vọng bằng 0 và phương sai bằng 1 được gọi là phân phối chuẩn tắc, ký hiệu X ∼ N(0, 1). Khi đó, hàm mật độ xác suất (hàm Laplace) 1 x2 của X có dạng: ϕ(x)= e− 2 √2π ϕ(x) 1 √2π 1 √e2π Φ( x) 1 1 1 Φ(x) − − − x O x x − Hàm phân phối xác suất (hàm Gauss) của X lúc này ký hiệu Φ(x) được xác định bởi: x 1 x t2 Φ(x)= ϕ(t)dt = e− 2 dt và có tâm đối xứng (0;0, 5). −∞ √2π −∞ Đồ thị: R R Φ(x) 1 Φ(x) 0, 5 O x Hàm phân phối Φ(x) có tính chất: Φ(x)+Φ( x)=1 Φ( x)=1 Φ(x). Giá trị của ϕ(x) và Φ(x) được cho sẵn ở bảng− Phụ lục⇔ 1 và− Phụ lục− 2. ? Tính xác suất cho phân phối chuẩn tắc: B Nếu X ∼ N(0, 1) thì P [a a] = 2(1 Φ(a)). | | − | | − Khoa Giáo Dục Đại Cương 24 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN B uα gọi là phân vị mức α của phân phối chuẩn tắc X nếu 1 Φ(uα)= P [X uα]=1 α,P [ X u1 α ]= α − | | − 2 − | | − 2 Ví Dụ 3.18. Cho X ∼ N(0, 1). Tính P [ 0, 25 1, 3]. − X µ ? Tính xác suất cho phân phối chuẩn tổng quát: Nếu X ∼ N(µ; σ2) thì Y = − ∼ σ N(0, 1). X µ Nghĩa là, nếu X có phân phối chuẩn với kỳ vọng µ và phương sai σ2 thì Y = − có σ phân phối chuẩn tắc. 1 µ X µ a µ X µ a µ Đặt a = , b = thì − ∼ N(0, 1) và do a<X<b − < − < − σ −σ σ ⇔ σ σ σ nên từ công thức tính xác suất cho phân phối chuẩn tắc ta suy ra: b µ a µ X ∼ N(µ, σ2) P [a<X<b]=Φ( − ) Φ( − ) ⇒ σ − σ ? Quy tắc 2 - xichma (2σ) và 3 - xichma (3σ): 2 uα B Khi X ∼ N(µ, σ ) thì P [ X µ <uα] = 2Φ( ) 1. | − | σ − Thật vậy: uα X µ uα uα uα uα P [ X µ <uα]= P [ < − < ]=Φ( ) Φ( ) = 2Φ( ) 1, uα | − | − σ σ σ σ − − σ σ − ∀ Cho uα = 2σ thì P [ X µ < 2σ] = 2Φ(2) 1 = 95, 44%: nghĩa là trên 95% giá trị ◦ | − | − của X nằm trong khoảng (µ 2σ; µ +2σ). − Cho uα =3σ thì P [ X µ < 3σ] = 2Φ(3) 1=99, 74%: cũng như trên ta thấy gần ◦ | − | − 100% giá trị của X nằm trong khoảng (µ 3σ; µ +3σ). − Khoa Giáo Dục Đại Cương 25 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Ý nghĩa của quy tắc là: “Trong thực hành đại lượng ngẫu nhiên X dù chưa biết phân phối◦ xác suất nhưng nếu thỏa quy tắc 2σ hoặc 3σ thì ta coi như X có phân phối chuẩn. Mặt khác, quy tắc này cũng rất hay được dùng trong thống kê phần ước lượng và kiểm định giả thiết”. Ví Dụ 3.19. Thời gian X (tính bằng phút) của một khách hàng chờ để được phục vụ tại một quầy hàng là đại lượng ngẫu nhiên với X ∼ N(4;1, 21). a. Tính tỉ lệ khách hàng phải chờ để phục vụ từ 3,5 phút đến 5 phút; quá 6 phút. b. Thời gian phải chờ tối thiểu là bao nhiêu, nếu không để quá 5% khách hàng phải chờ phục vụ vượt quá thời gian đó. Ví Dụ 3.20. Một doanh nghiệp cần mua một loại trục máy có đường kính từ 1,18cm đến 1,22cm. Có hai nhà máy bán loại trục máy này và đường kính của các loại trục máy được sản xuất ra là đại lượng ngẫu nhiên có phân phối chuẩn với các số đặc trưng cho trong bảng: Đường kính trung bình (cm) Độ lệnh chuẩn Giá bán Nhà máy 1 1,2 0,01 3triệu/1hộp/100chiếc Nhà máy 2 1,2 0,015 2,7triệu/1hộp/100chiếc Vậy doanh nghiệp nên mua trục máy của nhà máy nào? Giải: Gọi Xi (i =1, 2) là đường kính trục máy do nhà máy i sản xuất. Tỉ lệ trục máy của các nhà máy sản xuất ra thỏa mãn yêu cầu doanh nghiệp là: 1, 22 1, 2 1, 18 1, 2 P [1, 18 X 1, 22] = Φ( − ) Φ( − ) ≤ 1 ≤ 0, 01 − 0, 01 = 2Φ(2) 1=2.0, 9773 1=95, 44% − − 1, 22 1, 2 1, 18 1, 2 P [1, 18 X 1, 22] = Φ( − ) Φ( − ) ≤ 2 ≤ 0, 015 − 0, 015 = 2Φ(1, 33) 1=2.0, 9082 1=81, 74%. Như vậy số− trục máy sử dụng− được khi mua của các nhà máy và số tiền chi cho 1 trục máy sử dụng được của: 3000000 + Nhà máy 1: 100.0, 9544 = 95, 44 chiếc với giá 31, 433 đồng. 95, 44 ' 2700000 + Nhà máy 2: 100.0, 8174 = 81, 74 chiếc với giá 33, 031 đồng. 82, 74 ' Vậy nên mua sản phẩm của nhà máy 1. B Khi X ∼ N(0, 1) thì P [ X <uα] = 2Φ(uα) 1. | | − Thật vậy: P [ X <uα]= P [ uα <X<uα] = 2Φ(uα) 1 | | − − Cho uα =1 thì P [ X < 1] = 2Φ(1) 1=0, 68 ◦ | | − Khoa Giáo Dục Đại Cương 26 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Cho uα =1, 96 thì P [ X 0, n n − 2 2 Γ( ) 2 ∞ x 1 t ở đây Γ(x)= 0 t − e− dt là hàm Gamma. R f(x) O x Để thấy phân phối χ2(n) xuất phát từ phân phối chuẩn người ta còn định nghĩa: 2 n 2 “X ∼ χ (n) nếu X = i=1 Xi với Xi độc lập, Xi ∼ N(0, 1) (Tổng bình phương các phân phối chuẩn tắc độc lập)”. P 2 2 Phân vị khi bình phương, n bậc tự do, mức α là số χ(n,α) sao cho P [X < χ(n,α)] = α. 2 Giá trị χ(n,α) là vị trí cạnh phải sao cho diện tích hình thang cong là α cho trước như hình vẽ. Khoa Giáo Dục Đại Cương 27 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN f(x) 2 x O χ(n,α) Các Đặc Trưng 3.5. Ta có E(X)= n; D(X)=2n X n Tính Chất 3.5. i) − N(0, 1) (định lí giới hạn trung tâm) √2n −→ ii) Nếu X ∼ χ2(n), Y ∼ χ2(m) và X,Y độc lập thì X + Y ∼ χ2(n + m). Tính toán xác suất cho phân phối này cho trong bảng Phụ lục 3. C. Phân phối Student T (n) (với n bậc tự do) Định Nghĩa 3.13. Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối Student với n bậc tự do, ký hiệu X ∼ T (n) nếu hàm mật độ xác suất có dạng: n+1 2 1 Γ( ) x n+1 2 2 R f(x)= n (1 + )− , x √πn Γ( 2 ) n ∀ ∈ với Γ(x) là hàm Gamma. Do hàm mật độ là hàm chẵn nên đồ thị đối xứng qua trục tung. Khi bậc tự do tăng thì phân phối Student hội tụ rất nhanh về phân phối chuẩn tắc N(0;1). Nên khi n đủ lớn (n 30) ta có thể xấp xỉ phân phối Student bằng phân phối chuẩn tắc. Tuy nhiên khi n nhỏ≥ (n< 30) việc xấp xỉ như vậy sẽ gặp sai số lớn. f(x) Phân phối chuẩn Phân phối Student O x Khoa Giáo Dục Đại Cương 28 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Đồ thị hình chuông tương tự như đồ thị của phân phối chuẩn nhưng có đỉnh thấp hơn và hai phần đuôi cao hơn. Để thấy phân phối Student xuất phát từ phân phối chuẩn và phân phối χ2(n) người ta Z còn định nghĩa: “X ∼ T (n) nếu X = với Z ∼ N(0, 1); Y ∼ χ2(n); X,Y độc lập” √Y n Phân vị Student, n bậc tự do, mức α là số t(n,α) sao cho P [X 1); D(X)= (với n> 2). n +2 Tính Chất 3.6. Xn ∼ T (n) thì Xn N(0, 1). Khi thực hành n 30 thì Xn N(0, 1). −→ ≥ ' 3.5 Định Lí Giới Hạn Trung Tâm Định Lí 3.3. Nếu dãy X1,X2,X3, , Xn, các đại lượng ngẫu nhiên độc lập có cùng n 2 k=1 Xk nµ phân phối xác suất và M(Xn)= µ; D(Xn)= σ , n thì: Sn = − N(0, 1) ∀ σ√n −→ P 1 x t2 2 Nghĩa là: limn FSn (x)= e− dt. →∞ √2π −∞ R Như vậy với n đủ lớn (n 30) thì phân phối xác suất của Sn xấp xỉ phân phối chuẩn ≥ tắc, ký hiệu Sn N(0, 1). ' Ý Nghĩa 3.4. Nếu X1,X2, , Xn độc lập cùng phân phối với n đủ lớn, ta có: n 2 i) X = Xk N(nµ; nσ ) k=1 ' P Khoa Giáo Dục Đại Cương 29 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN n X σ2 ii) X = k=1 k N(µ; ) n ' n Thật vậy: P 2 2 σ σ X = σ√n.Sn + nµ N(nµ; nσ ) và X = Sn + µ N(µ; ). ' √n ' n Qua đó ta thấy: “Tổng của một số rất lớn đại lượng ngẫu nhiên độc lập cùng phân phối mà sự đóng góp của mỗi thành phần trong tổng đó rất nhỏ thì tổng sẽ có phân phối xác suất xấp xỉ phân phối chuẩn”. Ví Dụ 3.22. Trọng lượng của một loại sản phẩm là đại lượng ngẫu nhiên có trung bình 50g, độ lệch chuẩn 10g. Các sản phẩm được đóng thành hộp, mỗi hộp 100 sản phẩm. Hộp có trọng lượng trên 4,58kg là đạt chuẩn. Tính tỉ lệ hộp đạt chuẩn. ~ Xấp xỉ phân phối nhị thức bằng phân phối chuẩn: Định Lí 3.4 (Định lí giới hạn địa phương Moivre - Laplace). Gọi Pn(k) là xác suất xuất hiện k lần biến cố A trong dãy n phép thử Bernoulli với P (A)= p, p không quá gần 0 và cũng không quá gần 1 thì: √npq.Pn(k) lim =1 f(xk) 1 x2 k np Với f(x)= e− 2 , q =1 p, xk = − hữu hạn. √2π − √npq X np Định Lí 3.5 (Định lí giới hạn Moivre - Laplace). Giả sử X B(n; p) và Sn = − ∼ √npq thì Sn N(0, 1). −→ Ý Nghĩa 3.5. Trong thực hành khi X B(n; p) với n đủ lớn, p không quá lớn, cũng ∼ không quá bé thì: 1 k np 1 x2 P [X = k] f(xk) với xk = − , f(x)= e− 2 ◦ ' √npq √npq √2π k2 np k1 np P [k1 X 5 và ≥ ≥ ≥ p 1 p 1 − < 0, 3 1 p − p √n r r − ii) Khi sử dụng công thức, để giảm sai số ta cần có sự hiệu chỉnh: k2 np 0, 5 k1 np 0, 5 P [k1 X<k2]=Φ( − − ) Φ( − − ) ≤ √npq − √npq Khoa Giáo Dục Đại Cương 30 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Các biến cố [a X b]; [a 20 và X ∼ P (λ) thì ta coi X N(0, 1). ' 3.6 Véctơ Ngẫu Nhiên - Đại Lượng Ngẫu Nhiên 2 Chiều 3.6.1 Hàm phân phối xác suất của đại lượng ngẫu nhiên 2 chiều a. Khái niệm đại lượng ngẫu nhiên 2 chiều: Đại lượng ngẫu nhiên 2 chiều là cặp (X,Y ) với X và Y là các đại lượng ngẫu nhiên. Nếu X và Y đều rời rạc (liên tục) thì ta gọi đại lượng ngẫu nhiên 2 chiều (X,Y ) là rời rạc (liên tục). Ở đây ta chỉ xét trường hợp cả X và Y đều rời rạc hoặc đều liên tục. b. Hàm phân phối xác suất: Khoa Giáo Dục Đại Cương 31 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN Định Nghĩa 3.14. Hàm phân phối xác suất của đại lượng ngẫu nhiên 2 chiều (X,Y ) hay hàm phân phối đồng thời của X và Y là hàm 2 biến được xác định như sau: F (x, y)= P [X < x; Y <y], x, y R. ∀ ∈ Tính Chất 3.7. Cũng như trường hợp 1 chiều, hàm phân phối xác suất F (x, y) có các tính chất sau: i) 0 F (x, y) 1, x, y R. ≤ ≤ ∀ ∈ ii) F (x, y) không giảm theo từng biến số (nghĩa là nếu biến này là hằng số thì hàm không giảm đối với biến kia và ngược lại). iii) F ( , ) = 0; F (+ , + )=1 và F (x, + )= FX (x); F (+ ,y)= FY (y). −∞ −∞ ∞ ∞ ∞ ∞ iv) P [x1 <X<x2; y1 <Y <y2]= F (x1,y1)+ F (x2,y2) (F (x1,y2)+ F (x2,y1)). Khi đó xác suất của (X,Y ) nhận giá trị là diện tích hình chữ nhật− ABCD như hình vẽ. y D C y1 y2 A B O x1 x2 x Định Nghĩa 3.15. Hai đại lượng ngẫu nhiên X, Y gọi là độc lập nếu F (x, y) = FX (x).FY (y), x, y R. ∀ ∈ Nhận Xét 3.4. Nếu X, Y độc lập thì hàm phân phối đồng thời của X và Y được xác định qua các hàm phân phối của X và của Y . 3.6.2 Phân phối xác suất của đại lượng ngẫu nhiên 2 chiều a. Với đại lượng ngẫu nhiên 2 chiều rời rạc: Định Nghĩa 3.16. Bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều rời rạc (X,Y ) còn gọi là bảng phân phối đồng thời của X và Y , được cho như sau: HH H Y H y1 y2 ym p(xi) X HH x1 p11 p12 p1m p(x1) x2 p21 p22 p2m p(x2) xn pn1 pn2 pnm p(xn) q(yj) q(y1) q(y2) q(ym) 1 Khoa Giáo Dục Đại Cương 32 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN n m Trong đó, pij = P [X = xi,Y = yj] và i=1 j=1 pij =1. Qua bảng phân phối xác suất của (X,Y ), ta có: P P 1. F (x, y)= xi<x yj <y pij. 2. Các phânP phối biên:P X x x x . Của X: 1 2 n P p(x1) p(x2) p(xn) m với p(xi)= j=1 pij (cộng theo dòng i) Y y y y . Của Y : P 1 2 m P p(y1) p(y2) p(ym) n với q(yj)= i=1 pij (cộng theo cột j) 3. X và Y độcP lập pij = p(xi)q(yj), i, j. ⇔ ∀ 4. Phân phối có điều kiện: X x1 x2 xn . Của X với điều kiện Y = yj: P [X Y = yj] p1 yj p2 yj pn yj | | | | P [X = xi,Y = yj] pij Trong đó, pi yj = P [X = xi Y = yj]= = , (i = 1, n) | | P [Y = yj] q(yj) Y y1 y2 ym . Của Y với điều kiện X = xi: P [Y X = xi] q1 xi q2 xi Pm xi | | | | P [X = xi,Y = yj] pij Trong đó, qj xi = P [Y = yj X = xi]= = , (j = 1, m) | | P [X = xi] p(xi) 5. Kỳ vọng có điều kiện: . Kỳ vọng của X với điều kiện Y = yj, ký hiệu E[X Y = yj] và được tính như sau: | n n E[X Y = yj]= xiP [X = xi Y = yj]= xipi yj | | | i=1 i=1 X X . Kỳ vọng của Y với điều kiện X = xi, ký hiệu E[Y X = xi] và được tính như sau: | m m E[Y X = xi]= yjP [Y = yj X = xi]= yjqj xi | | | i=1 j=1 X X n m 6. E[ϕ(X,Y )] = i=1 j=1 ϕ(xi,yj)pij. Ví Dụ 3.24. NgườiP ta thốngP kê dân số của một vùng theo 2 chỉ tiêu: Giới tính (X) và học vấn (Y ) được kết quả như sau: H H Y HH Thất học: 0 Phổ thông: 1 Đại học: 2 X HH Nam: 0 0,12 0,24 0,15 Nữ: 1 0,13 0,22 0,14 Khoa Giáo Dục Đại Cương 33 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN a. Lập bảng phân phối xác suất của học vấn; của giới tính. b. Học vấn có độc lập với giới tính hay không? c. Tìm xác suất để lấy ngẫu nhiên một người thì người đó không bị thất học. d. Lập bảng phân phối xác suất học vấn của nữ; tính trung bình học vấn của nữ. Giải: a. Bảng phân phối xác suất của X và của Y . X 0 1 Y 0 1 2 P 0, 51 0, 49 P 0, 25 0, 46 0, 29 b. Do p11 = P [X =0,Y =0]=0, 12 và P [X = 0].P [Y =0]=0, 51.0, 25=0, 1275. Suy ra p = P [X = 0].P [Y = 0] nên học vấn không độc lập với giới tính. 11 6 c. Ta có: P [X 0,Y > 0] = xi 0 yj >0 pij =0, 24+0, 22+0, 15+0, 14=0, 75 ≥ ≥ =1 P [X 0,Y = 0] P− P≥ d. Lập bảng phân phối của Y với điều kiện X =1. Ta có: P [X =1]=0, 49 P [X =1,Y = 0] p 0, 13 Do đó: P [Y =0 X =1]= = 21 = =0, 2653 | P [X = 1] P [X = 1] 0, 49 P [X =1,Y = 1] p 0, 22 Và: P [Y =1 X =1]= = 22 = =0, 449 | P [X = 1] P [X = 1] 0, 49 P [X =1,Y = 2] p 0, 16 P [Y =2 X =1]= = 23 = =0, 2857 | P [X = 1] P [X = 1] 0, 49 Y 0 1 2 Bảng phân phối điều kiện: P [Y X = 1] 0,2653 0,449 0,2857 | b. Với đại lượng ngẫu nhiên 2 chiều liên tục: Giả sử (X,Y ) là đại lượng ngẫu nhiên liên tục 2 chiều có hàm phân phối xác suất F (x, y) liên tục và có đạo hàm hỗn hợp cấp hai liên tục (trừ một số hữu hạn đường cong) ∂2F (x, y) nếu với (x, y) Định Nghĩa 3.17. Ta gọi f(x, y)= ∂x∂y ∃ 0 nếu @ là hàm mật độ của đại lượng ngẫu nhiên liên tục 2 chiều (X,Y ). D D R2 x y Khi đó, P [(X,Y ) ]= D f(x, y)dxdy với và F (x, y)= f(x, y)dxdy ∈ ⊂ −∞ −∞ Tính Chất 3.8. Từ địnhRR nghĩa hàm mật độ f(x, y) ta suy ra các tínhR chấtR sau: Khoa Giáo Dục Đại Cương 34 Xác Suất Và Thống Kê
- CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN + + i) f(x, y) 0; ∞ ∞ f(x, y)dxdy =1. ≥ −∞ −∞ R R + + ii) Hàm mật độ của X: fX (x)= ∞ f(x, y)dy; của Y : fY (y)= ∞ f(x, y)dx. −∞ −∞ R R iii) X và Y độc lập f(x, y)= fX (x).fY (y) ⇔ iv) Hàm phân phối có điều kiện: . Của X với điều kiện Y = y, ký hiệu F (x y) và được định nghĩa | F (x y)= P [X 0. | −∞ fY (y) . Của Y với điềuR kiện X = x, ký hiệu F (y x) và được định nghĩa tương tự | F (y x)= P [X = x Y 0. | −∞ fX (x) R 3.6.3 Hệ Số Tương Quan Định Nghĩa 3.18. Hệ số tương quan của X,Y ký hiệu ρ(X,Y ) và được xác định bởi: cov(X,Y ) E[XY ] E[X]E[Y ] ρ(X,Y ) = = − D(X) D(Y ) D(X) D(Y ) Tính Chất 3.9. Hệ số tươngp quan cóp những tínhp chất sau:p i) ρ = ρ ; a,b,c,d R, ac =0 | (aX+b,cY +d)| | (X,Y )| ∀ ∈ 6 ii) ρ 1 | (X,Y )| ≤ iii) ρ X,Y =1 X,Y có sự liên hệ tuyến tính | ( )| ⇔ iv) Nếu X,Y độc lập thì ρ =0 | (X,Y )| Khoa Giáo Dục Đại Cương 35 Xác Suất Và Thống Kê
- Chương 4 LÝ THUYẾT MẪU 4.1 Mẫu Ngẫu Nhiên 4.1.1 Khái niệm tổng thể và mẫu Tập hợp gồm tất cả những phần tử mà ta cần khảo sát gọi là tổng thể. Số phần tử của tổng thể thì được gọi là kích thước của tổng thể. Từ tổng thể người ta kiểm tra, quan sát trên một nhóm n phần tử đại diện gọi là mẫu. n gọi là kích thước của mẫu. 4.1.2 Các phương pháp chọn mẫu - Lấy mẫu có hoàn lại: Chọn ngẫu nhiên từ tổng thể ra một phần tử để kiểm tra, ghi lại các thông tin đặc trưng cần thiết của phần tử đó, rồi trả nó trở lại tổng thể trước khi chọn tiếp ngẫu nhiên lần sau. Khi đó kết quả ở các lần chọn độc lập với nhau. - Lấy mẫu không hoàn lại: Tương tự như trên, chỉ khác ở chỗ là các phần tử được chọn ra sẽ không được trả lại tập ban đầu. Khi đó kết quả ở các lần chọn phụ thuộc nhau nhưng nếu lấy ít từ tập có số phần tử rất lớn thì cũng có thể xem như độc lập. 36
- CHƯƠNG 4. LÝ THUYẾT MẪU 4.1.3 Mẫu ngẫu nhiên, mẫu cụ thể Định Nghĩa 4.1. Tiến hành n quan sát độc lập về đại lượng ngẫu nhiên X, gọi Xi là đại lượng ngẫu nhiên chỉ kết quả quan sát ở lần thứ i của X. Khi đó W = (X1,X2, , Xn) được gọi là mẫu ngẫu nhiên, n được gọi là cở mẫu (kích thước mẫu). Như vậy mẫu ngẫu nhiên kích thước n thực chất là n đại lượng ngẫu nhiên độc lập X1,X2, , Xn được lập từ biến ngẫu nhiên X và có cùng luật phân phối với X. X được gọi là đại lượng ngẫu nhiên gốc ứng với tổng thể nghiên cứu. Kỳ vọng của đại lượng ngẫu nhiên gốc E(X) = µ còn gọi là trung bình của tổng thể và phương sai D(X)= σ2 gọi là phương sai của tổng thể. Ta gọi xi là giá trị thu được trong lần quan sát thứ i của Xi. Khi đó w =(x1, x2, , xn) gọi là một mẫu cụ thể mà mẫu ngẫu nhiên W nhận được. 4.1.4 Các đặc trưng mẫu a. Thống kê: Hàm của mẫu ngẫu nhiên T = T (X1,X2, , Xn) gọi là thống kê. Ví Dụ 4.1. Xét mẫu ngẫu nhiên (X1,X2, , Xn), ta có các thống kê. 1 + Trung bình của mẫu: X = n X n i=1 i 2 1 n 2 1 n 2 2 + Phương sai mẫu: S = P(Xi X) = X X n i=1 − n i=1 i − + Độ lệch mẫu: S = √S2 P P b. Các đặc trưng mẫu: Giả sử tổng thể X có E(X) = µ, D(X) = σ2 và p là tỉ lệ. Các số đặc trưng của X gọi là các số đặc trưng lí thuyết (các số này ta chưa biết và đang cần tìm chúng). Cho mẫu ngẫu nhiên W =(X1,X2, , Xn) được rút từ đại lượng ngẫu nhiên gốc X. 1 Trung bình mẫu ngẫu nhiên X: là thống kê được xác định bởi X = n X , nó nhận n i=1 i giá trị bằng trung bình mẫu cụ thể. P Kỳ vọng và phương sai: 1 1 E(X)= E( n X )= n E(X )= E(X)= µ (vì E(X )= E(X)) n i=1 i n i=1 i i 1 1 nD(X) σ2 D(X)= D( P n X )= P n D(X )= = n i=1 i n2 i=1 i n2 n 2 2 1 n 2 Phương sai mẫuP ngẫu nhiên SP: là thống kê được xác định bởi S = (Xi X) , n i=1 − nó nhận giá trị bằng phương sai mẫu cụ thể. P Khoa Giáo Dục Đại Cương 37 Xác Suất Và Thống Kê
- CHƯƠNG 4. LÝ THUYẾT MẪU 2 1 n 2 1 n 2 n 1 2 Kỳ vọng: E(S )= E(Xi X) = E[(Xi µ) (X µ)] = − σ n i=1 − n i=1 − − − n . Thống kê S = √S2 Pgọi là độ lệch chuẩn mẫuP ngẫu nhiên. 2 2 1 n 2 Phương sai mẫu điều chỉnh S0 : là thống kê được xác định S0 = (Xi X) , n 1 i=1 − − nó nhận giá trị bằng phương sai điều chỉnh mẫu cụ thể. P 2 n 2 n n 1 2 2 Kỳ vọng: E(S0 )= E(S0 )= − σ = σ n 1 n 1 n 2− − . Thống kê S0 = √S0 gọi là độ lệch chuẩn mẫu điều chỉnh. 1 Tỉ lệ mẫu ngẫu nhiên F : là thống kê được xác định bởi F = n X , X nhận giá trị n i=1 i i là 0 hoặc 1. Nó nhận giá trị bằng tỉ lệ mẫu cụ thể. P p(1 p) Kỳ vọng và phương sai: E(F )= p, D(F )= − n 2 Qua đó ta nhận thấy về mặt trung bình thì X,S0 đúng bằng kỳ vọng và phương sai của tổng thể. c. Phân phối xác suất của các đặc trưng mẫu: Tổng thể X có phân phối chuẩn X N(µ, σ2): • ∼ σ2 X N(µ, ) ◦ ∼ n X µ U = − √n N(0, 1) ◦ σ ∼ X µ T = − √n T (n 1) khi n< 30 và σ chưa biết. ◦ S0 ∼ − 2 nS 1 n 2 n Xi µ 2 2 K = = (Xi µ) = ( − ) χ (n) ◦ σ2 σ2 i=1 − i=1 σ ∼ P P n 1 2 2 K = − S0 χ (n 1) khi µ chưa biết. ◦ σ2 ∼ − Tổng thể X không có phân phối chuẩn: • X µ X µ Vì − √n N(0, 1) và − √n N(0, 1) nên với n đủ lớn (n 30), ta có các σ −→ S0 −→ ≥ phân phối xấp xỉ chuẩn sau đây: X µ σ2 Khi σ2 đã biết: − √n N(0, 1), X N(µ, ) ◦ σ ' ' n 2 X µ S0 Khi σ2 chưa biết: − √n N(0, 1), X N(µ, ) ◦ S0 ' ' n Khoa Giáo Dục Đại Cương 38 Xác Suất Và Thống Kê
- CHƯƠNG 4. LÝ THUYẾT MẪU F p p(1 p) Tương tự, do − N(0, 1) nên với np 5, n(1 p) 5 thì F N(p, − ). p(1 p) −→ ≥ − ≥ ' n − n r F (1 F ) Vì p chưa biết, với n đủ lớn thì F N(p, − ). ' n 4.2 Phương pháp tính tham số mẫu cụ thể Xét mẫu cụ thể w =(x1; x2; ; xn) là một giá trị của mẫu ngẫu nhiên W =(X1,X2, , Xn) Ta có: 1 + Trung bình mẫu cụ thể: x = n x n i=1 i 2 1 n 2 1 n 2 2 + Phương sai mẫu cụ thể: s = P (xi x) = x (x) n i=1 − n i=1 i − 2 n 2 + Phương sai điều chỉnh mẫu cụ thể:P s0 = s P n 1 + Độ lệch chuẩn mẫu cụ thể: s = √s2 − 2 + Độ lệch chuẩn mẫu điều chỉnh: s0 = √s0 Khoa Giáo Dục Đại Cương 39 Xác Suất Và Thống Kê
- Chương 5 ƯỚC LƯỢNG THAM SỐ 5.1 Ước Lượng Điểm 5.1.1 Bài toán ước lượng điểm Bài toán: Giả sử đại lượng ngẫu nhiên X có tham số θ (trung bình, tỷ lệ, phương sai, ) chưa biết. Dựa vào mẫu ngẫu nhiên W = (X1,X2, , Xn) ta xây dựng thống kê θ = θ(X1,X2, , Xn) rồi từ đó ước lượng cho θ chưa biết gọi là bài toán ước lượng điểm của θ. b b 5.1.2 Ước lượng không chệch Định Nghĩa 5.1. Thống kê θ được gọi là ước lượng không chệch của θ nếu: E(θ)= θ Ví Dụ 5.1. Từ mẫu tổng quátb W =(X1; X2), xét hai ước lượng của trung bìnhb tổng thể mu như sau: 1 1 1 2 X¯ = X + X ; X¯ = X + X 2 1 2 2 0 3 1 3 2 ¯ ¯ Chứng tỏ X và X0 là ước lượng không chệch của µ. 40
- CHƯƠNG 5. ƯỚC LƯỢNG THAM SỐ 5.2 Ước Lượng Khoảng 5.2.1 Khái niệm ước lượng khoảng Khoảng giá trị (θ1, θ2) của thông kê θ được gọi là khoảng tin cậy của tham số θ nếu với xác suất 1 α cho trước thì P [θ p>F u α − ] 1 2 1 2 1 2 − | | − − r n − − r n f(1 f) = P [F ε<p<F + ε] với ε = u α và nf 10, n(1 f) 10. 1 2 − − − r n ≥ − ≥ Vậy khoảng tin cậy cần tìm là (f ε; f + ε). − f(1 f) b. Các dạng toán liên quan: Xét khoảng tin cậy đối xứng, với ε = u α ta 1 2 − − r n có 3 bài toán liên quan: f(1 f) Bt1: Biết 1 α, n tìm độ chính xác ε = u α . 1 2 − − − r n Khoa Giáo Dục Đại Cương 41 Xác Suất Và Thống Kê
- CHƯƠNG 5. ƯỚC LƯỢNG THAM SỐ Bt2: Biết ε, n tìm độ tin cậy 1 α. − f(1 f) n Ta có ε = u1 α − u1 α = ε tra bảng có Φ(u1 α ). − 2 n ⇒ − 2 f(1 f) − 2 r r − Suy ra 1 α = 2Φ(u1 α ) 1. − − 2 − Bt3: Biết 1 α,ε tìm cở mẫu n0 hoặc cở mẫu cần điều tra thêm ∆n = n0 n. − − u1 α u1 α f(1 f) 2 2 2 Do ε = u1 α − √n = f(1 f) − nên n0 = f(1 f)( − ) +1. − 2 n ⇒ − ε − ε r p Chú ý: Giả sử N là kích thước của tổng thể. i) Với mẫu không hoàn lại có cở mẫu n> 0, 1N, ta cần dùng hệ số hiệu chỉnh: f(1 f) N n ε = u α . 1 2 − − − r n N 1 Khi đó, kích thước mẫu− cần điều tra là: α n1N u1 n = +1 với n = f(1 f)( − 2 )2 +1. n +(N 1) 1 − ε 1 − ii) Khi có khoảng ước lượng của tỉ lệ thì khoảng ước lượng cho số phần tử có tính chất f(1 f) f(1 f) đang nghiên cứu là: (Nf Nu α ; Nf + Nu α ) 1 2 − 1 2 − − − r n − r n Ví Dụ 5.2. Giám đốc 1 Ngân hàng muốn xác định số khách hàng gửi tiền tại ngân hàng được chi trả theo tuần, lấy mẫu ngẫu nhiên 120 khách thì có 40 người được trả theo tuần. a. Với độ tin cậy 90%, hãy ước lượng số khách hàng được chi trả theo tuần, biết ngân hàng có 2000 khách hàng. b. Nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tuần với độ tin cậy như ở trên và độ chính xác ε = 0, 05 thì cần kích thước mẫu là bao nhiêu? Giải trường hợp ngân hàng có 1000 khách. c. Với mẫu đã cho, nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tuần có độ chính xác ε =0, 05 thì độ tin cậy lúc đó là bao nhiêu? B. Ước lượng trung bình của tổng thể a. Giả sử tổng thể có trung bình µ chưa biết. Với độ tin cậy 1 α cho trước ta xây dựng khoảng tin cậy (µ ; µ ) để ước lượng cho µ sao cho P [µ <µ<µ− ]=1 α. 1 2 1 2 − Tùy thuộc vào đặc điểm của đại lượng ngẫu nhiên X đã biết phương sai hay chưa và kích thước mẫu n có lớn hay không mà ta có công thức xác lập nên khoảng tin cậy (µ1; µ2) khác nhau. Ta xét các trường hợp sau: Khoa Giáo Dục Đại Cương 42 Xác Suất Và Thống Kê
- CHƯƠNG 5. ƯỚC LƯỢNG THAM SỐ σ2 = D(X)= σ2 đã biết. Th1: 0 Cở mẫu n 30 hoặc n µ X > u1 α ] ⇔ − − − 2 √n − − 2 √n − 2 √n − − − 2 √n σ σ σ = P [X + u1 α >µ> X u1 α ]= P [X ε<µ< X + ε] với ε = u1 α . − 2 √n − − 2 √n − − 2 √n Vậy khoảng tin cậy cần tìm là (x ε; x + ε). − σ2 = D(X) chưa biết, ta thay σ = s . Th2: 0 Cở mẫu n 30 ≥ X µ Chọn thống kê U = − √n N(0, 1) để ước lượng trung bình. Trong đó S0 ' µ = M(X) chưa biết, n cở mẫu. X và S0 lần lượt là các thống kê nhận giá trị bằng trung bình và độ lệch điều chỉnh mẫu. Hoàn toàn tương tự, ta có: s0 Với ε = u1 α , khoảng tin cậy đối xứng (x ε; x + ε) − 2 √n − σ2 = D(X) chưa biết. Th3: Cở mẫu n< 30 X µ Chọn thống kê T = − √n T (n 1) để ước lượng trung bình. Trong đó S0 ' − µ = M(X) chưa biết, n cở mẫu. X và S0 lần lượt là các thống kê nhận giá trị bằng trung bình và độ lệch điều chỉnh mẫu. Do hàm mật độ của phân phối Student cũng là hàm chẵn nên tương tự Th1 ta có: s0 (x ε; x + ε) với ε = t(n 1,1 α ) − − − 2 √n s0 b. Các bài toán liên quan: Xét khoảng tin cậy đối xứng (x ε, x +ε) với ε = u1 α , − − 2 √n độ tin cậy 1 α, kích thước mẫu n và độ chính xác ε. Có 3 bài toán liên quan sau: − s0 Bt1: Biết 1 α, n tìm độ chính xác ε = u1 α . − − 2 √n Bt2: Biết ε, n tìm độ tin cậy 1 α. − s0 ε√n Ta có ε = u α u α = tra bảng có Φ(u α ). 1 2 1 2 1 2 − √n ⇒ − s0 − Khoa Giáo Dục Đại Cương 43 Xác Suất Và Thống Kê
- CHƯƠNG 5. ƯỚC LƯỢNG THAM SỐ Suy ra: 1 α = 2Φ(u1 α ) 1. − − 2 − Bt3: Biết 1 α,ε tìm cở mẫu n0 hoặc cở mẫu cần điều tra thêm ∆n = n0 n. − − s0 s0 s0 2 Ta có ε = u1 α √n0 = u1 α nên n0 = (u1 α ) +1; []: phần nguyên. − 2 √n ⇒ − 2 ε − 2 ε 0 σ s0 Với khoảng tin cậy có ε = u1 α ; ε = t(n 1,1 α ) cũng có các bài toán tương tự. − 2 √n − − 2 √n Ví Dụ 5.3. Tiến hành thống kê giá của một nguyên liệu A trong khoảng thời gian 50 ngày, ta có bảng số liệu sau đây: Giá (nghìn đồng/kg) 29 – 31 31 – 33 33 – 35 35 – 37 37 – 39 39 – 41 Số ngày 3 9 14 15 7 2 Độ tin cậy 95% có thể nói giá trung bình của nguyên liệu A nằm trong khoảng nào? a. Biết σ2 =5, 0625; b. Chưa biết σ2; c. Giả thiết như a., để có độ tin cậy 99% thì độ chính xác lúc đó là bao nhiêu? d. Giả thiết như a., để độ tin cậy là 99%, độ chính xác là 0, 6 thì có cần lấy thêm mẫu hay không? Ví Dụ 5.4. Đo đường kính 23 trục máy do 1 máy tiện tự động sản xuất ra, được kết quả (đv: mm). 250 249 251 253 248 250 252 257 245 248 247 249 250 280 250 247 253 256 252 254 254 251 253 Giả sử đường kính của các trục máy là đại lượng ngẫu nhiên có phân phối chuẩn. a. Hãy ước lượng đường kính trung bình các trục máy với độ tin cậy 98%. b. Hãy ước lượng trung bình tối thiểu đường kính các trục máy với độ tin cậy 90%. C. Ước lượng phương sai Giả sử tổng thể X ∼ N(µ, σ2), D(X)= σ2 chưa biết. Với độ tin cậy 1 α và mẫu cở n, 2 2 2 2 −2 2 hãy tìm khoảng tin cậy (σ1; σ2 ) để ước lượng cho σ sao cho P [σ1 < σ < σ2]=1 α. Để ước lượng ta xét 2 trường hợp sau: − 2 Th1: µ chưa biết, s0 đã biết. n 1 2 ∼ 2 2 Chọn thống kê K = −2 S0 χ(n 1) để ước lượng phương sai σ . Trong đó n kích σ − Khoa Giáo Dục Đại Cương 44 Xác Suất Và Thống Kê
- CHƯƠNG 5. ƯỚC LƯỢNG THAM SỐ 2 thước mẫu, S0 thống kê nhận giá trị bằng phương sai điều chỉnh mẫu. α α Chọn các phân vị khi bình phương, n 1 bậc tự do, mức 2 và 1 2 sao cho: 2 α 2 − α − P [K < χ(n 1,1 α )]=1 2 , P [K < χ(n 1, α )]= 2 . − − 2 − − 2 Ta có: α α 2 2 1 α =1 = P [K < χ(n 1,1 α )] P [K < χ(n 1, α )] − − 2 − 2 − − 2 − − 2 2 2 2 n 1 2 2 α α α α = P [χ(n 1, ) <K<χ(n 1,1 )]= P [χ(n 1, ) < −2 S0 < χ(n 1,1 )] − 2 − − 2 − 2 σ − − 2 2 2 α α 2 2 χ(n 1, ) 1 χ(n 1,1 ) (n 1)S0 (n 1)S0 − 2 − − 2 2 = P [ 2 < 2 < 2 ]= P [ 2 − < σ < 2− ] (n 1)S0 σ (n 1)S0 χ α χ α (n 1,1 2 ) (n 1, 2 ) − − − − 2 − 2 2 2 2 (n 1)s0 2 (n 1)s0 Vậy khoảng tin cậy cần tìm là (σ1; σ2) với σ1 = 2 − , σ2 = 2− . χ(n 1,1 α ) χ(n 1, α ) − − 2 − 2 Th2: µ đã biết. 2 nS 1 n 2 2 2 Chọn thống kê K = = (Xi µ) ∼ χ để ước lượng phương sai σ . σ2 σ2 i=1 − (n) 2 Trong đó n kích thước mẫu, S Pthống kê nhận giá trị bằng phương sai mẫu. Lập luận tương tự Th1, ta có: n 2 n 2 2 2 2 i=1(xi µ) 2 i=1(xi µ) (σ1; σ2) với σ1 = 2 − , σ2 = 2 − . χ(n,1 α ) χ(n, α ) P − 2 P 2 Ví Dụ 5.5. Mức hao phí nguyên liệu của 1 loại sản phẩm X cho 1 đơn vị sản phẩm tuân theo quy luật chuẩn. Người ta cân thử một mẫu 30 sản phẩm loại này, được kết quả cho trong bảng sau: Nguyên liệu hao phí (gam) 19,5 20,0 20,5 Số sản phẩm 7 18 5 Với độ tin cậy 90% hãy tìm khoảng tin cậy cho độ lệch chuẩn của mức hao phí nguyên liệu trên trong 2 trường hợp: a. E(X) chưa biết, b. E(X)=20. Khoa Giáo Dục Đại Cương 45 Xác Suất Và Thống Kê
- Chương 6 LÝ THYẾT KIỂM ĐỊNH 6.1 Khái Niệm 6.1.1 Khái niệm và định nghĩa Kiểm định giả thiết là dùng các giả thiết thống kê để chấp nhận hay bác bỏ một giả thiết H0 náo đó về tổng thể được gọi là kiểm định giả thiết thống kê. Các sai lầm: Do việc chấp nhận hay bác bỏ một giả thiết H0 nào đó, căn cứ vào mẫu ngẫu nhiên nên có thể mắc phải một trong hai loại sai lầm sau: Sai lầm loại 1: “H đúng mà ta bác bỏ”. ◦ 0 Sai lầm loại 2: “H sai mà ta chấp nhận”. ◦ 0 Vậy ta có thể nói, mức ý nghĩa α cũng chính là xác suất mắc sai lầm loại một. 6.1.2 Các bước kiểm định giả thiết: B1: Phát biểu giả thiết H0 và đối thiết tương ứng H1; H2 hoặc H3, B2: Chọn tiêu chuẩn kiểm định, B3: Định mức ý nghĩa α, thiết lập miền bác bỏ Wα, B4: Với mẫu cụ thể (x1, x2, , xn) tính G(x1, x2, , xn). Nếu: G(x , x , , xn) Wα thì bác bỏ H , chấp nhận đối thiết ◦ 1 2 ∈ 0 46
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH G(x , x , , xn) / Wα thì chấp nhận H . ◦ 1 2 ∈ 0 6.2 Kiểm Định Giả Thiết 6.2.1 Kiểm định giả thiết về tỉ lệ Bài toán: Giả sử tổng thể X có tỉ lệ các phần tử mang dấu hiệu A là p chưa biết. Với mức ý nghĩa α, hãy kiểm định giả thiết H0 : p = p0 (cho trước) với một trong các đối thiết H : p = p ; H : p>p ; H : p p0 miền bác bỏ Wα =(u1 α;+ ) − ∞ H3 : p µ ; H : µ<µ . 1 6 0 2 0 3 0 Khoa Giáo Dục Đại Cương 47 Xác Suất Và Thống Kê
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH D(X)= σ2 đã biết. Th1: Cở mẫu n 30 hoặc n µ0 miền bác bỏ Wα =(u1 α;+ ) − ∞ H3 : µ µ0 miền bác bỏ Wα =(t(n 1,1 α);+ ) − − ∞ H3 : µ<µ0 miền bác bỏ Wα =( ; t(n 1,1 α)) −∞ − − − Kết luận: Nếu u Wα thì bác bỏ H , chấp nhận đối thiết tương ứng còn nếu 0 ∈ 0 u / Wα thì chấp nhận H . 0 ∈ 0 Ví Dụ 6.2. Trọng lượng của 1 hộp sản phẩm do dây chuyền tự động đóng gói là 100g, độ Khoa Giáo Dục Đại Cương 48 Xác Suất Và Thống Kê
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH lệch chuẩn σ =0, 8g. Sau một thời gian sản xuất, người ta nghi ngờ khối lượng sản phẩm có xu hướng tăng lên. Kiểm tra 60 sản phảm tính được trung bình mẫu x = 100, 2g. a. Với độ tin cậy 99%, hãy kết luận về nghi ngờ trên. b. Với độ tin cậy lớn nhất có thể được là bao nhiêu để kết luận rằng điều nghi ngờ nói trên là đúng. Giải: a. Xét giả thiết H0 : µ = 100g, đối thiết H2 : µ> 100g. X µ Chọn thống kê U = − 0 √n ∼ N(0, 1) làm tiêu chuẩn kiểm định. Trong đó, X là σ thống kê nhận giá trị bằng trung bình mẫu. Với mẫu đã cho có µ0 = 100g, σ =0, 8g, n = 60, x = 100, 2g nên giá trị quan sát: x µ 100, 2 100 u = − 0 √n = − √60=1, 936 0 σ 0, 8 Miền bác bỏ: 1 α =0, 99 tra Phụ lục 2 có u1 α = u0,99 =2, 32 nên Wα =(u1 α;+ )= − − (2, 32;+ ). − ∞ ∞ Do đó u0 = 1, 936 / Wα nên chấp nhận H0, bác bỏ H2. Vì thế nghi ngờ khối lượng sản phẩm tăng lên là không∈ có cơ sở. b. Giả sử với độ tin cậy 1 β điều nghi ngờ trên là đúng. − Suy ra u0 Wβ =(u1 β, + ) hay u1 β u0. ∈ − ∞ − ≤ Do đó, để kết luận trên là đúng với độ tin cậy lớn nhất thì u1 β = u0 =1, 94 tra bảng có − 1 β = Φ(1, 94) = 0, 9738 − Ví Dụ 6.3. Trọng lượng trung bình của một loại sản phẩm là 6kg. Kiểm tra 121 sản phẩm tháy trọng lượng trung bình là 5,795 kg và phương sai s˜2 =5, 712. Hãy kiểm định về trọng lượng trung bình của sản phẩm với mức ý nghĩa 5% 6.2.3 Kiểm định giả thiết về phương sai Bài toán: Giả sử tổng thể X ∼ N(µ, σ2), phương sai D(X) = σ2 chưa biết. Với mức ý 2 2 2 nghĩa α, hãy kiểm định giả thiết H0 : σ = σ0 (σ0 đã biết) với một trong các đối thiết H : σ = σ ; H : σ > σ ; H : σ < σ . 1 6 0 2 0 3 0 Th1: Trường hợp E(X)= µ chưa biết (n 1)S 2 0 ∼ 2 Chọn thống kê K = − 2 χ (n 1) làm tiêu chuẩn kiểm định. Trong đó, n σ0 − 2 là cở mẫu, σ0 là giá trị cho trong giả thiết và S0 thống kê nhận giá trị bằng độ lệch điều chỉnh mẫu. Khoa Giáo Dục Đại Cương 49 Xác Suất Và Thống Kê
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH 2 2 (n 1)s0 Từ mẫu cụ thể, ta tính được s0 và giá trị quan sát k0 = − 2 . σ0 Khi đó tùy theo dạng của đối thiết mà ta có miền bác bỏ tương ứng: Với đối thiết 2 phía ◦ 2 2 2 2 H1 : σ = σ0 miền bác bỏ Wα =( ; χ(n 1, α )) (χ(n 1,1 α );+ ). 6 −∞ − 2 ∪ − − 2 ∞ Với đối thiết 1 phía: ◦ 2 2 2 H2 : σ > σ0 miền bác bỏ Wα =(χ(n 1,1 α);+ ). 2 2 − −2 ∞ H3 : σ σ0 miền bác bỏ Wα =(χ(n,1 α);+ ). 2 2 − 2 ∞ H : σ < σ miền bác bỏ Wα =( ; χ ). 3 0 −∞ (n,α) Kết luận: Nếu k Wα thì bác bỏ H , chấp nhận đối thiết tương ứng còn nếu 0 ∈ 0 k / Wα thì chấp nhận H . 0 ∈ 0 Ví Dụ 6.4. Nếu máy móc hoạt động bình thường thì kích thước của một loại sản phẩm (đv: cm) là đại lượng ngẫu nhiên có phân phối chuẩn với phương sai σ2 = 25cm2. Nghi ngờ máy hoạt động không bình thường, người ta đo thử 20 sản phẩm và tính được 2 2 s0 = 27, 5cm . Với mức ý nghĩa 2% hãy kết luận về điều nghi ngờ trên. Giải: 2 2 Xét giả thiết H0 : σ = 25 và đối thiết H1 : σ = 25. (n 1)S 2 6 0 ∼ 2 Chọn thống kê K = − 2 χ (n 1) làm tiêu chuẩn kiểm định. Trong đó, n = 20 σ0 − 2 là cở mẫu, σ0 = 25 và S0 thống kê nhận giá trị bằng độ lệch điều chỉnh mẫu. 2 2 (n 1)s0 (20 1).27, 5 Từ mẫu cụ thể, có s0 = 27, 5 và giá trị quan sát k0 = − 2 = − = 20, 9 σ0 25 α 2 2 1 =0, 99 tra Phụ lục 4 có χ(n 1,1 α ) = χ(19;0,99) = 36, 191 Giả thiết α =0, 02 α− 2 − − 2 ⇒ 2 2 =0, 01 tra Phụ lục 4 có χ(n 1, α ) = χ(19;0,01) =7, 633 2 − 2 2 2 Miền bác bỏ Wα =( ; χ(n 1, α )) (χ(n 1,1 α );+ )=( ;7, 633) (36, 191;+ ). −∞ − 2 ∪ − − 2 ∞ −∞ ∪ ∞ Do đó k / Wα nên chấp nhận H . Vậy với mức ý nghĩa 2%, nghi ngờ máy hoạt động 0 ∈ 0 không bình thường là không có cơ sở. Khoa Giáo Dục Đại Cương 50 Xác Suất Và Thống Kê
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH 6.3 Kiểm Định So Sánh Các Tham Số 6.3.1 So sánh hai tỉ lệ Xét hai tổng thể X và Y cùng có đặc tính A. Giả sử p1,p2 lần lượt là tỉ lệ các phần tử mang dấu hiệu A trong X và Y. Bài toán: Từ các mẫu độc lập (X1,X2, , Xm) của X và (Y1,Y2, , Yn) của Y . Với mức ý nghĩa α hãy kiểm định giả thiết H : p = p với một trong các đối thiết H : p = p , 0 1 2 1 1 6 2 H2 : p1 >p2 và H3 : p1 p2 miền bác bỏ Wα =(u1 α;+ ). − ∞ H3 : p1 µ2 và H3 : µ1 <µ2. 2 2 6 Giả sử σ1 = D(X), σ2 = D(Y ) khi H0 đúng ta xét các trường hợp sau: Khoa Giáo Dục Đại Cương 51 Xác Suất Và Thống Kê
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH σ2, σ2 đã biết. Th1: 1 2 Cở mẫu m, n 30 hoặc m,n µ2 miền bác bỏ Wα =(u1 α;+ ). − ∞ H3 : µ1 <µ2 miền bác bỏ Wα =( ; u1 α). −∞ − − Kết luận: Nếu u Wα thì bác bỏ H , chấp nhận đối thiết tương ứng. Còn nếu 0 ∈ 0 u / Wα thì chấp nhận H . 0 ∈ 0 σ2, σ2 chưa biết. Th2: 1 2 Cở mẫu m, n 30 ≥ X Y Chọn thống kê U = − N(0, 1) làm tiêu chuẩn kiểm định giả thiết H0. 02 02 S1 S2 ' m + n Trong đó, S10 và S20 lầnq lượt là các thống kê nhận giá trị bằng độ lệch điều chỉnh mẫu của X và Y . x y Với 2 mẫu cụ thể (x1, , xm) và (y1, , yn) ta có giá trị quan sát u0 = − 02 02 s1 s2 m + n Tùy theo dạng của đối thiết mà ta có miền bác bỏ hoàn toàn tương tựq như Th1. σ2 = σ2 chưa biết. Th3: 1 2 Cở mẫu m,n < 30 và X ∼ N(µ , σ2),Y ∼ N(µ , σ2) 1 1 2 2 X Y Chọn thống kê T = − ∼ T (m + n 2) làm tiêu chuẩn kiểm định giả 2 1 1 − S0 ( m + n ) 2 2 q2 (m 1)S10 +(n 1)S20 thiết H . Trong đó, S0 = − − với S0 ,S0 là các thống kê nhận 0 m + n 2 1 2 giá trị bằng độ lệch điều chỉnh mẫu của −X và Y . 2 2 2 (m 1)s10 +(n 1)s20 Với 2 mẫu cụ thể (x , , x ) và (y , , y ) có s0 = − − nên giá 1 m 1 n m + n 2 x y − trị quan sát t0 = − . 1 1 s 2( + ) 0 m n r Tùy theo các dạng đối thiết mà ta có miền bác bỏ như sau: Với đối thiết 2 phía ◦ H1 : µ1 = µ2 miền bác bỏ Wα =( ; t(m+n 2,1 α )) (t(m+n 2,1 α );+ ). 6 −∞ − − − 2 ∪ − − 2 ∞ Khoa Giáo Dục Đại Cương 52 Xác Suất Và Thống Kê
- CHƯƠNG 6. LÝ THYẾT KIỂM ĐỊNH Với đối thiết 1 phía: ◦ H2 : µ1 >µ2 miền bác bỏ Wα =(t(m+n 2,1 α);+ ). − − ∞ H3 : µ1 σ2 và H3 : σ1 s20 ). s20 Khi đó tùy theo dạng của đối thiết mà ta có miền bác bỏ tương ứng như sau: Với đối thiết 2 phía ◦ 1 2 2 α H1 : σ1 = σ2 miền bác bỏ Wα =( ; ) (f1 (m 1, n 1);+ ). 6 −∞ f α (m 1, n 1) ∪ − 2 − − ∞ 1 2 1 − − − (Do f α (m 1, n 1) = ) 2 − − f1 α (m 1, n 1) − 2 − − Với đối thiết 1 phía ◦ 2 2 H2 : σ1 > σ2 miền bác bỏ Wα =(f1 α(m 1, n 1);+ ). − − − ∞2 2 (vì vai trò của σ1, σ2 như nhau nên ta không xét H3 : σ1 < σ2 ). Kết luận: Nếu f Wα thì bác bỏ H , chấp nhận đối thiết. Còn nếu f / Wα thì chấp 0 ∈ 0 0 ∈ nhận H0. (Lưu ý: Khi s10 <s20 thì ta thay đổi vai trò của chúng cho nhau, lúc đó phân vị của phân phối Fisher đổi lại thành (n 1, m 1) bậc tự do) − − Ví Dụ 6.7. Người ta dùng phương sai hay độ lệch tiêu chuẩn làm độ đo đánh giá sự rủi ro của cổ phiếu. Điều tra ngẫu nhiên giá cổ phiếu của công ty A trong 25 ngày tính được 2 2 s10 =6, 52; của công ty B trong 22 ngày tính được s20 =3, 47. Với mức ý nghĩa 5% có thể cho rằng độ rủi ro cổ phiếu của công ty A cao hơn công ty B hay không? Khoa Giáo Dục Đại Cương 53 Xác Suất Và Thống Kê



