Nhập môn lý thuyết Xác suất thống kê - Phạm Trọng Tiến

pdf 56 trang hapham 12200
Bạn đang xem 20 trang mẫu của tài liệu "Nhập môn lý thuyết Xác suất thống kê - Phạm Trọng Tiến", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfnhap_mon_ly_thuyet_xac_suat_thong_ke_pham_trong_tien.pdf

Nội dung text: Nhập môn lý thuyết Xác suất thống kê - Phạm Trọng Tiến

  1. UBND TỈNH QUẢNG BÌNH TRƯỜNG ĐẠI HỌC QUẢNG BÌNH NHẬP MÔN LÝ THUYẾT XÁC SUẤT THỐNG KÊ Biên soạn: Th.s PHAN TRỌNG TIẾN Quảng Bình, tháng 4 năm 2009
  2. Mục lục Mục lục 1 Lời nói đầu 2 Chương 1 Các khái niệm cơ bản về xác suất 3 §1 Bổ sung về giải tích tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 §2 Phép thử ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 §3 Xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 §4 Cách tính xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 §5 Quy tắc cộng và nhân xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 11 §6 Hệ biến cố đầy đủ và xác suất toàn phần . . . . . . . . . . . . . . . . . . . . 15 §7 Công thức Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Chương 2 Biến ngẫu nhiên 19 §1 Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 §2 Bảng phân phối và hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . 20 §3 Các sỐ ĐẶc trƯng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 §4 Biến ngẫu nhiên rời rạc có vô số giá trị . . . . . . . . . . . . . . . . . . . . . 24 §5 Một số phân phối rời rạc thường gặp . . . . . . . . . . . . . . . . . . . . . . 25 Chương 3 Mẫu quan sát và bài toán ước lượng 31 §1 Tổng thể và mẫu quan sát . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 §2 Ước lượng tham số của tổng thể . . . . . . . . . . . . . . . . . . . . . . . . . 33 §3 Xác định kích thước mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Chương 4 Kiểm định giả thiết 41 §1 Giả thiết và đối thiết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 §2 Kiểm định giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2) . . . . . . 42 §3 Kiểm định xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4 Xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 5 Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6 Bài toán ước lượng, kiểm định . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Tài liệu tham khảo 55 1
  3. LỜI NÓI ĐẦU Lý thuyết Xác suất và thống kê toán học là một ngành toán học ra đời vào khoảng thế kỷ XVII. Đối tượng nghiên cứu của Xác suất - Thống kê là các hiện tượng ngẫu nhiên, các quy luật ngẫu nhiên mà chúng ta thường gặp trong thực tế. Khác với một số môn Toán học trừu tượng, lý thuyết Xác suất - Thống kê được xây dựng dựa trên các công cụ toán học hiện đại như Giải tích hàm, Lý thuyết độ đo, nhưng lại gắn liền với các bài toán thực tế cuộc sống, trong tự nhiên và xã hội. Ngày nay, lý thuyết Xác suất - Thống kê Toán học đã được đưa vào giảng dạy ở hầu hết các ngành đào tạo trong các trường Đại học và Cao đẳng trên thế giới và trong nước. Nó đang là một trong những ngành khoa học phát triển cả về lý thuyết cũng như ứng dụng. Nó được ứng dụng rộng rãi trong hầu hết các lĩnh vực khoa học tự nhiên, khoa học xã hội, trong kinh tế, kỹ thuật, y học, Bài giảng Xác suất - Thống kê này được biên soạn cho sinh viên Đại học không chuyên ngành Toán với thời lượng 30 tiết. Chính vì vậy, chúng tôi không đi sâu vào việc chứng minh những lý thuyết toán học phức tạp mà trình bày các kiến thức cơ bản như là công cụ và tập trung đưa ra các ví dụ minh họa. Bài giảng gồm có 4 chương: Chương 1: Phần đầu đề cập các khái niệm cơ bản trong giải tích tổ hợp. Phần sau trình bày khái niệm xác suất và các tính chất của xác suất. Chương 2: Trình bày biến ngẫu nhiên, bảng phân phối, hàm phân phối và các số đặc trưng. Một số phân phối thường gặp cũng được giới thiệu trong chương này. Chương 3 và Chương 4 trình bày bài toán ước lượng và kiểm định cho các tham số của biến ngẫu nhiên. Tác giả rất mọng nhận được sự góp ý từ phía Thầy Cô và các bạn sinh viên để bài giảng được hoàn thiện hơn. Tác giả 2
  4. Chương 1 CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT §1 BỔ SUNG VỀ GIẢI TÍCH TỔ HỢP Phần này không nằm trong nội dung môn Xác suất thống kê mà thuộc về các kiến thức chung đã được học ở Phổ thông, tuy nhiên để hiểu được các phép tính xác suất, thống kê ở các chương sau thì cần phải học, hoặc phải ôn lại các khái niệm cơ bản như: chỉnh hợp, hoán vị, tổ hợp, chỉnh hợp lặp. 1.1 Quy tắc nhân Giả sử một công việc nào đó được thực hiện qua n bước. Bước thứ i có xi cách sau khi các bước 1, 2, , i − 1 đã làm, khi đó để thực hiện công việc đó có x1.x2 xn cách. Ví dụ 1.1. Một bé có thể mang họ cha là Lê hay họ mẹ là Đỗ, chữ lót có thể là Văn, Đồng, Bích hoặc Đình tên có thể là Nhân, Nghĩa, Trí, Đức. Hỏi có bao nhiêu cách để đặt tên đầy đủ cho bé? Giải. Xem việc đặt tên cho bé được thực hiện qua 3 bước. Bước 1 đặt họ: có 2 cách để đặt họ. Sau khi đặt họ thì thực hiện bước 2 đặt chữ lót: có 4 cách để đặt chữ lót. Đặt xong họ và chữ lót tiếp tục thực hiện bước 3 đặt tên: có 4 cách đặt tên. Tên đầy đủ của bé sẽ có được khi thực hiện xong cả ba bước trên. Số cách thực hiện là 2.4.4=32 cách. 1.2 Hoán vị Định nghĩa 1.2. Cho tập A có n (n ≥ 1) phần tử. Một cách sắp xếp có thứ tự n phần tử này được gọi là một hoán vị các phần tử của tập A. Ký hiệu Pn là số các hoán vị của tập hợp có n phần tử. Ta có Định lý 1.3. Số các hoán vị của một tập hợp có n phần tử là Pn = n! = n(n − 1)(n − 2) 1. Ví dụ 1.4. Có bao nhiêu số có 4 chữ số khác nhau được thiết lập từ các chữ số 1, 2, 3, 4? Giải. Mỗi cách sắp xếp 4 chữ số 1, 2, 3, 4 theo một thứ tự nào đó ta được một số gồm 4 chữ số khác nhau. Nó chính là một hoán vị của 4 chữ số đó. Vậy số các số khác nhau gồm 4 chữ số là 4!=24. Ví dụ 1.5. Cửa hàng có 3 cái mũ màu xanh, đỏ, tím. Có 3 khách đến mua mũ mỗi người mua một chiếc. Hỏi cô bán hàng có mấy cách để bán mũ? Giải. Mỗi cách bán ba chiếc mũ cho ba khách là một hoán vị của ba phần tử. Vậy số cách để cô bán hàng bán mũ là P3 = 3! = 6. 3
  5. Ví dụ 1.6. Có 6 cụ ông sắp hàng ngang để tập thể dục buổi sáng, sau buổi tập đầy phấn khích các cụ quyết định từ ngày hôm sau sẽ ra tập tiếp và mỗi ngày sẽ sắp hàng theo một trật tự khác những lần tập trước. Hỏi sau nhiều nhất bao nhiêu ngày các cụ mới quay lại cách xếp hàng đầu tiên? Giải. Coi mỗi cách sắp hàng là một cách sắp xếp 6 cụ vào 6 chỗ, tức là một hoán vị của 6 cụ, có thể tìm được tất cả có 6! = 720 cách xếp hàng. Như vậy phải 720 ngày sau, tức là gần 2 năm sau 6 cụ mới xếp hàng lại theo đúng cách sắp hàng đầu tiên. 1.3 Chỉnh hợp không lặp Cho tập hợp A = {1, 2, 3}. Lập các bộ có thứ tự gồm hai phần tử trong ba phần tử đã cho: Giải. Các bộ có thứ tự gồm hai phần tử trong ba phần tử của A là {1, 2}, {2, 1}, {2, 3}, {3, 2}, {1, 3}, {3, 1}. Mỗi bộ có thứ tự gồm hai phần tử trên được gọi là một chỉnh hợp không lặp chập 2 của 3 phần tử đã cho. Định nghĩa 1.7. Cho tập A có n phần tử. Một chỉnh hợp không lặp chập k (1 ≤ k ≤ n) của n phần tử đã cho là một bộ có thứ tự gồm k phần tử trong n phần tử. k Ký hiệu số các chỉnh hợp không lặp chập k của n phần tử là An. Định lý 1.8. Số các chỉnh hợp không lặp chập k của n phần tử bằng n! Ak = = n(n − 1) (n − k + 1) (1 ≤ k ≤ n). n (n − k)! Ví dụ 1.9. Cho năm chữ số 1, 2, 3, 4, 5. Hỏi có bao nhiêu số khác nhau gồm 3 chữ số lấy từ 5 chữ số trên Giải. Số các số khác nhau gồm 3 chữ số lấy từ 5 chữ số bằng số các chỉnh hợp không lặp 5! chập của 5 phần tử, tức là: A3 = = 60. 5 (5 − 3)! Ví dụ 1.10. Có 8 đội bóng chuyền thi đấu để tranh ba huy chương vàng, bạc, đồng. Nếu 8 đội thực lực như nhau thì có thể có bao nhiêu dự báo về danh sách bộ ba được huy chương? Giải. Vì thực lực như nhau nên có thể có 8 cách dự báo đội được huy chương vàng, sau đó còn 7 cách dự báo đội được huy chương bạc, cuối cùng có 6 cách dự báo đội được huy chương đồng, như vậy tất cả có 8.7.6 = 336 chính là số chỉnh hợp không lặp chập 3 của 8 đội. Hai dự báo khác nhau nếu trong danh sách 3 đội được huy chương có ít nhất tên một đội khác nhau hoặc vẫn cùng tên 3 đội nhưng thứ tự khác nhau do đó có sự thay đổi tên đội tương ứng với loại huy chương. Ví dụ 1.11. Một tổ có 10 người, chọn lần lượt 3 người đi làm việc, người thứ nhất là nhóm trưởng. Người thứ hai theo dõi các chỉ tiêu kinh tế. Người thứ ba theo dõi các chỉ tiêu kỹ thuật. Giả sử 10 người trong tổ có khả năng làm việc như nhau thì có bao nhiêu cách phân công việc trong nhóm 3 Giải. Có A10 = 720 cách. 4
  6. 1.4 Chỉnh hợp lặp Định nghĩa 1.12. Cho tập A có n (n ≥ 1) phần tử. Ta gọi chỉnh hợp lặp chập k (k ≥ 1) của n phần tử của A là một tập có thứ tự gồm k phần tử lấy từ n phần tử của A, mà phần tử của tập đó có thể có mặt nhiều nhất k lần. Ký hiệu số các chỉnh hợp lặp chập k của n k phần tử của A là Aen. Định lý 1.13. Số chỉnh hợp lặp chập k của n phần tử được tính theo công thức: k k Aen = n (1.1) Từ nay về sau khi nói đến "chỉnh hợp" thì ta hiểu đó là chỉnh hợp không lặp. Còn "chỉnh hợp lặp" sẽ được hiểu là chỉnh hợp có lặp. Ví dụ 1.14. Có bao nhiêu cách phân ngẫu nhiên 12 khách lên 3 toa tàu? Giải. Số cách để 12 khách lên 3 toa tàu là số chỉnh hợp lặp chập 12 của 3 phần tử đã cho. Bởi vì mỗi hành khách có thể có 3 cách để lên tàu, nên có 312 cách. Ví dụ 1.15. Số máy điện thoại của một tỉnh gồm bảy chữ số. Mỗi chữ số được chọn trong mười số 0, 1, , 9 như vậy có thể tạo ra 10.10.10.10.10.10.10 = 107 số máy điện thoại. Ví dụ 1.16. Vé xổ số có bốn chữ số, như vậy có tất cả 104 vé xổ số có bốn chữ số. có bao nhiêu cách trao 15 phần thưởng cho 5 người dự thi. Mỗi cách phân 15 sản phẩm cho 5 người là một chỉnh hợp chập 15 của 5. Vậy số cách đề phân ngẫu nhiên 15 phần thưởng cho 5 người là: 515. 1.5 Tổ hợp Cho tập hợp A = {1, 2, 3}. Lập các tập con gồm hai phần tử (không kể thứ tự) của tập M. Ta có {1, 2}, {1, 3}, {3, 2} tập hợp con khác nhau. Mỗi tập con gồm 2 phần tử ở trên được gọi là 1 tổ hợp chập 2 của 3 phần tử. Định nghĩa 1.17. Cho tập A gồm n (n ∈ N) phần tử. Một tổ hợp chập k (0 ≤ k ≤ n) của n phần tử đã cho của A là một tập con của A gồm k phần tử không kể thứ tự. Ký hiệu số k các tổ hợp chập k của n phần tử là Cn. Định lý 1.18. Số các tổ hợp chập k của n phần tử đã cho là n! Ck = . (1.2) n k!(n − k)! Chú ý: Người ta chứng minh được các công thức sau k n−k Cn = Cn k k k−1 Cn = Cn−1 + Cn−1. 5
  7. Ví dụ 1.19. Có mấy cách cử 3 người trong một tổ gồm 12 người đi lao động? Giải. Số cách phân công 3 người trong 12 người đi lao động bằng số các tổ hợp chập 3 của 3 12 phần tử. Vậy có C12 = 220 cách. Bài Tập phần giải tích tổ hợp 1.1. Có thể tạo ra bao nhiêu vectơ có gốc và đỉnh tại 2 trong 4 điểm đã cho? 1.2. Giải các phưng trình 3 2 1 2 2 a) An = 20n; b) An − An = 3; c)3An + 42 = A2n.(n là ẩn). 1.3. Có bao nhiêu số gồm ba chữ số khác nhau lấy từ năm chữ số 0, 2, 4, 6, 8? 1.4. Một lớp có 50 học viên. Cần chọn ra lớp trưởng, lớp phó học tập và lớp phó đời sống. Nếu ai cũng có khả năng được chọn vào các chức vụ trên thì có bao nhiêu cách chọn? 1.5. Có thể lập được bao nhiêu số chẵn gồm năm chữ số khác nhau lấy từ sáu chữ số 0, 1, 2, 3, 4, 5? 1.6. Có 24 đội bóng tham gia thi đấu, hai đội phải đấu với nhau một lượt đi, một lượt về. Ban tổ chức phải tổ chức bao nhiêu trận đấu? 1.7. Có 3 cụ ông, 2 cụ bà và 5 em bé ngồi quanh một bàn tròn. Hỏi có bao nhiêu cách sắp xếp chỗ ngồi sao cho các cụ ông ngồi cạnh nhau, các cụ bà ngồi cạnh nhau và các em bé cũng ngồi cạnh nhau? 1.8. Có 3 cặp vợ chồng đi xem văn nghệ và ngồi vào 6 ghế trên một hàng ngang có bao nhiêu cách sắp xếp sao cho vợ chồng luôn ngồi cạnh nhau? 1.9. Có 3 quyển sách Toán, 4 quyển sách Lí, 2 quyển sách Hoá và 5 quyển sách Sinh. a) Có bao nhiêu cách xếp 14 quyển sách lên giá sách? b) Có bao nhiêu cách xếp sao cho sách cùng môn học ở cạnh nhau? 1.10. Có bao nhiêu số có năm chữ số lấy từ năm chữ số 1, 2, 3, 4, 5 trong đó hai chữ số 1 và 2 không đứng cạnh nhau? 1.11. Trong mặt phẳng có n điểm trong đó không có 3 điểm nào thẳng hàng. Hỏi có thể kẽ được bao nhiêu đường thẳng, mỗi đường thẳng đi qua 2 điểm trong số n điểm đã cho? 1.12. Cho đa giác lồi n (n ≥ 4) đỉnh D1,D2, , Dn. Có tất cả bao nhiêu đường chéo? 1.13. Có 12 điểm nằm trên một đường tròn . a) Hỏi có bao nhiêu tam giác nội tiếp đường tròn có đỉnh nằm trong số các điểm đã cho? b) Hỏi có bao nhiêu tứ giác nội tiếp đường tròn có đỉnh nằm trong số các điểm đã cho? 1.14. Một hộp đựng 6 bi trắng và 4 bi đen. a) Có bao nhiêu cách lấy ra 5 bi. b) Có bao nhiêu cách lấy ra 5 bi trong đó có 2 bi trắng. c) Có bao nhiêu cách lấy ra 5 bi trong đó ít nhất có 2 bi trắng. d) Có bao nhiêu cách lấy ra 5 bi trong đó có nhiều nhất 2 bi trắng. 6
  8. 1.15. Có 10 người gồm 7 nam và 3 nữ. a) Có bao nhiêu cách chọn một uỷ ban gồm 3 người. b) Có bao nhiêu cách chọn để trong uỷ ban nói trên có một nữ. c) Có bao nhiêu cách chọn để trong uỷ ban nói trên có ít nhất một nữ. §2 PHÉP THỬ NGẪU NHIÊN Trong nghiên cứu tự nhiên và xã hội ta phải theo dõi các hiện tượng, phải cân, đong, đo, đếm, làm thí nghiệm những việc này, trong điều kiện cho phép, phải lặp lại nhiều lần. Ta gọi chung các công việc này là phép thử. Khi lặp lại phép thử ta thấy có phép thử luôn cho cùng một kết quả, ví dụ đun nước ở điều kiện cao độ và áp suất bình thường thì đến 1000C nước sẽ sôi, trứng gà trong đàn gà không có trống khi ấp sẽ không nở, hạt giống nếu xử lý ở nhiệt độ quá cao hoặc nồng độ hoá chất quá cao sẽ không nẩy mầm, Ta gọi đó là các kết quả tất yếu. Ngoài loại phép thử cho kết quả tất yếu ra còn có rất nhiều phép thử khi lặp lại sẽ cho các kết quả khác nhau. Số kết quả đó có thể hữu hạn, có thể vô hạn, có thể là các giá trị rời rạc hay liên tục, ví dụ sinh con có thể trai hay gái, ấp trứng có thể nở hoặc không, trồng 10 cây thì số cây sống có thể là 0, 1, , 10, làm thí nghiệm có thể thành công hoặc thất bại. Một hành động mà kết quả của nó không thể dự báo trước được gọi là một phép thử ngẫu nhiên. Ký hiệu phép thử ngẫu nhiên là T . Các kết quả của T không thể nói trước được một cách chắc chắn, nhưng ta có thể liệt kê ra tất cả các kết quả có thể có của T . Tập tất cả các kết quả của T được gọi là không gian mẫu và thường ký hiệu nó bằng chữ Ω. Khi thực hiện phép thử, kết quả của phép thử gọi là biến cố sơ cấp (sự kiện sơ cấp) ký hiệu là ω, như vậy ω ∈ Ω. Mỗi tập con A của Ω được gọi là một biến cố. Mỗi kết quả ω ∈ A được gọi là một kết quả thuận lợi cho A. Khi kết quả của T là một phần tử của A thì có nghĩa là A xảy ra. Biến cố không thể là biến cố không bao giờ xảy ra. Nó tương ứng với tập con ∅ của Ω. Biến cố chắc chắn là biến cố luôn xảy ra. Nó tương ứng với toàn bộ tập Ω. Ví dụ 2.1. Gieo một con xúc xắc, biến cố sơ cấp là ra mặt 1, 2, 3, 4, 5, 6. biến cố ra mặt chẵn A bao gồm ba biến cố sơ cấp (2, 4, 6). Biến cố ra mặt lẻ B bao gồm ba biến cố sơ cấp (1, 3, 5). Nếu gieo hai con xúc xắc thì các biến cố sơ cấp là 36 cặp số (1, 2), ( 1, 3), , (6, 6). biến cố "Có mặt 6" bao gồm 11 biến cố sơ cấp: (1, 6), (2, 6), , (6, 1), , (6, 6). biến cố "Tổng số điểm trên hai con xúc xắc là 10" gồm ba biến cố sơ cấp (4, 6), (5, 5), (6, 4). Biến cố "Điểm trên hai con xúc xắc bằng nhau" bao gồm 6 biến cố sơ cấp ( 1, 1 ), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6). Kiểm tra 3 sản phẩm. Biến cố "không có quá 3 sản phẩm tốt có trong 3 sản phẩm kiểm tra" là biến cố chắc chắn. Biến cố "có 4 phế phẩm có trong 3 sản phẩm kiểm tra" là biến cố 7
  9. không thể. Biến cố "có 2 sản phẩm tốt trong 3 sản phẩm kiểm tra" là biến cố ngẫu nhiên. §3 XÁC SUẤT Theo dõi nhiều lần một phép thử và các biến cố liên quan đến phép thử ta thấy có biến cố hay xuất hiện, hay xảy ra, có biến cố ít xuất hiện, ít xảy ra, biến cố tất yếu luôn xảy ra còn biến cố không thể không bao giờ xảy ra. Ví dụ gieo một con xúc xắc, biến cố ra mặt chẵn và biến cố ra mặt lẻ có mức độ xuất hiện như nhau, biến cố "ra số chia được cho 3" ít xuất hiện hơn. Biến cố ra mặt 6 lại còn ít xuất hiện hơn nữa. Biến cố "ra một số ít hơn 7" là biến cố tất yếu. Còn biến cố "ra một số lớn hơn 6" là biến cố không thể. Như vậy trong một phép thử mỗi biến cố có một mức độ (hay khả năng) xuất hiện mà chúng ta muốn đánh giá (thay nó) bằng một con số. Giả sử A là biến cố của phép thử nào đó. Mặc dù khi tiến hành phép thử ta không thể nói trước biến cố A xảy ra hay không nhưng ta thừa nhận rằng: có một số đo khả năng xảy ra của biến cố A, ký hiệu p(A). Khi đó p(A) = 1 nếu A là biến cố chắc chắn và p(A) = 0 nếu A là biến cố không thể. Định nghĩa 3.1. Xác suất của một biến cố là một số đo lường khả năng xuất hiện của biến cố đó. Số đó luôn nằm giữa 0 và 1. Xác suất của một biến cố càng nhỏ (càng gần 0) thì biến cố đó càng ít khả năng xảy ra. Xác suất của một biến cố càng lớn (càng gần 1) thì biến cố có nhiều khả năng xảy ra. Tính chất Nếu A là biến cố ngẫu nhiên thì: 0 < p(A) < 1 Nếu A là biến cố chắc chắn thì: p(A) = 1 Nếu A là biến cố không thể thì: p(A) = 0 Như vậy nếu A là biến cố bất kỳ thì 0 ≤ p(A) ≤ 1. §4 CÁCH TÍNH XÁC SUẤT Có nhiều cách tính xác suất, có cách tính chặt chẽ theo hệ liên để giúp xây dựng xác suất thành một ngành toán học với lý thuyết và ứng dụng phong phú, có cách tính trực quan hơn và dựa vào các môn học khác như tính xác suất theo Cơ học, theo Hình học, theo Đại số trong tài liệu này chúng ta dùng hai cách tính xác suất: cách tính thống kê và cách tính đồng khả năng. 4.1 Cách tính thống kê Xác định điều kiện đầu xong ta lặp lại phép thử nhiều lần, càng nhiều càng tốt giữ lại số lần thử n và số lần có biến cố A, gọi là tần số n(A). Tần suất của biến cố A, ký hiệu là f(A) được tính theo công thức n(A) f(A) = . (4.1) n 8
  10. Tần suất không phải là xác suất nhưng nếu không có cách nào khác để tính xác suất lại lấy tần suất f(A) làm xác suất p(A). Nếu có điều kiện làm hàng loạt phép thử và tính tần suất của biến cố A trong các loạt đó người ta thấy tần suất khá ổn định (khác nhau rất ít) và thường dao động quanh một số xác định. Khi số phép thử tăng lên (và khá lớn) thì biên độ (sai khác giữa tần suất và số nói trên) có khuynh hướng nhỏ dần đi càng ngày càng ít xuất hiện các biên độ lớn. Số xác định nói trên được lấy làm xác suất. Ví dụ 4.1. Để tính xác suất ra mặt sấp khi gieo một đồng tiền, ta có các kết quả sau, dao động quanh 0,5 Người thực hiện Số lần gieo Số lần ra mặt sấp Tần suất Buýt phông 4040 2048 0,5080 Piếc sơn 12000 6019 0,5016 Piếc sơn 24000 12012 0,5005 Ví dụ 4.2. Ở Trung Quốc, từ năm 228 trước Công nguyên, đã tìm thấy tần suất sinh con 1 trai là 2 . Laplaxơ theo dõi các thành phố Luân Đôn, Pê-téc-bua và Bec-lin và công bố tần 22 suất sinh con trai là 43 . Cramơ cho tần suất sinh con trai ở Thuỵ Điển là 0,508. Ở Việt Nam năm 1961 tần suất sinh con trai là 0,51. Cách tính thống kê đơn giản, cho kết quả dễ hiểu, dễ giải thích, phù hợp với thực tế nhưng không chính xác và không thể dùng để tính xác suất trong những trường hợp phức tạp hoặc các trường hợp không thể trực tiếp lặp lại phép thử. Trong thực tế, khi xem xét một số lượng lớn sản phẩm, chúng ta thường dùng phần trăm (%). Ví dụ số học sinh thi đỗ là 90%, số sản phẩm đạt tiêu chuẩn là 80%, số người bị bệnh trong một đợt dịch là 30% Theo cách tính thống kê có thể đổi % sang xác suất như sau: nếu số đạt tiêu chuẩn là P % thì khi chọn ngẫu nhiên một sản phẩm xác suất để sản phẩm P đó đạt tiêu chuẩn là 100 . Cách tính thống kê đã được dùng từ xa xưa để tính xác suất sinh con trai, con gái. Xác suất xuất hiện các hiện tượng lạ trong tự nhiên như lũ lụt, sóng thần, nhật thực, nguyệt thực, 4.2 Cách tính cổ điển hay cách tính đồng khả năng Tiến hành một phép thử và giả sử n kết quả (biến cố sơ cấp) của phép thử có khả năng xuất hiện như nhau, gọi đó là phép thử có n kết quả đồng khả năng. Khi đó người ta lấy 1 xác suất của mỗi kết quả là n . Từ chấp nhận này có thể tính được xác suất p(A) của một biến cố bất kì A như sau: Xác suất của biến cố A là tỷ số giữa n(A) số kết quả thuận lợi cho A và số kết quả đồng khả năng n n(A) p(A) = (4.2) n Cách tính đồng khả năng đơn giản, cho kết quả dễ hiểu, dễ giải thích, phù hợp với thực tế, nhưng không chặt chẽ và không thể dùng để tính xác suất trong những trường hợp phức tạp, hoặc các trường hợp không thể chấp nhận giả thiết đồng khả năng. Trong nhiều ví dụ, 9
  11. ở các phần sau chúng ta tính xác suất theo cách đồng khả năng và trong các bài tập cũng có rất nhiều bài tính xác suất theo cách đồng khả năng. Ví dụ 4.3. Gieo một đồng tiền có thể coi hai kết quả sấp (S), ngửa (N), là 2 biến cố sơ 1 cấp đồng khả năng, mỗi biến cố có xác suất . Nếu gieo một lúc hai đồng tiền thì có thể 2 coi 4 kết quả sau là đồng khả năng: (S, S), (S, N), (N, S), (N, N), một biến cố sơ cấp có xác 2 1 suất 1 . Nếu gọi A là biến cố "hai đồng tiền cùng mặt" thì xác suất p(A) = = vì A gồm 4 4 2 2 biến cố sơ cấp (S, S) và (N, N). Ví dụ 4.4. Vé xổ số có bốn chữ số, khi quay số trúng thưởng có 1 vé trúng giải nhất. Tính xác suất để mua 1 vé thì vé đó sẽ trúng giải nhất. Có tất cả 104 = 10000 vé bốn chữ số, có thể coi đó là 10000 kết quả đồng khả năng khi quay số trúng thưởng. Như vậy mỗi vé có xác 1 suất trúng giải nhất như nhau và bằng 10000 . Tính xác suất để vé trúng giải nhất là vé có bốn chữ số khác nhau? Trong 10000 vé có 4 A10 = 5040 vé có bốn chữ số khác nhau (vé xổ số có thể bắt đầu bằng số 0) như vậy xác 5040 suất để vé trúng giải nhất có bốn chữ số khác nhau là 10000 = 0, 504. Ví dụ 4.5. Gieo đồng thời hai con xúc xắc cân đối và đồng chất. Tìm xác suất để: a) Tổng số chấm ở mặt trên hai con xúc xắc bằng 8. b) Hiệu các số chấm ở mặt trên hai con xúc xắc có giá trị tuyệt đối bằng 2. c) Số chấm ở mặt trên hai con xúc xắc bằng nhau. Giải. Số kết quả đồng khả năng là n = 6.6 = 36. a) Gọi A là biến cố "tổng số chấm ở mặt trên hai con xúc xắc bằng 8", khi đó A = {(2, 6), (6, 2), (4, 4), (5, 3), (3, 5)} 5 xác suất phải tìm p(A) = . 36 b) Gọi B là biến cố "hiệu các số chấm ở mặt trên hai con xúc xắc có giá trị tuyệt đối bằng 8 2 2", khi đó B = {(1, 3), (3, 1), (2, 4), (4, 2), (3, 5), (5, 3)} và p(B) = = . 36 9 c) Gọi C là biến cố "số chấm ở mặt trên hai con xúc xắc bằng nhau", khi đó C = 6 1 {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} và p(C) = = . 36 6 Ví dụ 4.6. Một công ty cần tuyển hai nhân viên. Có 6 người nộp đơn trong đó có 4 nam và 2 nữ. Giả thiết rằng khả năng trúng tuyển của 6 người là như nhau. a) Tính xác suất để 2 người trúng tuyển đều là nam. b) Tính xác suất để 2 người trúng tuyển đều là nữ. c) Tính xác suất để có ít nhất 1 nữ trúng tuyển. 2 Giải. Số kết quả đồng khả năng C6 = 15. 1 a) Chỉ có một trường hợp là 2 nam trúng tuyển nên xác suất cần tìm là p = . 15 6 2 b) Số cách chọn 2 nữ trúng tuyển trong số 4 nữ là C2 = 6. Xác suất cần tìm p = = . 4 15 5 c) Chỉ có 1 trường hợp 2 nam trúng tuyển nên trong 14 trường hợp còn lại ta đều có ít nhất 14 1 nữ trúng tuyển. Xác suất cần tìm p = . 15 10
  12. Ví dụ 4.7. Gieo đồng thời 3 con xúc xắc được chế tạo cân đối, đồng chất. Tính xác suất để tổng số nốt xuất hiện của 3 con là 9. Giải. Mỗi kết quả của phép thử là một bộ ba (a, b, c), trong đó a, b, c là các số nguyên dương từ 1 đến 6. Vậy số kết quả đồng khả năng là63 = 216. Các bộ ba có tổng bằng 9 là: (1,2,6) và 5 hoán vị của nó; (1,3,5) và 5 hoán vị của nó (1,4,4) và 2 hoán vị của nó; (2,2,5) và 2 hoán vị của nó (2,3,4) và 5 hoán vị của nó; (3,3,3). Suy ra số trường hợp thuận lợi là 25 6+6+3+6+3+1=25. Vậy p(A) = . 216 §5 QUY TẮC CỘNG VÀ NHÂN XÁC SUẤT Sau khi tính xác suất của các biến cố tương đối đơn giản, chúng ta xem xét các biến cố phức tạp hơn. Để làm được việc này, ta xét một số phép tính trên các biến cố. Gọi A và B là hai biến cố xác định trên tập hợp các biến cố sơ cấp Ω. Hội của hai biến cố A và B ký hiệu A ∩ B là biến cố bao gồm các biến cố sơ cấp vừa của biến cố A, vừa của biến cố B. (Hội A ∩ B còn được gọi là biến cố "A và B" hoặc giao của A và B). Như vậy hội của hai biến cố A, B là biến cố "cả A và B đều xảy ra". Ví dụ 5.1. Gieo một xúc xắc, biến cố A "ra số chẵn" và biến cố B "ra một số chia được cho 3" có hội là biến cố sơ cấp "ra mặt 6", nói cách khác nếu kết quả vừa là số chẵn (có biến cố A) vừa là số chia được cho 3 (có biến cố B) thì hội A ∩ B là biến cố "ra mặt 6". Ví dụ 5.2. Gọi A là biến cố người đại diện của tổ là người được xếp loại giỏi về học tập, B là biến cố người đại diện của tổ là người biết chơi bóng chuyền thì A ∩ B là biến cố người đại diện của tổ là người vừa học giỏi vừa biết chơi bóng chuyền. Biến cố đối lập của biến cố A, ký hiệu A, là biến cố bao gồm các biến cố sơ cấp trong Ω nhưng không thuộc A. Như vậy A = Ω\A. Từ định nghĩa trên ta thấy biến cố A là biến cố đối lập của biến cố A thì A cũng là biến cố đối lập của A. Ta nói A và A là hai biến cố đối lập của nhau. Ví dụ 5.3. Gieo một xúc xắc nếu gọi A là biến cố "ra mặt chẵn thì biến cố đối lập A của A là biến cố "ra mặt lẻ". Ví dụ 5.4. Khi thi thì biến cố A "thi đỗ" có biến cố đối lập A là "thi trượt". Hai biến cố A và B được gọi là xung khắc nếu hội của chúng là rỗng A ∩ B = ∅. Khi tiến hành phép thử hai biến cố xung khắc không có biến cố sơ cấp chung nào nên không thể xuất hiện đồng thời. Ví dụ 5.5. Biến cố A "ra mặt chẵn" và biến cố C "ra mặt lẻ" là 2 biến cố xung khắc khi gieo một con xúc xắc. Ví dụ 5.6. Biến cố A "ra mặt chẵn" và biến cố B "ra một số chia được cho 3" không xung khắc. Ví dụ 5.7. Nếu trong hộp có 3 loại bi màu trắng, màu xanh, màu đỏ thì biến cố rút được bi xanh và biến cố rút được bi đỏ là 2 biến cố xung khắc nhưng không đối lập. 11
  13. Ví dụ 5.8. Khi thi thì biến cố A "đạt điểm giỏi" và biến cố B "đạt điểm khá" là hai biến cố xung khắc, nhưng không đối lập, vì còn nhiều điểm khác. biến cố A và biến cố C "trên trung bình" không xung khắc. Qua các ví dụ trên ta thấy đối lập là trường hợp riêng của xung khắc. Đối lập thì xung khắc nhưng xung khắc chưa chắc đã đối lập. Hợp của hai biến cố A và B, ký hiệu A ∪ B, là biến cố bao gồm tất cả các biến cố sơ cấp của biến cố A và biến cố B. Khi tiến hành phép thử thì biến cố A ∪ B xuất hiện khi có ít nhất một trong hai biến cố A và B xuất hiện. Nếu phân tích kỹ có thể thấy có ba trường hợp: A xuất hiện nhưng B không xuất hiện A ∩ B, B xuất hiện nhưng A không xuất hiện A ∩ B , cả A và B đều xuất hiện A ∩ B. Hợp A ∪ B còn được gọi là biến cố "A hoặc B". Ví dụ 5.9. Khi gieo xúc xắc nếu gọi A là biến cố "ra mặt chẵn", B là biến cố "ra một số chia hết cho 3" thì biến cố A ∪ B gồm bốn biến cố sơ cấp (2, 3, 4, 6). Ví dụ 5.10. Trong Ví dụ 5.7, khi rút bi trong hộp nếu gọi A là biến cố rút được bi trắng thì biến cố đối lập A là biến cố rút được bi xanh hoặc bi đỏ A = B ∪ C. Quy tắc cộng đơn giản Ta thừa nhận quy tắc cộng đơn giản sau đây: p(A ∪ B) = p(A) + p(B) nếu A và B xung khắc. (5.1) Hệ quả 5.10.1. Gọi A là biến cố đối lập của biến cố A, ta có p(A) = 1 − p(A). (5.2) Thật vậy, từ A ∪ A = Ω, A và A đối lập ta có 1 = p(Ω) = p(A ∪ A) = p(A) + p(A) ⇒ p(A) = 1 − p(A). Ví dụ 5.11. Trong hộp có 3 bi trắng, 4 bi xanh và 5 bi đỏ, gọi A là biến cố rút được bi trắng, B là biến cố rút được bi xanh, C là biến cố rút được bi đỏ. A là biến cố "bi rút ra không phải bi trắng", B ∪ C là biến cố "rút được bi xanh hoặc bi đỏ". 3 4 5 3 9 Ta có p(A) = , p(B) = , p(C) = , p(A) = 1 − = . 12 12 12 12 12 9 Vì A = B ∪ C nên p(B ∪ C) = . 12 4 5 9 Cũng có thể tính theo quy tắc cộng đơn giản: p(B ∪ C) = p(B) + p(C) = + = . 12 12 12 Ví dụ 5.12. Trong kỳ thi quy định "điểm giỏi" là điểm trên 8 (không cho điểm lẻ). Một học sinh vào thi, A là biến cố "đạt điểm 10", B là biến cố "đạt điểm 9". Giả sử với em đó xác suất p(A) = 0, 3, p(B) = 0, 4. Gọi C là biến cố "đạt điểm giỏi", C là hợp của A và B p(C) = p(A ∪ B) = p(A) + p(B) = 0, 3 + 0, 4 = 0, 7 12
  14. Ví dụ 5.13. 70% sản phẩm của xí nghiệp thuộc loại I, 20% thuộc loại II. số còn lại thuộc loại III. Khi kiểm tra để xuất khẩu thì chỉ chấp nhận sản phẩm loại I hoặc II. Gọi A là biến cố khi kiểm tra thì sản phẩm thuộc loại I, B là biến cố khi kiểm tra thì sản phẩm thuộc loại II, C là biến cố khi kiểm tra thì sản phẩm được chấp nhận cho xuất khẩu. p(C) = p(A ∪ B) = 0, 7 + 0, 2 = 0, 9. Xác suất có điều kiện Xét một phép thử được tiến hành trong một điều kiện đầu nào đó và hai biến cố A, B. Xác suất có điều kiện p(B/A) là xác suất của B khi đã xảy ra biến cố A. Có thể coi như B được tính khi phép thử được tiến hành trong điều kiện đầu mới gồm điều kiện đầu cũ cộng thêm sự xuất hiện (có mặt) biến cố A. 3 4 Ví dụ 5.14. Lấy lại Ví dụ 5.11 p(A) = ; p(B) = . Nếu bây giờ biết bi lấy ra không 12 12 4 phải bi trắng (biến cố A ) thì p(B/A) = . Trong ví dụ này p(B/A) 6= p(B). 9 Ví dụ 5.15. Gọi A là biến cố rút được con pích, B là biến cố rút được con át trong cỗ bài 13 4 1 tu lơ khơ 52 quân với 4 loại: cơ, rô, nhép, pích. p(A) = ; p(B) = = . 52 52 13 1 Nếu biết con bài rút ra là con pích (biến cố A) thì xác suất rút được con át p(B/A) = . 13 Trong ví dụ này p(B) = p(B/A). Một túi đựng 5 quả cầu, (trong đó có 2 quả màu trắng). Lấy ngẫu nhiên (không hoàn lại) lần lượt từ túi ra 2 quả cầu. Tính xác suất để lần thứ hai được quả cầu trắng biết rằng lần thứ nhất lấy được quả cầu trắng. Giải. Gọi A là biến cố "lần thứ hai lấy được quả cầu trắng" và gọi B là biến cố "lần thứ hai nhất lấy được quả cầu trắng". Ta cần tìm p(A/B). Ta thấy lần thứ nhất đã lấy được quả cầu trắng (B đã xãy ra) nên trong túi còn 4 quả cầu, 1 trong đó có 1 quả trắng. Vậy p(A/B) = 4 = 0.25 Quy tắc nhân xác suất Nếu A và B là hai biến cố trong một phép thử ta thừa nhận quy tắc nhân sau: p(A ∩ B) = p(A).p(B/A) = p(B).p(A/B). (5.3) Ví dụ 5.16. Trong hộp có 10 phiếu, 2 phiếu ghi "trúng thưởng". Một người rút lần lượt 2 phiếu, tính xác suất để cả 2 phiếu đều trúng thưởng. Giải. Gọi A là biến cố phiếu đầu trúng thưởng, B là biến cố phiếu thứ hai trúng thưởng, C là biến cố 2 phiếu đều trúng thưởng. Có thể tính như sau: 2 Khi rút phiếu đầu có 10 phiếu trong đó có 2 phiếu trúng p(A) = . Khi đã xảy ra A 10 1 thì còn lại 9 phiếu trong đó có 1 phiếu trúng do đó p(B/A) = . Từ đó suy ra: 9 2 1 1 p(C) = p(A ∩ B) = . = . 10 9 45 13
  15. Ví dụ 5.17. Sản phẩm trước khi xuất khẩu phải qua hai lần kiểm tra. Bình quân 80% sản phẩm làm ra qua được lần kiểm tra I, 90% sản phẩm đã qua lần kiểm tra I và thì sẽ qua được kiểm tra II. Tính xác suất để sản phẩm được xuất khẩu. Giải. Gọi A là biến cố qua được kiểm tra I, B là biến cố qua được kiểm tra II, C là biến cố đạt tiêu chuẩn xuất khẩu. p(A) = 0, 8; p(B/A) = 0, 9. p(C) = p(A).p(B/A) = 0, 8.0, 9 = 0, 72. Biến cố độc lập Nếu biến cố B có xác suất có điều kiện p(B/A) bằng xác suất p(B) thì B được gọi là biến cố không phụ thuộc biến cố A. Có thể chứng minh ngay nếu B không phụ thuộc A thì A không phụ thuộc B, thực vậy theo quy tắc nhân tổng quát: p(A∩B) = p(A).p(B/A) = p(B).p(A/B). Nếu p(B/A) = p(B) thì thay vào hệ thức trên suy ra p(A/B) = p(A), tức là A không phụ thuộc B. Qua chứng minh này chúng ta thấy tính phụ thuộc là tương hỗ nên sẽ thay thuật ngữ "không phụ thuộc" bằng thuật ngữ "độc lập". Hai biến cố A, B trong cùng một phép thử gọi là độc lập khi p(A/B) = p(A) (hoặc p(B/A) = p(B)). Nếu A và B độc lập thì có thể chứng minh A và B độc lập, A và B độc lập, A và B độc lập. Trong thực tế nếu hai biến cố A và B trong cùng một phép thử không ảnh hưởng đến nhau thì thường thừa nhận tính độc lập. Quy tắc nhân đơn giản. Nếu A và B độc lập thì từ quy tắc nhân (5.3) suy ra quy tắc nhân đơn giản sau: p(A ∩ B) = p(A).p(B) (5.4) Ví dụ 5.18. Hai người đi bắn, xác suất để người thứ nhất bắn trúng đích là p(A) = 0, 7, xác suất để người thứ hai bắn trúng đích là p(B) = 0, 8. Xác suất để cả hai người bắn trúng p(A ∩ B) = 0, 7.0, 6 = 0, 56. Ví dụ 5.19. Sản phẩm mới làm ra phải gửi đi kiểm nghiệm ở hai phòng thí nghiệm độc lập. Nếu cả hai phòng chấp nhận thì sản phẩm được sản xuất đại trà. Xác suất để sản phẩm được phòng thí nghiệm A chấp nhận lại 0,8. Xác suất để được phòng thí nghiệm B chấp nhận là 0,9. Vậy xác suất để sản phẩm được đem ra sản xuất đại trà là 0,8 . 0,9 = 0,72. Quy tắc cộng tổng quát Nếu A và B là hai biến cố trong một phép thử thì có thể chứng minh quy tắc cộng tổng quát sau: p(A ∪ B) = p(A) + p(B) − p(A ∩ B). (5.5) Nếu A và B xung khắc thì p(A ∩ B) = 0 nên (5.5) trùng với quy tắc cộng đơn giản (5.1). Ví dụ 5.20. Trong Ví dụ 5.18 nếu gọi C là biến cố đích bị bắn trúng thì C = A ∪ B, p(C) = p(A ∪ B) = 0, 7 + 0, 8 − 0, 56 = 0, 94. Có thể tính cách khác: p(C) = p(A ∩ B) + p(A ∩ B) + p(A ∩ B) 14
  16. Ví dụ 5.21. Trong Ví dụ 5.19, gọi C là biến cố "có phòng thí nghiệm chấp nhận sản phẩm mới" C = A ∪ B, p(C) = 0, 8 + 0, 9 − 0, 8.0, 9 = 0, 98 Có thể lập luận như sau: C là biến cố đối lập của biến cố "cả hai phòng thí nghiệm đều không chấp nhận sản phẩm mới": p(C) = 1 − p(A ∩ B) = 1 − 0, 2.0, 1 = 0, 98 §6 HỆ BIẾN CỐ ĐẦY ĐỦ VÀ XÁC SUẤT TOÀN PHẦN Cho một hệ các biến cố A1,A2, , An trong một phép thử. Nếu hệ thoả mãn hai điều kiện: a) Từng đôi một xung khắc, tức là Ai ∩ Aj = ∅ với i 6= j (i, j = 1, n); b) hợp của tất cả các biến cố là biến cố tất yếu, tức là A1 ∪ A2 ∪ ∪ An = Ω thì hệ được gọi là hệ đầy đủ hay hệ toàn phần. Có thể trình bày lại hai điều kiện trên dưới dạng: Có một và chỉ một trong các biến cố Ai xảy ra khi tiến hành phép thử. (Có một là điều kiện b), còn chỉ có một là điều kiện a)). Khi có một hệ biến cố đầy đủ thì có thể tính xác suất của một biến cố bất kì B trong phép thử đó theo công thức: p(B) = p(A1)p(B/A1) + p(A2)p(B/A2) + + p(An)p(B/An) (6.1) n X p(B) = p(Ai)p(B/Ai). i=1 (6.1) còn gọi là Công thức xác suất toàn phần. Ví dụ 6.1. Cửa hàng nhận trứng của 3 cơ sở nuôi gà theo tỉ lệ: 25%, 35%, và 40%. Nếu tỉ lệ trứng hỏng của 3 cơ sở là 5%, 4% và 2% thì xác suất để một quả trứng mua tại cửa hàng bị hỏng là bao nhiêu? Giải. Khi mua một quả trứng của cửa hàng thì có một và chỉ một trong 3 biến cố xảy ra: biến cố A1 "trứng của cơ sở I", biến cố A2 "trứng của cơ sở II", biến cố A3 "trứng của cơ sở III". Xác suất của ba biến cố trên lần lượt là: 0,25; 0,35; 0,40. Gọi B là biến cố trứng mua ở cửa hàng bị hỏng. Xác suất trứng hỏng tại ba cơ sở lần lượt là p(B/A1) = 0, 05; p(B/A2) = 0, 04; p(B/A3) = 0, 02; p(B) = 0, 25.0, 05 + 0, 35.0, 04 + 0, 40.0, 02 = 0, 0345. Ví dụ 6.2. Có 2 hộp bên ngoài giống nhau, hộp thứ nhất chứa 1 sản phẩm hỏng và 9 sản phẩm tốt, hộp thứ hai chứa 2 sản phẩm hỏng và 8 sản phẩm tốt. Lấy ngẫu nhiên một hộp, sau đó lấy ngẫu nhiên một sản phẩm. Tính xác suất để được sản phẩm tốt. Gọi A1 là biến cố lấy được hộp thứ nhất, A2 là biến cố lấy được hộp thứ hai, vì chọn 1 1 ngẫu nhiên nên p(A ) = ; p(A ) = . Gọi B là biến cố "sản phẩm tốt" ta có: 1 2 2 2 1 9 1 8 17 p(B) = . + . = = 0, 85. 2 10 2 10 20 15
  17. §7 CÔNG THỨC BAYES Cho một hệ biến cố đầy đủ A1,A2, , An. Xác suất của biến cố B tính theo công thức 6.1. Viết lại công thức nhân tổng quát p(Ai ∩ B) = p(Ai).p(B/Ai) = p(B).p(Ai/B), (i = 1, n) suy ra: p(A ).p(B/A ) p(A /B) = i i , (i = 1, n) (7.1) i p(B) Công thức 7.1 có tên là công thức Bayes, công thức này cho phép tính p(Ai/B) là gọi là xác suất hậu nghiệm, còn xác suất p(Ai) được gọi là xác suất tiền nghiệm. Trong Ví dụ 6.1 0, 25.0, 05 p(A /B) = = 0, 3623. 1 0, 0345 Có thể hiểu xác suất hậu nghiệm p(Ai/B) như sau: Vào cửa hàng mua một quả trứng, xác suất mua phải quả trứng hỏng bằng 0,0345, nói cách khác số trứng hỏng của cửa hàng là 3, 45%. Bây giờ nếu quả trứng ta mua đúng là quả trứng hỏng thì xác suất để quả đó là quả trứng nhập của cơ sở I bằng 0,3623. Trong Ví dụ 6.2 1/2.8/10 8 p(A /B) = = 0, 47. 2 17/20 17 ≈ Có thể hiểu xác suất hậu nghiệm p(A2/B) là như sau: Lấy ngẫu nhiên một hộp, sau từ hộp nó lấy ngẫu nhiên ra một sản phẩm và được sản phẩm tốt, thế thì xác suất để hộp mà ta lấy ra là hộp thứ hai bằng 0,47. Bài Tập 1.16. Có 10 vé đánh số từ 1 đến 10. Rút ngẫu nhiên 6 vé, tính xác suất để trong đó: a) Có vé số 1. b) Có vé số 1 và số 2. 1.17. Số điện thoại ở một vùng có 5 chữ số, quay ngẫu nhiên một số, tính xác suất để: a) Được số có 5 chữ số khác nhau; b) Số mà các chữ số đều lẻ. 1.18. Có 20 câu hỏi thi, mỗi học sinh chọn một đề gồm 3 câu. Học sinh chỉ học 12 câu, tính xác suất để ít nhất làm được một câu. 1.19. Trong bình có 2 bi trắng, 4 bi đen. Lấy lần lượt các bi ra khỏi bình. Tính xác suất để bi cuối cùng là bi đen. 1.20. Có 2 hộp, hộp thứ nhất đựng 3 bi trắng, 7 bi đỏ, 15 bi xanh, hộp thứ hai đựng 10 bi trắng, 6 bi đỏ, 9 bi xanh. Từ mỗi hộp ta lấy ngẫu nhiên ra một bi, tính xác suất để được hai bi cùng màu. 16
  18. 1.21. Trong một vùng tỉ lệ người mắc bệnh tim là 9% mắc bệnh huyết áp là 12%, mắc cả hai bệnh là 7%. Gặp ngẫu nhiên một người trong vùng, tính xác suất để người đó không mắc cả hai bệnh nói trên. 1.22. Một lớp học có 30 học sinh trong đó có 4 giỏi, 8 khá và 10 trung bình số còn lại loại yếu. Chọn ngẫu nhiên 3 học sinh, tính xác suất: a) Cả 3 đều yếu; b) Có ít nhất một học sinh giỏi; c) Có đúng một học sinh khá. 1.23. Một lô hàng có 6 chính phẩm và 4 phế phẩm được chia thành hai phần bằng nhau. Tính xác suất để mỗi phần đều có số chính phẩm như nhau. 1.24. Hộp có 10 sản phẩm trong đó có 2 phế phẩm. Lấy ngẫu nhiên 2 sản phẩm, tính xác suất để cả hai đều là phế phẩm trong 3 trường hợp: a) Lấy lần lượt hai sản phẩm; b) Lấy một lúc hai sản phẩm; c) Lấy có hoàn lại (tức là lấy sản phẩm thứ nhất ra xem sau đó hoàn lại, trộn đều rồi mới lấy sản phẩm thứ hai). 1.25. Phải gieo hai đồng tiền bao nhiều lần để biến cố "ít nhất một lần ra hai mặt sấp" có xác suất không nhỏ hơn 0,99. 1.26. Có 18 xạ thủ trong đó có 5 người bắn trúng đích với xác suất 0,8 (giỏi), 7 người bắn trúng với xác suất 0,7 (khá), 4 người bắn trúng với xác suất 0,6 (trung bình), 2 người bắn trúng với xác suất 0,5 (đạt). Chọn ngẫu nhiên một người vào bắn. a) Tính xác suất để người đó bán trượt. b) Nếu người đó bắn trượt thì nhiều khả năng người đó thuộc nhóm nào? 1.27. Hai máy cùng sản xuất 1 loại sản phẩm, tỉ lệ phế phẩm của máy I là 0,03, của máy II 2 1 là 0,02. Kho chứa 3 sản phẩm của máy I, 3 sản phẩm của máy II. Lấy ngẫu nhiên một sản phẩm. a) Tính xác suất để được sản phẩm tốt. b) Nếu được sản phẩm tốt thì nhiều khả năng sản phẩm đó là của máy nào? 1.28. Tỉ lệ người nghiện thuốc lá ở một vùng là 30%. Biết tỉ lệ viêm họng trong số người nghiện thuốc lá là 60% còn trong người không nghiện là 40%. Gặp ngẫu nhiên một người. a) Tính xác suất để đó là người viêm họng. b) Nếu người đó viêm họng thì tính xác suất để đó là người nghiện thuốc lá. 1.29. Trong một bệnh viện tỉ lệ bệnh nhân của các tỉnh như sau: 25% của tỉnh A, 35% của tỉnh B, 40% của tỉnh C. Tỉ lệ kỹ sư trong số bệnh nhân của tỉnh A là 2%, của tỉnh B là 3%, của tỉnh C là 3, 5%. Gặp ngẫu nhiên một bệnh nhân, tính xác suất để: a) Bệnh nhân đó là một kỹ sư ; b) Nhiều khả năng kỹ sư đó là người tỉnh nào? 17
  19. 1.30. Lô hàng xuất khẩu có 100 kiện hàng, trong đó 60 kiện của xí nghiệp I và 40 kiện của xí nghiệp II. Tỉ lệ phế phẩm của hai xí nghiệp là 30% và 10% Lấy ngẫu nhiên một kiện rồi lấy ra một sản phẩm. a) Tính xác suất để được một phế phẩm. b) Nếu sản phẩm lấy ra là một phế phẩm thì nhiều khả năng kiện hàng lấy ra là của xí nghiệp nào? 1.31. Có 2 hộp đựng cam, hộp I có 9 quả tốt, 1 quả hỏng, hộp II có 6 quả tốt, 2 quả hỏng. Lấy ngẫu nhiên một quả từ hộp I bỏ sang hộp II. sau đó lấy ngẫu nhiên ở hộp II ra hai quả. Tính xác suất để cả hai quả đều hỏng. 1.32. Một cỗ máy có 3 bộ phận, xác suất hỏng trong ngày lần lượt là 0,2; 0,4; 0,3. Trong ngày có hai bộ phận hỏng, tính xác suất để đó là bộ phận 1 và 2. 1.33. Một người có 3 chỗ ưa thích như nhau để câu cá. Xác suất để câu được cá của một lần thả câu ở những chỗ đó lần lượt là 0,6; 0,7; 0,8. Người đó chọn ngẫu nhiên một chỗ và thả câu 3 lần thì câu được một con cá. Tính xác suất để chỗ câu đó là chỗ 1. 1.34. Tỉ lệ thuốc hỏng ở lô A là 0,10, ở lô B là 0,08 và ở lô C là 0,15. Chọn ngẫu nhiên một lô sau đó lấy ra 3 lọ. Tính xác suất để ít nhất có một lọ hỏng. 1.35. Hộp A có 15 lọ thuốc tốt, 5 lọ hỏng. Hộp B có 17 lọ tốt, 3 lọ hỏng. Hộp C có 10 lọ tốt 10 lọ hỏng. a) Lấy ở mỗi hộp một lọ, tính xác suất được 2 lọ tốt, 1 lọ hỏng. b) Chọn ngẫu nhiên một hộp sau đó lấy từ đó ra 3 lọ, tính xác suất được 2 lọ tốt và 1 lọ hỏng. c ) Trộn chung 3 hộp rồi từ đó lấy ra 3 lọ, tính xác suất được 2 lọ tốt, 1 lọ hỏng. d) Kiểm tra từng hộp cho đến khi phát hiện đủ 3 lọ hỏng. Tính xác suất để việc kiểm tra dừng lại ở lần kiểm tra thứ 5. 18
  20. Chương 2 BIẾN NGẪU NHIÊN §1 BIẾN NGẪU NHIÊN RỜI RẠC Ví dụ 1.1. Gieo một đồng tiền. Gọi X là kết quả với quy ước nếu ra mặt ngửa thì ghi 0, ra 1 1 mặt sấp thì ghi 1. Xác suất ra 0 là . Xác suất ra 1 là . Ghi lại kết quả dưới dạng bảng: 2 2 X 0 1 1 1 p 2 2 Cũng gieo đồng tiền nhưng quy ước nếu ngửa thì coi như thua và phải nộp 10 đ, sấp coi như thắng và nhận được 10 đ. Số tiền thu dược Y sẽ là -10 đ hoặc 10 đ với xác suất bằng 1 nhau và bằng . 2 Y -10 10 1 1 p 2 2 Ví dụ 1.2. Tung một con xúc xắc, gọi X là kết quả với quy ước nếu ra mặt 1 thì ghi số 1 ra một 2 thì ghi số 2, ra mặt 6 thì ghi số 6. Như vậy X có thể lấy các giá trị 1, 2, 3, 4, 5, 1 6 với xác suất bằng nhau và bằng . 6 X 1 2 3 4 5 6 1 1 1 1 1 1 p 6 6 6 6 6 6 Nếu chỉ quan tâm đến số chẵn hay lẻ thì quy ước ghi kết quả Y như sau: nếu ra mặt lẻ thì ghi 0, nếu ra mặt chẵn thì ghi 1. Như vậy biến Y có thể lấy các giá trị 0 và 1 với xác suất 1 bằng nhau và bằng . 2 Y 0 1 1 1 p 2 2 Nếu quan tâm đến việc ra mặt 6 thì quy ước ghi kết quả Z như sau: 0 nếu ra mặt nhỏ 5 hơn 6, 1 nếu ra mặt 6. Như vậy Z sẽ lấy giá trị 0 với xác suất và lấy giá trị 1 với xác suất 6 1 6 Z 0 1 5 1 p 6 6 19
  21. Ví dụ 1.3. Trồng 10 cây, xác suất sống của mỗi cây là 0,8. Coi việc trồng các cây là các phép thử lặp (y hệt và độc lập), số cây sống X có thể là 0, 1, 2, . . . , 10 với các xác suất khác nhau tính theo công thức (sẽ trình bày kĩ ở phần phân phối nhị thức): k k 10−k pk = p(X = k) = Cn0, 8 .0, 2 , k = 1, 10 X 0 1 2 k 10 p p0 p1 p2 pk p10 Ví dụ 1.4. Trong hộp có 4 bi trắng, 2 bi đen, lấy ngẫu nhiên 2 bi. Gọi X là số bi trắng có trong 2 bi lấy ra, ta thấy X có thể là 0, 1, 2 với các xác suất tính lần lượt như sau (sẽ trình bày ở phần phân phối siêu bội): 0 2 1 1 2 0 C4 .C2 1 C4 .C2 8 C4 .C2 6 p(X = 0) = 2 = ; p(X = 1) = 2 = ; p(X = 2) = 2 = . C6 15 C6 15 C6 15 X 0 1 2 1 8 6 p 15 15 15 Qua các ví dụ trên ta thấy: Cho một phép thử có tập hợp các biến cố sơ cấp Ω và một hàm X xác định trên các biến cố sơ cấp. Nếu biết được tất cả các giá trị xi của X và các xác suất tương ứng pi = p(X = xi), nhưng không biết khi tiến hành phép thử X sẽ lấy giá trị nào trong các xi thì X được gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên liên kết với phép thử đã cho. Một ĐLNN được gọi là rời rạc nếu tập giá trị mà nó có thể nhận là tập hữu hạn hoặc vô hạn đếm được. Đối với ĐLNN rời rạc ta có thể liệt kê được các giá trị của nó. Một ĐLNN được gọi là liên tục nếu tập giá trị mà nó có thể nhận được có thể lấp kín cả một khoảng trên trục số. Đối với ĐLNN liên tục, không thể liệt kê được các giá trị của nó. Ví dụ: Chiều cao của học sinh trong một lớp học, khối lượng của một loại hoa quả là những ĐLNN liên tục. §2 BẢNG PHÂN PHỐI VÀ HÀM PHÂN PHỐI Cho một biến ngẫu nhiên X có các giá trị có thể xi và các xác suất tương ứng pi. Ghi lại xi và pi vào một bảng, gọi là bảng (hay dãy) phân phối: X x x x 1 2 n (2.1) p p1 p2 pn Các biến cố (X = xi) i = 1, 2, , n là các biến cố xung khắc có tổng xác suất bằng 1, như vậy các biến cố nói trên là một hệ biến cố đầy đủ. Ngoài cách theo dõi X bằng bảng phân phối, có thể theo dõi X bằng hàm phân phối F (x). Hàm phân phối F (x) được định nghĩa như sau: Cho x, F (x) là xác suất của biến cố X < x, tức là xác suất để biến ngẫu nhiên X lấy các giá trị nhỏ hơn x (hay còn gọi là bên trái x) F (x) = p(X < x). 20
  22. Nếu có dãy phân phối (2.1) thì có thể tìm được hàm phân phối F (x): x ≤ x1 bên trái x1 không có giá trị nào của X nên F (x1) = p(X xk tất cả các giá trị có thể của X đều ở bên trái x nên F (x) = p(X > xn) = 1.   0 nếu x ≤ x1   p1 nếu x1 < x ≤ x2   p + p nếu x < x ≤ x F (x) = 1 2 2 3 p + p + p nếu x < x ≤ x  1 2 3 3 4     1 nếu xn < x. Trong Ví dụ 1.2 ta có dãy phân phối: Z 0 1 5 1 p 6 6 Hàm phân phối:   0 nếu x ≤ 0  5 F (x) = 6 nếu 0 < x ≤ 1  1 nếu 1 < x. Trong Ví dụ 1.4 X 0 1 2 1 8 6 p 15 15 15 Hàm phân phối:  0 nếu x ≤ 0   1 15 nếu 0 < x ≤ 1 F (x) = 9  15 nếu 1 < x ≤ 2   1 nếu 2 < x. §3 CÁC SỐ ĐẶC TRƯNG Đối với các biến ngẫu nhiên nếu có bảng phân phối (hoặc hàm phân phối) thì coi như có sự hiểu biết đầy đủ về biến. Trong một số vấn đề không cần phải biết đầy đủ như vậy mà chỉ cần biết một số số đặc trưng cho dãy phân phối về một khía cạnh nào đó. Người ta chia các số đặc trưng thành 2 nhóm: nhóm đặc trưng cho vị trí và nhóm đặc trưng cho độ phân tán. 21
  23. Nhóm đặc trưng cho vị trí gồm một số số như: kỳ vọng, trung vị, mod, tứ phân vị dưới, tứ phân vị trên Nhóm đặc trưng cho độ phân tán (hay còn gọi là đặc trưng cho độ tập trung) gồm phương sai, độ lệch chuẩn, biên độ, hệ số biến động, Ở đây chúng ta chỉ xem xét hai số đặc trưng là kỳ vọng và phương sai. 3.1 Kỳ vọng Kỳ vọng, ký hiệu là M(X) hay MX hay EX, được tính theo công thức: N X MX = xipi. (3.1) i=1 Phương sai, ký hiệu là D(X) hay DX, VX, VarX được tính theo công thức: N X 2 DX = (xi − MX) pi. (3.2) i=1 Khai triển bình phương ta có cách tính thứ hai: N X 2 2 DX = xi pi − (MX) . (3.3) i=1 Trong Ví dụ 1.1 1 1 1 1 1 1 1 1 1 1 1 1 MX = 0. +1. = ; DX = (0− )2. +(1− )2. = hay DX = 02. +12. −( )2 = . 2 2 2 2 2 2 2 4 2 2 2 4 Trong Ví dụ 1.2 5 1 1 1 5 1 1 5 5 1 1 5 MZ = 0. +1. = ; DZ = (0− )2. +(1− )2. = hay DZ = 02. +12 −( )2 = . 6 6 6 6 6 6 6 36 6 6 6 36 Trong Ví dụ 1.4 1 8 6 20 4 1 8 6 4 16 MX = 0. + 1. + 2. = = ; DX = 02. + 12. + 22. − ( )2 = . 15 15 15 15 3 15 15 15 3 45 3.2 Tính chất của kỳ vọng và phương sai Có thể chứng minh kỳ vọng có 3 tính chất sau: a) Nếu C là hằng số thì MC = C b) Nếu a là hằng số thì M(aX) = aMX c) Nếu X và Y là 2 biến ngẫu nhiên thì M(X + Y ) = MX + MY *a) Coi C là trường hợp đặc biệt của biến ngẫu nhiên lấy 1 giá trị C với xác suất 1, do đó MC = C.1 = C. *b) Đại lượng aX có các giá trị axi với xác suất pi do đó n n X X M(aX) = axipi = a xipi = aMX i=1 i=1 *c) Thừa nhận tính chất này. Từ 3 tính chất trên có thể chứng minh: nếu a và b là hai hằng số thì M(aX+b) = aMX+b * Thật vậy M(aX + b) = M(aX) + M(b) = aMX + b. 22
  24. Có thể chứng minh phương sai DX có ba tính chất sau: a) DC = 0 b) D(aX) = a2DX c) D(X + Y ) nói chung khác DX + DY , nhưng nếu X và Y là hai biến ngẫu nhiên độc lập theo nghĩa: các biến cố (X = xi), i = 1, k và (Y = yi), j = 1, l là các biến cố độc lập, nói cách khác hai biến X và Y liên kết với hai phép thử độc lập thì: D(X + Y ) = DX + DY. Cách chứng minh tưng tự như đối với kỳ vọng (ở đây thừa nhận). Từ b) và c) có thể suy ra D(−Y ) = DY . Từ 3 tính chất có thể suy ra: D(aX + b) = a2DX. Ví dụ 3.1. Tung hai đồng tiền, X là biến ngẫu nhiên liên kết với đồng tiền thứ nhất. Y là 1 biến ngẫu nhiên liên kết với đồng tiền thứ hai, X và Y lấy giá trị 0 và 1 với xác suất 2 tuỳ theo đồng tiền ra mặt ngửa hay sấp, còn Z là tổng X + Y , coi X và Y độc lập, ta có dãy phân phối của X, Y và Z X 0 1 Y 0 1 1 1 1 1 p 2 2 p 2 2 Z 0 1 2 1 1 1 p 4 2 4 1 1 1 1 1 1 1 MZ = 0. + 1. + 2. = 1; DZ = 02. + 12. + 22. − 12 = 4 2 4 4 2 4 2 1 1 1 1 1 MX + MY = + = 1; DX + DY = + = ; 2 2 4 4 2 1 MZ = MX + MY = 1; DZ = DX + DY = . 2 Ví dụ 3.2. Tung hai con xúc xắc, X là số điểm trên con xúc xắc thứ nhất, Y là số điểm trên con xúc xắc thứ hai. Z là tổng số điểm trên hai xúc xắc: Z = X + Y 1+2+3+4+5+6 7 MX = MY = = ; 6 2 12 + 22 + 32 + 42 + 52 + 62 7 35 DX = DY = − ( )2 = 6 2 12 Z có phân phối Z 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 5 4 3 2 1 p 36 36 36 36 36 36 36 36 36 36 36 MZ = (2.1 + 3.2 + 4.3 + 5.4 + 6.5 + 7.6 + 8.5 + 9.4 + 10.3 + 11.2 + 12.1) : 36 = 7 = MX + MY 22.1 + 32.2 + 42.3 + 52.4 + 62.5 + 72.6 + 82.5 + 92.4 + 102.3 + 112.2 + 122.1 DZ = − 72 36 35 = = DX + DY. 6 23
  25. §4 BIẾN NGẪU NHIÊN RỜI RẠC CÓ VÔ SỐ GIÁ TRỊ Trong §1 ta đưa ra khái niệm biến ngẫu nhiên rời rạc có một số hữu hạn giá trị x1, x2, , xn. Sau đây là hai ví dụ về biến ngẫu nhiên rời rạc có vô số giá trị. Ví dụ 4.1. Một người đi bắn, xác suất trúng đích là 0,4. Người đó quyết tâm bắn cho đến khi bắn trúng mới về, giả thiết thêm là số đạn không bị hạn chế. Gọi X là số đạn đã dùng cho đến khi về, ta có bảng phân phối: X 1 2 k p 0,4 0,6.0,4 0, 6k−1.0, 4 Ví dụ 4.2. Một lô hàng gồm rất nhiều sản phẩm, tỉ lệ phế phẩm là 20%. Người kiểm tra chọn lần lượt các sản phẩm ra cho đến khi phát hiện phế phẩm thì dừng. Gọi X là số sản phẩm đã kiểm tra cho đến khi kết thúc, ta có bảng phân phối: X 1 2 k p 0,2 0,8.0,2 0, 8k−1.0,2 Đối với biến rời rạc có vô số giá trị ta cũng có các số đặc trưng như đối với biến rời rạc có hữu hạn giá trị, tuy nhiên việc tính toán khó hơn. Gọi p là xác suất thành công trong một phép thử, q = 1 − p là xác suất thất bại. Làm các phép thử lần lượt cho đến khi thành công ta có dãy phân phối X 1 2 k p p q.p qk−1.p 1 q Dùng cách tính tổng một chuỗi ta có MX = p ; DX = p2 1 0,6 Trong Ví dụ 4.1: p = 0, 6; q = 0.4; MX = 0,4 ; DX = 0,16 . 1 0,8 Trong Ví dụ 4.2: p = 0, 2; q = 0, 8; MX = 0,2 ; DX = 0,04 . Bài tập 2.1. Tỉ lệ học sinh lên lớp của một trường là 0,9. Gặp ngẫu nhiên hai em học sinh, gọi X là số em được lên lớp trong hai em đó. Viết bảng phân phối và hàm phân phối của X. Tính kỳ vọng MX và phương sai DX. 2.2. Trong số 10 hạt giống đem trồng có 7 hạt ra hoa vàng, 3 hạt ra hoa trắng. Lấy ngẫu nhiên 2 hạt. Gọi X là số hạt ra hoa vàng, tìm bảng phân phối và hàm phân phối của X. Tính MX và DX. 2.3. Tỉ lệ chính phẩm do một máy sản xuất ra là 90%. Kiểm tra 5 sản phẩm. gọi X là số phế phẩm trong 5 sản phẩm. Viết bảng phân phối và hàm phân phối của X. Tính MX và DX. 24
  26. 2.4. Một bác sĩ thú y chữa bệnh cho bò với xác suất chữa khỏi 0,8. Một nhóm 5 con bò bị bệnh được đem đến để bác sĩ chữa, gọi X là số con khỏi bệnh. Viết bảng phân phối và hàm phân phối của X. Tính MX và DX. 2.5. Một học sinh đi thi ngoại ngữ để lấy chứng chỉ, xác suất thi đỗ là 0,3, nếu không đỗ thì phải thi lại cho đến khi đỗ thì thôi. Gọi X là số lần thi. Viết bảng phân phối của X và kỳ vọng của X. 2.6. Một người trồng 2 cây cảnh, xác suất để cây thứ nhất ra hoa là 0,4, xác suất để cây thứ hai ra hoa là 0,6. Gọi X là số cây ra hoa, viết bảng phân phối và hàm phân phối của X, tính kỳ vọng MX và phương sai DX. §5 MỘT SỐ PHÂN PHỐI RỜI RẠC THƯỜNG GẶP Trong các mục trước chúng ta đã đề cập đến biến ngẫu nhiên rời rạc, bảng phân phối và hàm phân phối. Trong các ngành, nghề khi khảo sát các hiện tượng tự nhiên hoặc xã hội sẽ gặp các biến ngẫu nhiên có các phân phối khác nhau nhưng thông thường hay gặp một số phân phối sau đây: a) Phân phối Bec-nu-li (hay còn gọi là phân phối (0, l), ký hiệu là A(p)). Biến ngẫu nhiên X phân phối Bec-nu-li nếu bảng phân phối có dạng: X 0 1 p q = 1 − p p Phân phối này có kỳ vọng MX = p và phương sai DX = pq. Phân phối Bec-nu-li gắn liền với một phép thử có hai kết quả đối lập, một kết quả quy ước gọi là 1 hay thành công, có xác suất p, kết quả kia quy ước gọi là 0 hay thất bại, có xác suất q = 1 − p. Ví dụ 5.1. Gieo xúc xắc, gọi X là số lần ra mặt chẵn. X lấy giá trị 1 (chẵn) với xác suất 1 1 1 1 p = 2 , giá trị 0 (lẻ) với xác suất q = 2 ; MX = 2 ; DX = 4 . 1 Sinh con, gọi X là số con trai. X lấy giá trị 1 (trai) với xác suất p = 2 , giá trị 0 (gái) với 1 1 1 xác suất q = 2 ; MX = 2 ; DX = 2 . Ấp một quả trứng, gọi X là số trứng nở. X lấy giá trị 1 (nở) với xác suất p = 0, 8, giá trị 0 (không nở) với xác suất q = 0, 2; MX = 0, 8; DX = 0, 16. Một học sinh đi thi, gọi X là kết quả thi. X lấy giá trị 1 (đỗ) với xác suất p = 0, 9. Giá trị 0 (trượt) với xác suất q = 0, 1; MX = 0, 9; DX = 0, 09. Kiểm tra một sản phẩm, gọi X là số sản phẩm tốt, X lấy giá trị 1 (sản phẩm tốt) với xác suất p = 0, 8, giá trị 0 (sản phẩm hỏng) với xác suất q = 0, 2; MX = 0, 8; DX = 0, 16. b) Phân phối nhị thức Biến ngẫu nhiên X phân phối nhị thức nếu bảng phân phối có dạng: X 0 1 k n p p0 p1 pk pn 25
  27. k k n−k pk = p(X = k) = Cnp q . (5.1) Phân phối này có: Kỳ vọng MX = np. (5.2) Phương sai DX = npq. (5.3) Giá trị có xác suất lớn nhất ModX là số nguyên thoả mãn bất đẳng thức kép np − q ≤ ModX ≤ np + p. (5.4) Phân phối nhị thức gắn liền với việc lặp lại n lần một phép thử có hai biến cố đối lập (thành công và thất bại) với X là số lần thành công. Lặp ở đây có nghĩa là dãy phép thử được tiến hành trong cùng điều kiện và độc lập với nhau. Phân phối nhị thức thường ký hiệu là B(n, p). Ví dụ 5.2. Gia đình có 2 con, xác suất sinh con trai là 0,5. Coi các lần sinh là các phép thử 1 1 độc lập. Số con trai X phân phối B(2, 0, 5) với p = 2 ; q = 2 ; n = 2. X 0 1 2 1 1 1 p 4 2 4 1 MX = 1; DX = 2 ; ModX = 1. Ví dụ 5.3. Gieo 4 hạt đậu, xác suất để một hạt cho cây ra hoa vàng là 0,75, ra hoa trắng là 0,25. Số cây đậu ra hoa vàng X phân phối nhị thức B(4; 0, 75). X 0 1 2 3 4 p 0, 252 4.0, 75.0, 253 6.0, 75.0, 252 4.0, 753.0, 25 0, 754 MX = 4.0, 75 = 3; DX = 4.0, 75.0, 25 = 0, 75; ModX = 3. c) Phân phối siêu bội Cho N, M(M < N) và một số n ≤ min(M, N − M). Biến ngẫu nhiên X phân phối siêu bội hay siêu hình học nếu bảng phân phối có dạng: X 0 1 k N p p0 p1 pk pn k n−k CM CN−M pk = n , k = 0, n. (5.5) CN Phân phối này có: M Kỳ vọng MX = n. (5.6) N M N − M N − n Phương sai DX = n. . . (5.7) N N N − 1 Cho một hộp đựng N bi trong đó có M bi trắng, N − M bi đen. Lấy ngẫu nhiên một lúc hoặc lấy lần lượt không hoàn lại một nhóm n bi. Số bi trắng X trong nhóm phân phối siêu bội. 26
  28. Phân phối siêu bội thường ký hiệu là M(N, n). Nếu không có điều kiện n ≤ min(M, N − M) thì các giá trị có thể của biến X không phải từ 0 đến n mà ít hơn (bớt một số giá trị đầu hay bớt một số giá trị cuối), nhưng các xác suất vẫn tính theo (5.5) và vẫn gọi là phân phối siêu bội. Kỳ vọng và phương sai vẫn tính theo (5.6) và (5.7). M Gọi tỉ số bi trắng trong hộp là p = N . Nếu lấy có hoàn lại n lần (tức là lấy một bi, xem xong hoàn trả vào hộp, trộn đều sau đó lấy ngẫu nhiên ra một bi khác) thì số bi trắng X phân phối nhị thức B(n, p). Như vậy siêu bội và phân phối nhị thức có những nét giống nhau chỉ khác ở chỗ nếu lấy n bi không hoàn lại thì số bi trắng X phân phối siêu bội còn nếu có hoàn lại thì X phân phối nhị thức. Sự khác nhau trở nên không đáng kể nếu tổng số bi N và số bi trắng M là các số rất lớn. Ví dụ 5.4. Chọn một uỷ ban gồm 3 người trong số 3 nữ và 5 nam. Gọi X là số nữ trong uỷ ban, X có phân phối siêu bội: X 0 1 2 3 10 30 15 1 p 56 56 56 56 9 225 MX = 8 ; DX = 448 . Ví dụ 5.5. Hộp có 15 quả cam trong đó có 5 quả hỏng, lấy 2 quả. Gọi X là số cam hỏng trong 2 quả đó ta có: X 0 1 2 45 50 10 p 105 105 105 2 26 MX = 3 ; DX = 63 . d)Phân phối Poát-xông Biến ngẫu nhiên X phân phối Poát-xông nếu bảng phân phối có dạng: X 0 1 2 k p p0 p1 p2 pk e−µ p = µk (µ là một hằng số, k = 0, 1, ∞). (5.8) k k! Phân phối này có: MX = DX = µ. (5.9) Ví dụ 5.6. Chuyển 5000 quả trứng vào kho với xác suất vỡ của mỗi quả là 0,0004. Tính xác suất để khi vận chuyển có không quá một quả bị vỡ. Gọi X là số quả bị vỡ, ở đây có thể dùng phân phối nhị thức nhưng vì n = 5000 quá lớn, p = 0, 0004 lại quá bé nên có thể coi X phân phối xấp xỉ phân phối poát - xông với µ = np = 2 từ đó có thể tính: Xác suất để có không quá một quả bị vỡ bằng xác suất để X = 0(p0) cộng xác suất để X = 1(p1). e−2.20 1 e−2.21 2 p = = ; p = = 0 0! e2 1 1! e2 3 P (0 ≤ X ≤ 1) = p + p = = 0, 406. 0 1 e2 MX = DX = µ = 2. 27
  29. Ví dụ 5.7. Gieo 10000 hạt giống, xác suất để hạt lép là p = 0, 0005. Tính xác suất để có e2.56 đúng 6 hạt lép. Lấy µ = np = 5, ta có p6 = 6! e) Phân phối hình học Biến cố A có xác suất xuất hiện trong một phép thử là p. Lần lượt thực hiện phép thử cho đến khi A xuất hiện. Số lần thực hiện phép thử cho đến khi A xuất hiện là biến cố X có phân phối hình học. Bảng phân phối có dạng: X 1 2 k p p1 p2 pk k−1 pk = P (X = k) = q p với q = 1 − p, k = 1, 2, (5.10) 1 Kỳ vọng MX = (5.11) p q Phương sai DX = (5.12) p2 Ví dụ 5.8. Lô hàng khá lớn có 20% phế phẩm. Kiểm tra lần lượt cho đến khi phát hiện phế phẩm. Gọi X là số sản phẩm đã kiểm tra, X phân phối hình học với p = 0, 2. 1 0,8 Kì vọng MX = 0,2 = 5; Phương sai DX = 0,04 = 20. Ví dụ 5.9. Phát tín hiệu trên lạc với trạm bạn, xác suất nhận được là 0,4. Nếu trạm bạn báo đã nhận được tín hiệu thì dừng, nếu không thì phát tiếp. Gọi X là số tín hiệu đã phát 1 cho đến khi dừng, X phân phối hình học với p = 0, 4. Kì vọng MX = 0,4 = 2, 5; Phương sai 0,6 DX = 0,16 . Bài Tập 2.7. Trồng 5 cây, xác suất để cây ra hoa là 0,2. Tính xác suất đề ít nhất có 3 cây ra hoa. 1 2.8. Ấp 12 quả trứng, xác suất trứng nở là 3 . Tính xác suất để: a) Có 4 trứng nở. b) Có từ 3 đến 6 trứng nở. 2.9. Việc sản xuất ra các sản phẩm được tiến hành độc lập. Phải sản xuất mỗi đợt bao nhiêu sản phẩm để trung bình có 10 sản phẩm đạt tiêu chuẩn, biết rằng xác suất để một sản phẩm làm ra đạt tiêu chuẩn là 0,8. 2.10. Mỗi chậu ươm 2 hạt giống hai loại, hạt loại 1 có xác suất nẩy mầm 0,8, hạt loại 2 có xác suất nẩy mầm 0,6. Có tất cả 15 chậu, gọi X là số chậu mà cả 2 hạt đều nẩy mầm. Tìm giá trị hay gặp nhất của X. 2.11. Trồng cây, xác suất sống mỗi cây là 0,4. Phải trồng bao nhiêu cây để nhiều khả năng nhất có 25 cây sống. 2.12. Khi tiêm phòng dịch thì cứ một lô gà 50 con thường thấy có 30 con không mắc bệnh. Tính xác suất để gà không mắc bệnh khi tiêm chủng. 28
  30. 2.13. Có 9 học sinh vào quán ăn, 4 trong số đó dưới 16 tuổi. Lúc đầu chủ quán mang ra 5 cốc bia và nói là dành cho các em lớn tuổi, 4 cốc nước hoa quả sẽ mang ra sau. Các học sinh lại phân phát 5 cốc một cách ngẫu nhiên. Tính xác suất để có 2 em dưới 16 tuổi uống bia. 2.14. Một chuồng gà có 3 mái và 5 trống. Bắt ra 5 con, gọi X là số gà mái. Tìm bảng phân phối của X. 2.15. Khảo sát ở một vùng thấy cứ 1000 người thì có một người nghiện rượu. Tính xác suất để trong một khu vực dân cư 8000 người có ít hơn 7 người nghiện rượu. 2.16. Trung bình trên 10000m2 ruộng có 100 con chuột đồng. Tính xác suất để tại một mảnh ruộng rộng 1000m2 có nhiều hơn 15 con chuột. 2.17. Xác suất sinh con trai là 0,515. Tính xác suất để trong 200 trẻ mới sinh có 95 em gái. 2.18. Xác suất để khi trồng thì cây sống là 0,8. Trồng 100 cây, tính xác suất để: a) Có từ 75 đến 90 cây sống. b) Ít hơn 75 cây sống. c) Nhiều hơn 90 cây sống. 29
  31. Chương 3 MẪU QUAN SÁT VÀ BÀI TOÁN ƯỚC LƯỢNG §1 TỔNG THỂ VÀ MẪU QUAN SÁT 1.1 Tổng thể Tổng thể (còn được gọi là tập hợp chính), là tập hợp tất cả các phần tử do mục đích và phạm vi vấn đề cần nghiên cứu qui định. Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau: i) N: Số phần tử của tổng thể và được gọi là kích thước (cỡ) của tổng thể. ii) H: Dấu hiệu mà ta khảo sát (trong kinh tế được gọi là chỉ tiêu, trong vật lý gọi là đại lượng). Cần nhấn mạnh rằng, ta không nghiên cứu trực tiếp bản thân tổng thể mà chỉ nghiên cứu dấu hiệu H của nó. iii) xi, i = 1, k: là những giá trị của dấu hiệu H đo được trên các phần tử của tổng thể, xi là thông tin mà ta cần đến, còn phần tử của tổng thể là vật mang thông tin. iv) ni, i = 1, k : tần số của xi là số phần tử của tổng thể có chung giá trị xi ấy. v) pi, i = 1, k : tần suất của xi là tỷ số giữa tần số của xi và kích thước của tổng thể n p = i . i n Biểu diễn sự tương ứng của các giá trị xi và tần suất pi được gọi là bảng cơ cấu của tổng thể theo dấu hiệu H. Bảng này có dạng: Giá trị của H x1 x2 xi xk Tần suất pi p1 p2 pi pk Bảng này mô tả đầy đủ dấu hiệu H, nhưng phải sử dụng nhiều số liệu. Vì vậy để phân tích dấu hiệu H người ta thường tóm tắt bảng trên bằng các số đặc trưng sau đây: a) Trung bình của dấu hiệu H hay trung bình của tổng thể, ký hiệu là x và được xác định bởi: k P nixi k i=1 X x = = p x . n i i i=1 b) Phương sai mẫu của dấu hiệu H ký hiệu s2 và được xác định bởi k P 2 2 nixi − nx s2 = i=1 . (n − 1) c) Căn bậc hai của s2 là độ lệch chuẩn s. 31
  32. Ví dụ 1.1. Điều tra năng suất lúa trên diện tích 100 hecta trồng lúa của một vùng ta thu được bảng số liệu sau Năng suất (tạ/ha) 25 30 35 40 45 Số ha có năng suất tương ứng 10 20 25 20 25 Tính giá trị trung bình mẫu, phương sai mẫu và độ lệch chuẩn của mẫu cụ thể trên. Giải. Trung bình mẫu k P n x i i 3650 x = i=1 = = 36, 5. n 100 Phương sai mẫu k P n x2 − nx2 i i 1 s2 = i=1 = (137500 − 100.36, 52) = 43, 2. (n − 1) 99 Độ lệch chuẩn √ s = s2 = p43, 2 ≈ 6, 55. 1.2 Khái niệm mẫu Khi nghiên cứu một đặc điểm, tính chất nào đó của tổng thể ta có thể tiến hành theo hai phương pháp sau: a) Phương pháp điều tra toàn bộ: Mọi phần tử của tổng thể đều được khảo sát. Ưu điểm: các kết luận rút ra phản ánh đúng bản chất của tổng thể. Nhược điểm: - Chi phí lớn về tiền của, thời gian, nhân lực, phương tiện - Quá trình điều tra cũng chính là quá trình phá hủy các phần tử được điều tra. - Có những trường hợp ta không xác định được toàn bộ N phần tử của tổng thể Chính vì lý do trên nên phương pháp điều tra toàn bộ ít được thực hiện. b) Phương pháp điều tra mẫu: - Từ tổng thể ta lấy ra n phần tử (tập con của tổng thể) n << N và đo lường giá trị của dấu hiệu H trên chúng. - Từ đó rút ra các kết luận khoa học trên mẫu rồi suy rộng cho toàn bộ tổng thể. Ưu điểm: - Thu thập, xử lý và khai thác nhanh. - Toàn diện. Yêu cầu: Mẫu phải đại diện được cho tổng thể do đó khi lấy mẫu phải đảm bảo tính ngẫu nhiên của mẫu, không chọn mẫu theo một tiêu chuẩn chủ quan định trước. 1.3 Cách chọn mẫu a) Mẫu có hoàn lại (có lặp): Trong tổng thể gồm N phần tử ta chọn một phần tử khảo sát và ghi lại kết quả X1. Trả lại phần tử đó vào tổng thể trước khi chọn phần tử tiếp theo để khảo sát , cứ lặp 32
  33. lại như thế đến lần thứ n ta nhận được một mẫu với số liệu về dấu hiệu đang khảo sát là (X1,X2, , Xn). Mẫu này được gọi là mẫu ngẫu nhiên hoàn lại (có lặp). b) Mẫu ngẫu nhiên không hoàn lại (không lặp): Từ tổng thể gồm N phần tử, ta chọn ra một phần tử, khảo sát và ghi lại kết quả X1. Bỏ phần tử đó sang một bên trước khi chọn phần tử tiếp theo để khảo sát tiếp, cứ lặp lại như thế cho đến lần thứ n ta được mẫu với số liệu về dấu hiệu đang khảo sát là (X1,X2, , Xn). Mẫu này được gọi là mẫu ngẫu nhiên không hoàn lại (không lặp). Chú ý: Hai mẫu nói trên được gọi là mẫu ngẫu nhiên đơn giản. Nhờ các định lý giới hạn trong lý thuyết xác suất người ta đã chứng minh được rằng khi số phần tử tổng thể vừa đủ lớn thì có thể coi hai mẫu có lặp và không lặp là như nhau. Có thể kể thêm một số phương pháp sau: c) Mẫu được chọn theo phương pháp cơ học: d) Phương pháp điển hình: e) Phương pháp phân dãy: f) Sắp xếp các số liệu thực nghiệm theo nhóm: §2 ƯỚC LƯỢNG THAM SỐ CỦA TỔNG THỂ Như chúng ta biết, các số đặc trưng của dấu hiệu H như trung bình, phương sai được sử dụng rộng rãi trong phân tích kinh tế, xã hội và các lĩnh vực khác. Nhưng các số đặc trưng này thường chưa biết, vì vậy đặt ra vấn đề cần ước lượng chúng bằng phương pháp mẫu. Sau khi đã mô hình hoá dấu hiệu H bằng một ĐLNN và cơ cấu tổng thể bằng qui luật phân phối xác suất của X, ta có thể phát biểu vấn đề thực tế nêu trên dưới dạng toán học như sau: Cho ĐLNN X có thể đã biết hoặc chưa biết qui luật phân phối xác suất của X, nhưng chưa biết tham số θ nào đó của nó. Hãy ước lượng θ bằng phương pháp mẫu (dựa trên cở sở một mẫu thống kê nào đó). Bài toán này là một trong những bài toán cơ bản của thống kê toán. Vì θ là một hằng số nên có thể dùng một số nào đó để ước lượng θ, ước lượng như vậy được gọi là ước lượng điểm (nếu ta đưa chọn số dùng để ước lượng θ lên trục số thì nó tương ứng với một điểm). Ngoài ước lượng điểm người ta còn dùng phương pháp ước lượng khoảng, tức là chỉ ra một khoảng số [θ1, θ2] nào đó có thể chứa được θ. Cận trên và cận dưới của khoảng được tính theo quy tắc cụ thể dựa trên các thống kê và dựa trên mức tin cậy P . 2.1 Ước lượng lỳ vọng µ của phân phối chuẩn khi biết phương sai σ2 Các bước cần làm để ước lượng µ. + Chọn mẫu dung lượng n, tính trung bình cộng x. Chọn mức tin cậy P .(α = 1 − P gọi là mức sai cho phép hay mức ý nghĩa) α + Dùng bảng tính giá trị tới hạn u( α ), tức là giá trị u sao cho Φ(u) = 1 − . 2 2 Z t 2 1 − x Chú ý: hàm Φ được xác định bởi Φ(t) = √ e 2 dx 2π −∞ 33
  34. + Ước lượng µ theo bất đẳng thức kép α σ α σ x − u( )√ ≤ µ ≤ x + u( )√ (2.1) 2 n 2 n Ví dụ 2.1. Hãy tìm khoảng tin cậy cho chiều cao trung bình của sinh viên dựa trên một mẫu kích thước n = 36 với trung bình mẫu x = 160cm, độ tin cậy P = 95%. Giả sử độ lệch tiêu chuẩn σ = 7cm. α Giải. Ta có σ = 7cm, n = 36, α = 0, 05, u( 2 ) = 1, 96. Vậy khoảng tin cậy P = 95% là 7 7 160 − 1, 96√ ≤ µ ≤ 160 + 1, 96√ 36 36 157, 71 ≤ µ ≤ 162, 29 Vậy với độ tin cậy P = 95%, chiều cao trung bình µ nằm giữa 157,71 và 162,29. Ví dụ 2.2. Cũng câu hỏi như trên nhưng cần tìm khoảng tin cậy có độ tin cậy là 99%. α Giải. Ta có σ = 7cm, n = 36, α = 0, 01, u( 2 ) = 2, 58. Vậy khoảng tin cậy P = 95% là 7 7 160 − 2, 58√ ≤ µ ≤ 160 + 2, 58√ 36 36 156, 99 ≤ µ ≤ 163, 01. Từ hai ví dụ trên, ta thấy. Trên cùng một kích thước mẫu, nếu độ tin cậy càng lớn thì độ dài khoảng tin cậy sẽ càng lớn. 2.2 Ước lượng kỳ vọng µ của phân phối chuẩn khi chưa biết phương sai σ2, n < 30 Các bước để tìm ước lượng µ (với mức tin cậy P = 1 − α) + Chọn mẫu dung lượng n, tính trung bình mẫu x, tính phương sai mẫu s2 α  α + Dùng bảng phân phối Student tính giá trị tới hạn t 2 , n − 1 , tức là giá trị t ở cột 2 và dòng n − 1 Ước lượng µ theo bất đẳng thức kép α  s α  s x − t , n − 1 √ ≤ µ ≤ x + t , n − 1 √ . (2.2) 2 n 2 n Ví dụ 2.3. Để ước lượng năng suất một giống ngô, người ta theo dõi 25 mảnh ruộng. Sau khi thu hoạch được x = 10, 6; s = 2, 082 (đơn vị tạ/ha). Giả thiết năng suất ngô phân phối chuẩn. Mức tin cậy P = 0, 95. Giải. Tra bảng ta được t(0, 025, 24) = 2, 061. Khoảng ước lượng 2, 082 2, 082 10, 6 − 2, 061 √ ≤ µ ≤ 10, 6 + 2, 061 √ 25 25 9, 74 ≤ µ ≤ 11, 46. 34
  35. 2.3 Ước lượng kỳ vọng µ của phân phối chuẩn khi chưa biết phương sai σ2, n ≥ 30 Trong nhiều bài toán thực tế, ta không biết phương sai của tập hợp chính, nếu kích thước mẫu n ≥ 30 thì ta có thể xấp xỉ σ bởi s. Khi đó khoảng ước lượng sẽ là α s α s x − u( )√ ≤ µ ≤ x + u( )√ (2.3) 2 n 2 n Ví dụ 2.4. Một trường đại học muốn nghiên cứu xem trung bình một sinh viên tiêu hết bao nhiêu tiền điện thoại trong một tháng, chọn ngẫu nhiên 59 sinh viên và thu được x = 41, 05, s = 27, 99. Hãy xây dựng khoảng tin cậy 95% cho số tiền gọi điện thoại trung bình µ hàng tháng của một sinh viên. Giải. Từ các số liệu trên ta có khoảng ước lượng là 27, 99 27, 99 41, 05 − 1, 96 √ ≤ µ ≤ 41, 05 + 1, 96 √ 59 59 33, 92 ≤ µ ≤ 48, 18. 2.4 Ước lượng xác suất p của phân phối nhị thức Một tổng thể gồm 2 loại cá thể A và A với số lượng rất lớn, tỷ lệ loại A là p (chưa biết). Lấy ngẫu nhiên một cá thể, có thể coi xác suất được cá thể loại A là p. Lấy ngẫu nhiên n cá thể, trong đó có m cá thể loại A. Nếu n nhỏ thì có các bảng tính sẵn để ước lượng p căn cứ vào n và m. Nếu n lớn (lý thuyết n > 30 nhưng thực tế chỉ nên dùng khi n > 100) thì coi m như biến ngẫu nhiên X phân phối nhị thức B(n, p), sau đó dựa trên việc tính gần đúng phân phối nhị thức bằng phân phối chuẩn có kỳ vọng np và phương sai npq, ta tìm được quy tắc thực hành sau: m + Lấy mẫu dung lượng n, đếm số cá thể loại A, gọi là tần số m, tính tần suất f = . n α Dùng bảng tính giá trị tới hạn u( 2 ) sau đó ước lượng p theo bất đẳng thức kép: r r α f(1 − f) α f(1 − f) f − u( ) ≤ p ≤ f + u( ) . (2.4) 2 n 2 n Ví dụ 2.5. Trước ngày bầu cử tổng thống, một cuộc thăm dò dư luận được tiến hành. Người ta chọn ngẫu nhiên 100 người để hỏi ý kiến thì có 60 người nói rằng họ sẽ bỏ phiếu cho ông A. Tìm khoảng tin cậy cử tri bỏ phiếu cho ông A với độ tin cậy 90%. m Giải. Ta có n = 100, m = 60, f = = 0, 6, α = 0, 1, u( α ) = 1, 64. Vậy khoảng tin cậy cho n 2 p là r0, 6.0, 4 r0, 6.0, 4 0, 6 − 1, 64 ≤ p ≤ 0, 6 + 1, 64 100 100 hay 0, 52 ≤ p ≤ 0, 68. 35
  36. Như vậy ta kết luận: Với độ tin cậy 90% ông A sẽ thu được từ 52% đến 68% phiếu bầu. Như vậy ông A sẽ thu được ít nhất 52% phiếu và do đó sẽ trúng cử. Khẳng định này với độ tin cậy 90%. Ví dụ 2.6. Trong một mẫu ngẫu nhiên gồm 200 người dùng xe máy, có 162 người dùng xe 100 phân khối trở lên. Tìm khoảng tin cậy với mức tin cậy 95% cho tỷ lệ người dùng xe trên 100 phân khối. α Giải. Ta có n = 200, m = 162, f = 0, 81, u( 2 ) = 1, 96. Khoảng tin cậy cho p là r0, 81.0, 19 r0, 81.0, 19 0, 81 − 1, 96 ≤ p ≤ 0, 81 + 1, 96 200 200 hay 0, 755 ≤ p ≤ 0, 865. §3 XÁC ĐỊNH KÍCH THƯỚC MẪU Với độ tin cậy P đã cho, ta thấy có mối quan hệ giữa kích thước mẫu n và độ dại khoảng tin cậy. Kích thước mẫu càng lớn thì độ dài khoảng tin cậy càng hẹp nghĩa là độ chính xác của ước lượng càng cao, sai số của ta càng nhỏ. Tuy nhiên kích thước mẫu càng càng lớn thì đòi hỏi ở nhà nghiên cứu càng nhiều thời gian, tiền của và công sức. Vậy bài toán đặt ra là: cần chọn kích thước mẫu tối thiểu là bao nhiêu để đạt được độ chính xác mong muốn. 3.1 Tính dung lượng mẫu khi ước lượng kỳ vọng µ của phân phối chuẩn Theo công thức 2.1 ta có α σ |x − µ| ≤ u( )√ . 2 n α σ α σ Độ dài khoảng ước lượng là 2u( )√ và nửa độ dài của khoảng ước lượng là u( )√ . Nếu 2 n 2 n muốn ước lượng đạt độ chính xác ε thì phải lấy α σ u( α )σ 2 u( )√ ≤ ε ⇔ n ≥ 2 . 2 n ε Ví dụ 3.1. Đo chiều dài X (đơn vị cm). Giả thiết X phân phối chuẩn với σ = 1, 8cm. Phải lấy mẫu có dung lượng bao nhiêu để ước lượng của kỳ vọng µ có độ chính xác 0, 5cm, P = 0, 99. α Giải. Ta có σ = 1, 8cm, ε = 0, 5, α = 0, 01, u( 2 ) = 2, 575. Phải lấy cỡ mẫu (2, 575.1, 8)2 n ≥ ≈ 85, 93 0, 52 chọn kích thước mẫu n = 86. 36
  37. 3.2 Tính dung lượng mẫu khi ước lượng xác suất p của phân phối nhị thức r α f(1 − f) Theo công thức 2.4 nửa độ dài khoảng ước lượng là u( ) . Nếu muốn ước 2 n lượng đạt độ chính xác ε thì phải lấy r α f(1 − f) α f(1 − f) u( ) ≤ ε ⇔ n ≥ u2( ) . (3.1) 2 n 2 ε2 1 Ta luôn có ≥ f(1 − f) do đó 3.1 đạt được nếu ta chọn 4 u2( α ) n ≥ 2 . 4ε2 Ví dụ 3.2. Một xí nghiệp muốn ước lượng tỉ lệ p số người tán thành một kế hoạch sản xuất mới. Để tỷ lệ tìm ra có độ chính xác ε = 0, 06 ở mức P = 0, 95 phải thăm dò ít nhất bao nhiêu người? u2( α ) Giải. P = 0, 95; α = 0, 05; u( α ) = 1, 96; n ≥ 2 = 266, 78 . Như vậy phải thăm dò ít 2 4ε2 nhất n = 267 người. Bài Tập 3.1. Điều tra 200 mảnh ruộng, mỗi mảnh 4m2, ta được bảng sau: xi 1, 02 1, 08 1,14 1, 20 1,26 1, 32 ni 10 15 35 75 55 10 a) Tính trung bình cộng và phương sai mẫu. b) Ước lượng năng suất trung bình nếu coi năng suất phân phối chuẩn (P = 0, 95). 3.2. Phỏng vấn 400 người ở một khu vực rất đông người thì có 240 người ủng hộ một dự luật. Ước lượng tỉ lệ p số người ủng hộ dự luật ở mức P = 0, 95. 3.3. Thời gian đóng bột vào một bao phân phối chuẩn với σ = 0, 3 phút. a) Theo dõi 36 bao thấy thời gian trung bình để đóng một bao là 1,2 phút. Hãy ước lượng thời gian trung bình µ ở mức tin cậy P = 0, 95. b) Nếu muốn độ dài khoảng tin cậy giảm đi 2 lần thì phải chọn mẫu cỡ bao nhiêu? 3.4. Theo dõi lương của 50 công nhân trong một nhà máy ta có x = 79 (đơn vị nghìn đồng), độ lệch chuẩn s = 12, 84, số công nhân có lương cao hơn 90 là 14. Giả sử lương phân phối chuẩn. Với mức tin cậy P = 0, 95. a) Ước lượng kì vọng µ. b) Ước lượng tỉ lệ công nhân có lương trên 90. 3.5. Cân 50 em học sinh lớp 4 được trọng lượng trung bình x = 32 kg; độ lệch chuẩn s = 2, 5 kg. Giả sử trọng lượng phân phối chuẩn, hãy ước lượng kỳ vọng ở mức P = 0, 99. 37
  38. 3.6. Trọng lượng cam phân phối chuẩn với độ lệch chuẩn σ = 32, 4g. Cân thử 9 quả được trọng lượng trung bình x = 187, 9g. a) Ước lượng kỳ vọng ở mức P = 0, 80. b) Nếu muốn khoảng tin cậy bằng [165, 8−210] thì phải chọn mức tin cậy P bằng bao nhiêu? 3.7. Để xác định trọng lượng trung bình của 15 bao bột mì được đóng bằng máy tự động, người ta chọn ngẫu nhiên 15 bao và tính được x = 39, 8kg và s2 = 0, 144. Tìm khoảng tin cậy 99% của trọng lượng trung bình µ của các bao bột mì? 3.8. Để khảo sát chiều cao trung bình µ của thanh niên trong một vùng A nào đó, một mẫu gồm 16 thanh niên được chọn, chiều cao của các thanh niên này đo được như sau: Chiều cao (cm) tần số Chiều cao (cm) tần số 163 1 170 3 164 4 172 2 166 3 174 3 Tìm khoảng tin cậy 95% cho µ. 3.9. Để khảo sát chiều cao trung bình µ của thanh niên trong một vùng A nào đó, một mẫu gồm 36 thanh niên được chọn, chiều cao của các thanh niên này đo được như sau: Chiều cao (cm) tần số Chiều cao (cm) tần số 163 7 170 4 164 2 172 6 166 3 174 5 168 5 175 4 Tìm khoảng tin cậy 95% cho µ. 3.10. Trong một cuộc khảo sát thị trường của công ty sản xuất thuốc lá, 150 người nghiện thuốc lá được chọn ngẫu nhiên, số điếu thuốc hút trung bình trong 1 tuần của nhóm người này là 135 với độ lệch tiêu chuẩn là 36. Tìm khoảng tin cậy 99% cho số điếu thuốc hút trung bình trong 1 tuần của tất cả những người nghiện thuốc lá? 3.11. Trong một cuộc thăm dò ý kiến 100 khách hàng, người ta thấy 55 người nói yêu thích mặt hàng A. Tìm khoảng tin cậy 95% cho tỷ lệ người tiêu dùng ưa thích mặt hàng A? 3.12. Một cơ quan Cảnh sát Giao thông kiểm tra hệ thống phanh của 40 chiếc xe tải trên đường Quốc lộ, họ phát hiện 14 chiếc có phanh chưa đảm bảo an toàn. a) Hãy tìm khoảng tin cậy 98% cho tỷ lệ xe tải có phanh chưa an toàn? b) Hãy tìm khoảng tin cậy 98% cho tỷ lệ xe tải có phanh tốt? 38
  39. 3.13. Trước ngày bầu cử, để biết tỷ lệ phần trăm các cử tri còn do dự chưa biết bỏ phiếu cho ai, người ta hỏi n cử tri được chọn một cách ngẫu nhiên. Hỏi số n tối thiểu là bao nhiêu để khoảng tin cậy 95% có độ dài không vượt quá 0,04? 3.14. Ta muốn xây dựng một khoảng tin cậy 95% cho trọng lượng trung bình của các gói đường đóng bằng máy tự động. Một mẫu điều tra sơ bộ cho ta x = 11, 8kg với độ lệch tiêu chuẩn s = 0, 7kg. Hãy ước lượng khoảng tin cậy cho kì vọng. Hỏi cần phải lấy kích thước mẫu tối thiểu bao nhiêu để đạt được sai số không vượt quá 0, 2kg. 3.15. Một khách sạn lớn tiến hành một nghiên cứu để xác định tỷ lệ phần trăm các khách ở trọ với thời gian nhiều hơn 1 ngày. Người chủ khách sạn muốn đạt được độ tin cậy 95% và sai số không vượt quá 0,05. Anh ta ước lượng sơ bộ tỷ lệ này khoảng 30%. Hỏi cần lấy mẫu với kích thước bao nhiêu? 3.16. Tương tự như bài 4.49 nhưng ở đây người chủ khách sạn không có trước một thông tin gì về tỷ lệ cần ước lượng? 3.17. Để điều tra số cá trong một hồ, người ta đánh bắt 1000 con cá đánh dấu rồi thả xuống hồ. Lần sau bắt lại 200 con thì được 40 con đánh dấu. Với độ tin cậy 95% hãy a) Ước lượng tỷ lệ cá được đánh dấu trong hồ? b) Ước lượng số cá trong hồ? 3.18. Ở một nhà máy dệt, kiểm tra ngẫu nhiên 100 tấm vải (dài 30m) thấy số khuyết tật trung bình là 2,5 với phương sai σ2 = 4. a) Hãy ước lượng số khuyết tật trung bình của mỗi tấm vải với độ tin cậy 95%. b) Nếu độ chính xác của ước lượng là 0,14 (khuyết tật) thì độ tin cậy của ước lượng là bao nhiêu? c) Với độ chính xác của ước lượng bé hơn 0,14, độ tin cậy 95% thì phải kiểm tra thêm ít nhất bao nhiêu sản phẩm nữa? 39
  40. Chương 4 KIỂM ĐỊNH GIẢ THIẾT §1 GIẢ THIẾT VÀ ĐỐI THIẾT Ở Chương 3 đã nghiên cứu ĐLNN, khi chưa biết tham số của nó và đã xây dựng các phương pháp ước lượng các tham số đó. Chương này tiếp tục nghiên cứu ĐLNN trong trường hợp thông tin không đầy đủ thể hiện ở nhiều mặt, cụ thể là: Chưa biết chính xác các tham số θ hoặc qui luật phân phối xác suất của ĐLNN X, nhưng có cơ sở nào đó để nêu lên giả thiết, chẳng hạn θ = θ0 (θ0 là hằng số đã biết), hay: X tuân theo qui luật phân phối chuẩn. Khi nghiên cứu hai hay nhiều ĐLNN, một trong những vấn đề cần quan tâm nhất là: các đại lượng này độc lập với nhau hay có sự phụ thuộc tương quan? Các tham số của chúng có bằng nhau hay không? Những câu hỏi này thường chưa được trả lời khẳng định mà mới nêu lên như một giả thiết. Vậy có thể định nghĩa: Giả thiết thống kê là những giả thiết nói về các tham số, dạng qui luật phân phối hoặc tính độc lập của các ĐLNN. Việc tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của một giả thiết gọi là kiểm định giả thiết thống kê. Đây là một trong những bài toán cơ bản của thông kê toán. Trước hết ta đề cập đến các tham số ĐLNN. Giả sử cần nghiên cứu tham số θ của ĐLNN X và có cơ sở nào đó để nêu giả thiết θ = θ0. Giả thiết này được ký hiệu H0 : θ = θ0 (được gọi là giả thiết cần kiểm định hay giả thiết cơ bản). Mệnh đề đối lập với giả thiết H0 được gọi là đối thiết của H0 và ký hiệu là H1. Dạng tổng quát của H1 là: θ 6= θ0. Trong nhiều trường hợp, đối thiết có thể phát biểu cụ thể hơn như: H1 : θ θ0. Như vậy giả thiết kiểm định và đối thiết thường được nêu lên thành từng cặp. Chẳng hạn: H0 : θ = θ0; H1 : θ 6= θ0 (đối thiết hai phía) H0 : θ = θ0; H1 : θ > θ0 (đối thiết phải) H0 : θ = θ0; H1 : θ < θ0 (đối thiết trái). Nhiệm vụ của lý thuyết kiểm định giả thiết thống kê là: Bằng thực nghiệm (thông qua mẫu cụ thể) kiểm tra tính đúng (sai) của giả thiết H0. Khi kết luận thì hoặc chấp nhận H0 hoặc 41
  41. bác bỏ H0 và trong trường hợp này, tuy không hoàn toàn tương đương, nhưng coi như chấp nhận H1, ta có thể phạm hai loại sai lầm. Sai lầm loại 1. Bác bỏ H0 khi thực ra H0 đúng. Sai lầm loại 2. Chấp nhận H0 khi thực ra H0 sai. Sai lầm loại 1 tương tự như sai lầm của quan tòa khi "kết án nhầm người vô tội", còn sai lầm loại 2 tương tự như khi "tha bỗng kẻ dó tội". Một kiểm định thống kê lý tưởng là kiểm định làm cực tiểu cả hai loại sai lầm. Tuy nhiên chúng ta làm giảm sai lầm loại 1 sẽ tăng sai lầm loại 2 và ngược lại. Trong một xã hội văn minh, người ta có xu hướng thừa nhận rằng việc kết án nhầm người vô tội là một sai lầm nghiêm trọng hơn nhiều so với sai lầm tha bỗng kẻ có tội. Trong bài toán kiểm định giả thiết thống kê cũng vậy. Ta coi sai lầm loại 1 là nghiêm trọng hơn sai lầm loại 2. Thành thử người ta cố định trước xác suất mắc sai lầm loại 1. Xác suất của mắc sai lầm loại 1 còn gọi là mức ý nghĩa, được ký hiệu là α. Sau đó sẽ cực tiểu sai lầm loại 2. Kiểm định nào có xác suất sai lầm loại 2 nhỏ nhất được xem là tốt nhất. Các kiểm định thống kê trình bày trong chương này đều đã được chứng minh chặt chẽ về Toán học là các kiểm định tốt nhất. Trong phạm vi tài liệu này chỉ đề cập đến đối thiết hai phía. §2 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA BIẾN PHÂN PHỐI CHUẨN N(µ, σ2) Bài toán kiểm định H0 : µ = µ0 với đối thiết H1 : µ 6= µ0 ở mức ý nghĩa α được chia thành 2 trường hợp sau: 2.1 Đã biết phương sai Đây là trường hợp khi tiến hành điều tra lại một tổng thể, người ta lấy phương sai của lần điều tra trước làm σ2, hoặc việc kiểm định được tiến hành thường xuyên tại một cơ sở công nghiêp mà qua một quá trình dài đã tìm được phương sai σ2 (chủ yếu phụ thuộc vào độ chính xác của các thiết bị đo lường và tay nghề của nhân viên sử dụng thiết bị). Ta tiến hành các bước sau: - Lấy mẫu, tính x - Tính giá trị U thực nghiệm √ x − µ0 (x − µ0) n Utn = = . √σ n σ α  - Tính giá trị tới hạn u 2 từ bảng phân phối chuẩn. α  Nếu |Utn| (giá trị tuyệt đối của Utn) bé hơn u 2 thì chấp nhận H0 nếu ngược lại thì bác bỏ H0 tức là chấp nhận H1. Ví dụ 2.1. Nuôi 100 con lợn theo một chế độ ăn riêng, sau 4 tháng tăng trọng trung bình là 30kg, giả thiết tăng trọng phân phối chuẩn N(µ, 25). Hãy kiểm định giả thiết H0 : µ = 32 42
  42. đối thiết H1 : µ 6= 32 mức α = 0, 05. √ (30 − 32) 100 U = = −4 tn 5 α |U | = 4; u = 1, 96. tn 2 Kết luận: Bác bỏ H0 như vậy tăng trọng trung bình không phải là 32kg. Ví dụ 2.2. Khảo sát 64 gia đình tìm được chi tiêu trung bình của mỗi gia đình là 2,03 triệu đồng/tháng. Giả sử chi tiêu của một gia đình phân phối chuẩn N(µ, 0, 09), hãy kiểm định giả thiết H0 : µ = 2 đối thiết H1 : µ 6= 2 ở mức α = 0, 1. √ (2, 03 − 2) 64 U = = 0, 8 tn 0, 3 α |U | = 0, 8; u = 1, 645. tn 2 Kết luận: Chấp nhận H0: mức chi tiêu trung bình của một gia đình là 2 triệu đồng 1 tháng. 2.2 Không biết phương sai, mẫu n ≥ 30 Trong trường hợp này các bước kiểm định giống như mục 2.1 nhưng σ được thay bởi s. Ví dụ 2.3. Một nhóm nghiên cứu công bố rằng trung bình một người vào siêu thị A tiêu hết 140 ngàn đồng. Chọn ngẫu nhiên 50 người mua hàng ta tính được số tiền trung bình họ tiêu là 154 ngàn với độ lệch tiêu chuẩn là 62 ngàn. Với mức ý nghĩa 0, 02 hãy kiểm định xem công bố của nhóm nghiên cứu có đúng hay không? Giải. Ta cần kiểm định giả thiết H0 : µ = 140 với đối thiết H1 : µ 6= 140. Ta có √ (154 − 140) 50 U = = 1, 59. tn 62 α |U | = 1, 59; u = 2, 33. tn 2 Chưa có cơ sở để loại bỏ H0, báo cáo của nhóm nghiên cứu là đúng. 2.3 Không biết phương sai, mẫu n < 30 Đây là trường hợp phổ biến khi kiểm định giá trị trung bình của phân phối chuẩn. Ta tiến hành các bước sau: - Lấy mẫu, tính x và s2. - Tính giá trị T thực nghiệm √ (x − µ ) n T = 0 . tn s α  - Tìm giá trị tới hạn t 2 , n − 1 là trong bảng phân phối Student. α  Nếu |Ttn| (giá trị tuyệt đối của Ttn) bé hơn t 2 , n − 1 thì chấp nhận H0 nếu ngược lại thì bác bỏ H0 tức là chấp nhận H1. 43
  43. Ví dụ 2.4. Trong điều kiện chăn nuôi bình thường lượng sữa trung bình của một con bò sữa là 19 kg/ngày. Trong một đợt hạn, người ta theo dõi 25 con bò và được lượng sữa trung bình 17,5 kg/ngày, độ lệch chuẩn s = 2, 5kg. Giả thiết lượng sữa phân phối chuẩn, hãy kiểm định giả thiết H0 : µ = 19 với đối thiết µ 6= 19 ở mức α = 0, 05. √ (17, 5 − 19) 25 α  T = = −3; |T | = 3; t , n − 1 = 2, 064 tn 2, 5 tn 2 Kết luận: Bác bỏ H0 như vậy trọng lượng sữa trung bình không còn là 19 kg/ngày nữa. Ví dụ 2.5. Thóc được đóng trong bao 50kg. Sau một thời gian, để kiểm tra, người ta cân thử 25 bao và được trọng lượng trung bình 49,4kg/bao, độ lệch chuẩn s = 3, 6kg. Giả thiết trọng lượng bao thóc phân phối chuẩn, hãy kiểm định giả thiết H0 : µ = 50 với đối thiết µ 6= 50 ở mức α = 0, 05. √ (49, 4 − 50) 25 α  T = = −0, 833; |T | = 0, 833; t , n − 1 = 2, 064 tn 3, 6 tn 2 Kết luận: Chấp nhận H0 như vậy vẫn coi trọng lượng trung bình của một bao thóc là 50kg. §3 KIỂM ĐỊNH XÁC SUẤT Tổng thể có hai loại cá thể A và A, loại A chiếm tỉ lệ p (chưa biết). Ta muốn kiểm định giả thiết H0 : p = p0 với đối thiết H1 : p 6= p0. m Từ mẫu dung lượng n, tính số cá thể loại A được tần số m và tần suất f = n . Tính f − p0 Utn = q . p0(1−p0) n α  Tìm giá trị tới hạn u 2 α  Kết luận: Nếu |Utn| ≤ u 2 thì chấp nhận H0 ngược lại thì bác bỏ H0. Ví dụ 3.1. Gieo thử 100 hạt, có 82 hạt nảy mầm. Kiểm định giả thiết tỉ lệ nảy mầm p = 0, 80, đối thiết p 6= 0, 8 với α = 0, 05. m Giải. n = 100; m = 82; f = n = 0, 82; 0, 82 − 0, 80 α Utn = = 0, 5; u = 1, 96. q 0,8.0,2 2 100 Kết luận: Chấp nhận H0: tỷ lệ nảy mầm là 0,80. Ví dụ 3.2. Một đảng chính trị trong một cuộc bầu cử tổng thống ở Mỹ tuyên bố rằng 45% cử tri sẽ bỏ phiếu cho ứng cử viên A của họ. Chọn ngẫu nhiên 200 cử tri để thăm dò ý kiến cho thấy 80 người trong số đó tuyên bố sẽ bỏ phiếu cho ông A. Với mức α = 5%, hãy kiểm định xem dự đoán của đảng trên có đúng không. 80 α  Giải. Giả thiết H0 : p = 0, 45, đối thiết H1 : p 6= 0, 45. Ta có f = 200 = 0, 40, u 2 = 1, 96, 0, 40 − 0, 45 Utn = = −1, 43. q 0,45.0,55 200 Kết luận: Dự đoán của đảng trên đúng. 44
  44. Bài Tập 4.1. Điều tra thấy chi phí trung bình x của 25 sinh viên xa nhà là 475000đ/ tháng, độ lệch chuẩn 30000đ. Coi chi phí một tháng phân phối chuẩn, Hãy kiểm định giả thiết H0 : µ = 500000đ. Đối thiết H1 : µ 6= 500000đ, α = 0, 05. 4.2. Theo hợp đồng khi bán các bao gạo được đóng trong bao 50kg. Kiểm tra 16 bao được x = 49kg, s = 3, 6kg. Hỏi hợp đồng có được bên bán thực hiện nghiêm chỉnh hay không, α = 0, 05? 4.3. Giám đốc của một xí nghiệp cho biết lương trung bình của một công nhân thuộc xí nghiệp hiện nay là 600 ngàn đồng/1tháng. Chọn ngẫu nhiên 36 công nhân thấy lương trung bình là 529 ngàn đồng/1tháng. Với độ lệch tiêu chuẩn σ = 40 ngàn đồng/1tháng và mức ý nghĩa α = 5%. Kiểm tra xem lời báo cáo của giám đốc có tin cậy không? 4.4. Một nhóm nghiên cứu tuyên bố rằng trung bình một ngày một người vào siêu thị X tiêu hết 140 ngàn đồng. Chọn ngẫu nhiên 25 người và tính được số tiền trung bình tiêu là 154 ngàn đồng với độ lệch chuẩn mẫu s = 62. Với mức ý nghĩa α = 0, 02 hãy kiểm định xem nhóm nghiên cứu có đúng không? 4.5. Một phương pháp ăn kiêng được quảng cáo rằng sẽ giảm trọng lượng ít nhất là 20kg trong vòng 6 tháng. Một mẫu gồm 28 người theo chế độ ăn kiêng này giảm trọng lượng trung bình là 16kg với độ lệch tiêu chuẩn s = 9kg. Với mức ý nghĩa α = 0, 01, hãy nhận định xem phương pháp ăn kiêng trên có nói đúng không. 4.6. Theo hợp đồng, khi bán mỗi bao gạo được đóng 50kg. Kiểm tra 16 bao thu được kết quả sau Trọng lượng tần số Trọng lượng tần số 47 1 51 3 48 4 53 2 49 3 54 3 Với mức ý nghĩa α = 0, 05 hỏi hợp đồng có được bên bán thực hiện nghiêm chỉnh hay không? 4.7. Một công ty A sản xuất bánh kẹo tuyên bố rằng 2/3 số trẻ em thích ăn bánh của công ty. Trong một mẫu gồm 100 trẻ em được hỏi, có 55 em tỏ ra thích ăn bánh của công ty A. Với mức ý nghĩa α = 0, 05 số liệu nói trên có chứng tỏ là tuyên bố của công ty A có đúng không? 4.8. Một trại chăn nuôi A xuất chuồng 200 con lợn, trọng lượng của chúng được tổng hợp như sau Trọng lượng (kg) 45-55 55-65 65-75 75-85 85-95 95-100 Số lợn 10 30 45 80 30 5 a) Ước lượng trọng lượng trung bình của trại chăn nuôi A với độ tin cậy 95%. 45
  45. b) Nếu chủ trại chăn nuôi A thông báo trọng lượng trung bình của trại là 80kg thì có chấp nhận được không với mức ý nghĩa 10%? c) Lợn có trọng lượng 85kg trở lên được coi là lợn chóng lớn, hãy ước lượng tỷ lệ lợn chóng lớn của trại chăn nuôi trên với mức ý nghĩa 90%. PHỤ LỤC A) Một số bài tập làm thêm: 4 Xác suất 4.9. Trong 30 đề thi, trong đó có 10 đề khó, 20 đề trung bình. Tìm xác suất để: a. Một học sinh bốc 1 đề, gặp đề trung bình. b. Một học sinh bốc 2 đề, gặp ít nhất một đề trung bình. 4.10. Một lớp có 60 sinh viên, trong đó có 20 nam và 40 nữ. Chọn ngẫu nhiên một nhóm gồm 8 sinh viên. Tính xác suất để: a. Có 4 nam trong số 8 sinh viên được chọn? b. Có nhiều nhất 3 sinh viên nam trong 8 sinh viên được chọn? c. Có ít nhất 1 sinh viên nam trong 8 sinh viên được chọn? d. Không có sinh viên nam trong 8 sinh viên được chọn?. 4.11. Một chiếc hộp đựng 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu đen. Chọn ngẫu nhiên 6 quả cầu. Tính xác suất để thu được 3 quả trắng, 2 quả đỏ và 1 quả đen? 4.12. Một lớp có 25 sinh viên trong đó có 5 giỏi, 10 khá và 10 trung bình. Chọn ngẫu nhiên 3 người, tìm xác suất để: a) Cả 3 đều là SV yếu? b) Có ít nhất 1 SV giỏi? 4.13. Một đoàn tàu có 4 toa. Có 4 hành khách từ sân ga lên tàu, mỗi người độc lập với nhau chọn ngẫu nhiên 1 toa. Tính xác suất để a) 1 toa có 3 người, 1 toa có 1 người và hai toa còn lại không có ai? b) Toa nào cũng có khách? c) Cũng hỏi như câu b) nhưng số toa tàu là 3? 4.14. Một công ty có 60 nhân viên, trong đó có 20 nam và 40 nữ. Tỷ lệ nhân viên nữ có thể nói tiếng Anh lưu loát là 15% và tỷ lệ này đối với nam là 20% a. Gặp ngẫu nhiên một nhân viên của công ty. Tìm xác suất để gặp được nhân viên nói tiếng Anh lưu loát? b.) Biết người gặp được nói tiếng Anh lưu loát, tính xs để người đó là nữ? c. Gặp ngẫu nhiên hai nhân viên của công ty. Tìm xác suất để có ít nhất một người nói tiếng Anh lưu loát trong số 2 người gặp? 46
  46. 4.15. Một công ty cần tuyển hai nhân viên. Có 6 người nạp đơn trong đó có 4 nữ và 2 nam. Khả năng được tuyển của mỗi người là như nhau. a) Tính xác suất để cả hai nữ được chọn biết rằng ít nhất một nữ đã được chọn? b) Giả sử Hoa là một trong 4 nữ. Tính xác suất để Hoa được chọn? c) Tính xác suất để Hoa được chọn nếu biết rằng ít nhất một nữ đã được chọn? 4.16. Xét một lô sản phẩm trong đó số sản phẩm do nhà máy I sản xuất chiếm 20%, nhà máy II sản xuất chiếm 30%, nhà máy III sản xuất chiếm 50%. Xác suất phế phẩm của các nhà máy I, II, III tương ứng là 0,001; 0,005; 0,006. Tìm xác suất để lấy ngẫu nhiên được đúng 1 phế phẩm? 4.17. Có 4 hộp như nhau đựng cùng một chi tiết máy. Trong đó hộp 1 có 3 chi tiết xấu, 5 chi tiết tốt do máy I sản xuất. Ba hộp còn lại mỗi hộp đựng 4 chi tiết xấu, 6 chi tiết tốt do máy II sản xuất. Lấy ngẫu nhiên 1 hộp rồi từ đó lấy ra 1 chi tiết máy a) Tính xác suất để chi tiết máy lấy ra là tốt? b) Biết chi tiết lấy ra là tốt. Tính xác suất để chi tiết đó của lô I? 4.18. Một hộp có 4 sản phẩm tốt và 2 sản phẩm xấu. Lấy ngẫu nhiên lần lượt từ hộp ra 2 sản phẩm. Biết sản phẩm lấy ra lần 2 là sản phẩm tốt. Tính xác suất để sản phẩm lấy lần thứ 1 cũng tốt? 4.19. Có 3 chuồng thỏ. Chuồng thứ nhất có 3 thỏ trắng và 2 thỏ đen, chuồng thứ hai có 4 thỏ trắng và 3 thỏ đen, chuồng thứ ba có 3 thỏ trắng và 3 thỏ đen. Chọn ngẫu nhiên một chuồng và từ chuồng đó bắt ngẫu nhiên một con thỏ. a) Tìm xác suất để bắt được thỏ trắng? b) Biết thỏ bắt ra là thỏ trắng. Tìm xác suất để thỏ đó thuộc chuồng thứ nhất? 4.20. Có 3 chuồng thỏ: chuồng thứ nhất có 3 con thỏ trắng và 2 con thỏ nâu, chuồng thứ hai có 4 con thỏ trắng và 3 con thỏ nâu, chuồng thứ ba có 3 con thỏ trắng và 3 con thỏ nâu. Chọn ngẫu nhiên một chuồng và từ đó bắt ngẫu nhiên một con thỏ. a. Tìm xác suất để bắt được con thỏ trắng? b. Biết con thỏ bắt được là thỏ trắng. Tìm xác suất để con thỏ đó thuộc chuồng thứ nhất. 4.21. Có 20 xạ thủ trong đó có 7 người bắn trúng đích với xác suất 0,8 (giỏi), 5 người bắn trúng với xác suất 0,7 (khá) số còn lại bắn trúng với xác suất 0,5 (trung bình). Chọn ngẫu nhiên một người vào bắn. a) Tìm xác suất để người đó bắn trượt? b) Biết rằng người đó bắn trượt, có nhiều khả năng người đó xếp loại nào? 47
  47. 4.22. Có hai hộp đựng cam. Hộp I đựng 10 quả tốt và 3 quả hỏng, hộp II đựng 7 quả tốt và 2 quả hỏng. Lấy ngẫu nhiên một quả từ hộp I bỏ sang hộp II sau đó từ hộp II lấy ngẫu nhiên ra hai quả. a) Tính xác suất để cả hai quả đều hỏng? b) Tính xác suất để cả hai quả đều tốt? c) Tính xác suất để có một quả tốt và một quả hỏng? 4.23. Có hai hộp đựng cam. Hộp I đựng 10 quả tốt và 3 quả hỏng, hộp II đựng 7 quả tốt và 2 quả hỏng. Lấy ngẫu nhiên hai quả từ hộp I bỏ sang hộp II sau đó từ hộp II lấy ngẫu nhiên ra hai quả. a) Tính xác suất để cả hai quả đều hỏng? b) Tính xác suất để cả hai quả đều tốt? c) Tính xác suất để có một quả tốt và một quả hỏng? 4.24. Một chiếc máy bay có thể xuất hiện ở vị trí A với xác suất 2/3 và ở vị trí B với xác suất 1/3. Có 3 phương án bố trí 4 khẩu pháo bắn máy bay như sau: Phương án 1: 3 khẩu tại A, 1 khẩu tại B. Phương án 2: 2 khẩu tại A, 2 khẩu tại B. Phương án 3: 1 khẩu tại A, 3 khẩu tại B. Biết rằng xác suất bắn trúng máy bay của mỗi khẩu pháo là 0,7 và các khẩu pháo hoạt động độc lập với nhau. Hãy chọn phương án tốt nhất 4.25. Có hai kiện hàng: Kiện thứ nhất: có 5 sản phẩm loại A, 1 sản phẩm loại B. Kiện thứ hai : có 2 sản phẩm loại A, 4 sản phẩm loại B. Từ mỗi kiện hàng chọn ngẫu nhiên ra 1 sản phẩm đem giao cho khách hàng. Sau đó các sản phẩm còn lại được dồn vào kiện thứ ba (trống). a. Chọn ngẫu nhiên một sản phẩm từ kiện hàng thứ ba. Tính xác suất để lấy được là sản phẩm loại B?. b. Nếu ta chọn ngẫu nhiên 2 sản phẩm từ kiện ba. Tính xác suất để có ít nhất một sản phẩm loại B từ 2 sản phẩm đã chọn. 4.26. Có hai tổ. Tổ I có 6 nam và 4 nữ, tổ 2 có 3 nam và 7 nữ. Cần lập một nhóm 3 người từ tổ này. Để khách quan từ mỗi tổ ta chọn ngẫu nhiên ra 1 người, sau đó trong số còn lại của hai tổ ta chọn ngẫu nhiên ra một người. a) Tính xác suất để người thứ 3 được chọn là nam? b) Tính xác suất để người thứ 3 được chọn thuộc tổ II? 48
  48. 4.27. Một hộp đựng 15 quả bóng bàn trong đó có 9 quả còn mới. Lần đầu người ta lấy ngẫu nhiên ba quả để thi đấu, sau đó lại trả vào hộp. Lần 2 lấy ngẫu nhiên 3 quả. Tính xác suất để ba quả lần sau đều mới. HD. Gọi Bi, i = 0, 3 là biến cố trong 3 quả lấy ra có i quả mới 4.28. Có hai hộp, hộp 1 đựng 8 bi trắng và 2 bi đen; hộp 2 đựng 9 bi trắng và 1 bi đen, các viên bi cùng kích thước. Lấy ngẫu nhiên hai bi từ hộp 1 bỏ sang hộp 2. Sau đó lấy ngẫu nhiên 3 bi từ hộp 2. Tính xác suất để trong 3 bi lấy ra sau có hai bi trắng. HD. Bi, i = 0, 2 trong hai bi bỏ sang hộp hai có i bi trắng 5 Biến ngẫu nhiên 4.29. Bán ba viên đạn độc lập vào một mục tiêu. Xác suất trúng của mỗi viên tương ứng là 0,6; 0,4; 0,5. Gọi X là số viên đạn không trúng mục tiêu. Tìm phân phối xác suất của X. Trong các bài tập sau, mỗi câu đều được hỏi bốn ý a) Lập bảng phân phối xác suất của Biến ngẫu nhiên được gọi? b) Xác định hàm phân phối? c) Tính kỳ vọng (M(X),M(X + 3),M(X − 6) ? (Có thể thay bằng câu hỏi trung bình của biến ngẫu nhiên đó) d) Tính phương sai? 4.30. Một chiếc hộp gồm 3 bộ phận hoạt động độc lập nhau, xác suất trong khoảng thời gian t các bộ phận bị hỏng tương ứng bằng 0,2; 0,3; 0,5. Gọi X là số bộ phận bị hỏng. 4.31. Một hộp có 7 viên bi trong đó có 4 bi trắng và 3 bi dỏ. Lấy ngẫu nhiên 3 viên. Gọi X là số bi trắng lấy ra. 4.32. Bắn 5 viên đạn độc lập với nhau vào một mục tiêu (trong cùng một điều kiện như nhau). Xác suất trúng đích của mỗi lần bắn bằng 0,2. Gọi X là số đạn trúng mục tiêu. Hỏi thêm: Tính xác suất để có đúng 3 viên trúng đích. 4.33. Một xạ thủ đem 5 viên đạn đi bắn, xạ thủ bắn từng viên vào bia với xác suất trúng vòng 10 là 0,85. Nếu bắn được ba viên liên tiếp trúng vòng 10 thì thôi không bắn nữa. Gọi X là số viên đạn đã bắn. 4.34. Một xạ thủ dùng 5 viên đạn để thử súng. Anh ta bắn từng viên vào tâm với xác suất trúng tâm là 0,95. Nếu có 2 viên liên tiếp trúng tâm thì thôi không bắn nữa. Gọi Y là số viên đạn còn thừa. 4.35. Một cơ quan mua về 15 chiếc máy trong đó có 4 chiếc bị khuyết tật. Phòng A nhận về 6 chiếc một cách ngẫu nhiên. Gọi X là số chiếc máy khuyết tật mà phòng A nhận được. 49
  49. 4.36. Một hộp có 3 bi trắng và 4 bi đỏ. Lấy ngẫu nhiên từ hộp từng viên cho đến khi lấy được bi trắng. Gọi X là số bi trắng lấy được. 4.37. Có hai lô sản phẩm. Lô 1: Có 8 chính phẩm và 2 phế phẩm Lô 2: Có 7 chính phẩm và 3 phế phẩm Từ lô thứ nhất lấy ngẫu nhiên 2 sản phẩm bỏ sang lô thứ hai, sau đó từ lô thứ hai lấy ra 2 sản phẩm Gọi X là số chính phẩm được lấy ra. 4.38. Có 3 kiện hàng, mỗi kiện chứa 10 sản phẩm. Số sản phẩm loại B trong mỗi kiện tưng ứng là 1,2,3. a. Lấy ngẫu nhiên từ mỗi kiện ra một sản phẩm. Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra?. b. Chọn ngẫu nhiên một kiện rồi từ kiện đã chọn lấy ngẫu nhiên 3 sản phẩm (lấy đồng thời). Gọi X là số sản phẩm loại B có trong 3 sản phẩm lấy ra? 6 Bài toán ước lượng, kiểm định 4.39. Đo áp lực X(kg/cm2) của 18 thùng chứa được kết quả: Xi 19,6 19,5 19,9 20,0 19,8 20,5 21,0 18,5 19,7 ni 1 2 2 4 2 3 2 1 1 Biết rằng áp lực là đại lượng ngẫu nhiên tuân theo phân phối chuẩn. Với độ tin cậy p = 0, 99, hãy tìm khoảng ước lượng của áp lực trung bình µ? 4.40. Để xác định trọng lượng trung bình của 15 bao bột mì được đóng bằng máy tự động, người ta chọn ngẫu nhiên 15 bao và tính được x = 39, 8kg và s2 = 0, 144. Tìm khoảng tin cậy 99% của trọng lượng trung bình µ của các bao bột mì? 4.41. Để khảo sát chiều cao trung bình µ của thanh niên trong một vùng A nào đó, một mẫu gồm 16 thanh niên được chọn, chiều cao của các thanh niên này đo được như sau: Chiều cao (cm) tần số Chiều cao (cm) tần số 163 1 170 3 164 4 172 2 166 3 174 3 Tìm khoảng tin cậy 95% cho µ. 4.42. Để khảo sát chiều cao trung bình µ của thanh niên trong một vùng A nào đó, một mẫu gồm 36 thanh niên được chọn, chiều cao của các thanh niên này đo được như sau: Chiều cao (cm) tần số Chiều cao (cm) tần số 163 7 170 4 164 2 172 6 166 3 174 5 168 5 175 4 50
  50. Tìm khoảng tin cậy 95% cho µ. 4.43. Trong một cuộc khảo sát thị trường của công ty sản xuất thuốc lá, 150 người nghiện thuốc lá được chọn ngẫu nhiên, số điếu thuốc hút trung bình trong 1 tuần của nhóm người này là với độ lệch tiêu chuẩn là 36. Tìm khoảng tin cậy 99% cho số điếu thuốc hút trung bình trong 1 tuần của tất cả những người nghiện thuốc lá? 4.44. Trong một cuộc thăm dò ý kiến 100 khánh hàng, người ta thấy 55 người nói yêu thích mặt hàng A. Tìm khoảng tin cậy 95% cho tỷ lệ người tiêu dùng ưa thích mặt hàng A? 4.45. Một cơ quan Cảnh sát Giao thông kiểm tra hệ thống phanh của 40 chiếc xe tải trên đường Quốc lộ, họ phát hiện 14 chiếc có phanh chưa đảm bảo an toàn. a) Hãy tìm khoảng tin cậy 98% cho tỷ lệ xe tải có phanh chưa an toàn? b) Hãy tìm khoảng tin cậy 98% cho tỷ lệ xe tải có phanh tốt? 4.46. Trước ngày bầu cử, để biết tỷ lệ phần trăm các cử tri còn do dự chưa biết bỏ phiếu cho ai, người ta hỏi n cử tri được chọn một cách ngẫu nhiên. Hỏi số n tối thiểu là bao nhiêu để khoảng tin cậy 95% có độ dài không vượt quá 0,04? 4.47. Ta muốn xây dụng một khoảng tin cậy 95% cho trọng lượng trung bình của các gói đường đóng bằng máy tự động. Một mẫu điều tra sơ bộ cho ta x = 11, 8kg với độ lệch tiêu chuẩn s = 0, 7kg. Hỏi cần phải lấy kích thước mẫu tối thiểu bao nhiêu để đạt được sai số không vượt quá 0, 2kg. 4.48. Người ta muốn tìm khoảng tin cậy 95% cho tỷ lệ những gia đình có máy giặt với độ chính xác 0,04. Hỏi kích thước mẫu cần lấy là bao nhiêu? Giả sử rằng mẫu điều tra sơ bộ cho ta tần suất f = 0, 72. 4.49. Một khách sạn lớn tiến hành một nghiên cứu để xác định tỷ lệ phần trăm các khách ở trọ với thời gian nhiều hơn 1 ngày. Người chủ khách sạn muốn đạt được độ tin cậy 95% và sai số không vượt quá 0,05. Anh ta ước lượng so bộ tỷ lệ này khoảng 30%. Hỏi cần lấy mẫu với kích thước bao nhiêu? 4.50. Tương tự như bài 4.49 nhưng ở đây người chủ khách sạn không có trước một thông tin gì về tỷ lệ cần ước lượng? 4.51. Để điều tra số cá trong một hồ, người ta đánh bắt 1000 con cá đánh dấu rồi thả xuống hồ. Lần sau bắt lại 200 con thì được 40 con đánh dấu. Với độ tin cậy 95% hãy 1. Ước lượng tỷ lệ cá được đánh dấu trong hồ? 2. Ước lượng số cá trong hồ? 4.52. Trọng lượng bao gạo là biến ngẫu nhiên có phân phối chuẩn với trọng lượng trung bình là 50 kg. Sau một khong thời gian người ta nghi ngờ trọng lượng của bao gạo có thay đổi. Cân 25 bao gạo người ta thu được kết quả sau: 51
  51. Khối lượng (kg) 48 - 48,5 48,5 - 49 49 - 49,5 49,5 - 50 50 - 50,5 số bao gạo 2 5 10 6 2 4.53. Một công ty sản xuất hạt giống tuyên bố rằng một loại giống mới của họ có năng suất trung bình là 21,5 tạ/ha. Gieo thử hạt giống mới này tại 16 vườn thí nghiệm và thu được kết quả 19,2; 18,7; 22,4; 20,3; 16,8; 25,1; 17,0; 15,8; 21,0; 18,6; 23,7; 24,1; 23,4; 19,8; 21,7; 18,9. Dựa vào kết quả này hãy xác nhận xem quảng cáo của công ty có đúng không với mức ý nghĩa α = 0, 05. Biết rằng năng suất giống cây trồng là một biến ngẫu nhiên có phân phối chuẩn N(µ; σ2). 4.54. Ở một nhà máy dệt, kiểm tra ngẫu nhiên 100 tấm vải (dài 30m) thấy số khuyết tật trung bình là 2,5 với phương sai σ2 = 4. a) Hãy ước lượng số khuyết tật trung bình của mỗi tấm vải với độ tin cậy 95%. b) Nếu độ chính xác của ước lượng là 0,14 (khuyết tật) thì độ tin cậy của ước lượng là bao nhiêu? c) Với độ chính xác của ước lượng bé hơn 0,14, độ tin cậy 95% thì phải kiểm tra thêm ít nhất bao nhiêu sản phẩm nữa? 4.55. Công ty xe buýt nói rằng cứ trung bình 5 phút lại có một chuyến xư. Chọn ngẫu nhiên 8 thời điểm và ghi lại thời gian giữa hai chuyến xe buýt ta thu được số liệu sau: 5,3; 4,5; 4,8; 5,1; 4,3; 4,8; 4,9 4,7. Với mức ý nghĩa 5%, nhận định xem công ty xe buýt nói có đúng không. 4.56. Một trại chăn nuôi A xuất chuồng 200 con lợn, trọng lượng hơi tính bằng (Kg), ta có bảng số liệu sau: Trọng lượng (xi) 45-55 55-65 65-75 75-85 85-95 95-105 Số lợn 10 30 45 80 30 5 a) Ước lượng trọng lượng lợn (hơi) trung bình của trại chăn nuôi A với độ tin cậy 95%. b) Nếu chủ trại chăn nuôi A thông báo trọng lượng (hơi) trung bình của trại chăn nuôi là trên 80 kg thì có chấp nhận được không với mức ý nghĩa 10% c) Lợn có trọng lượng từ 85 kg trở lên được gọi là lợn chóng lớn, hãy ước lượng tỷ lệ lợn chóng lớn của trại chăn nuôi trên với mức ý nghĩa 99%. 4.57. Tại một khu vườn trồng xoài, để điều tra trọng lượng của các trái xoài, một người đã cân thử một 100 trái xoài và kết quả được cho ở bảng sau: Trọng lượng (g) Số trái Trọng lượng (g) Số trái 450 - 500 2 600 - 650 10 500 - 550 30 650 - 700 25 550 - 600 20 700 - 750 13 52
  52. a) Nếu người đó cho biết trọng lượng trung bình của các trái xoài là 610g với độ tin cậy 95% thì có thể chấp nhận được không? b) Những trái xoài có trọng lượng từ 650g trở lên được xem là loại I. Người đó cho biết tỉ lệ loại I là 25% với độ tin cậy 99% thì có đúng hay không? c) Những trái xoài không phải là loại I thì là loại II. Với độ tin cậy 95% có thể khẳng định trọng lượng trung bình của các trái xoài loại II là 580g được không. B) Một số đề kiểm tra tham khảo Đề 1: Câu 1. Đề cương ôn tập môn Toán có 20 câu. Lớp A có 40 sinh viên được chia thành ba nhóm gồm: nhóm chuẩn bị tốt có 15 sinh viên, nhóm chuẩn bị khá có 20 sinh viên và nhóm chuẩn bị trung bình có 5 sinh viên. Sinh viên chuẩn bị tốt học 18 câu, sinh viên chuẩn bị khá học 15 câu, sinh viên chuẩn bị trung bình học 10 câu. Gọi ngẫu nhiên một sinh viên của lớp và hỏi một câu trong đề cương. a) Tìm xác suất để sinh viên được gọi trả lời được câu hỏi. b) Biết rằng sinh viên đó trả lời được câu hỏi, tìm xác suất để sinh viên đó thuộc nhóm chuẩn bị khá. Câu 2. Có hai xạ thủ A và B mỗi người cầm 3 viên đạn đi thử súng. Họ bắn liên tiếp vào một bia, nếu còn đạn và bia chưa bị bắn thì họ vẫn còn bắn. Xác suất bắn trúng bia của hai người A và B lần lượt là 0,8 và 0,9. Biết rằng người A bắn trước. Gọi X là số đạn người A đã bắn. a) Lập bảng phân phối xác suất của biến ngẫu nhiên X. b) Xác định hàm phân phối của biến ngẫu nhiên X. c) Tính kỳ vọng và phương sai của biến ngẫu nhiên X. Câu 3. Để khảo sát chiều cao sinh viên của trường Đại học A một mẫu gồm 36 sinh viên được chọn, chiều cao của các sinh viên này đo được như sau chiều cao (cm) tần số chiều cao (cm) tần số 163 6 170 4 165 3 172 6 166 2 174 5 168 6 175 4 Biết rằng chiều cao sinh viên có phân phối chuẩn N(µ, 16). a) Ở mức tin cậy P = 95% hãy ước lượng kỳ vọng µ. b) Để đạt được độ chính xác ε = 1 ở mức tin cậy 99% thì phải điều tra ít nhất bao nhiêu sinh viên? c) Kiểm định giả thiết H0 : µ = 180cm; đối thiết H1 : µ 6= 180cm ở mức tin cậy 99%. t Cho biết: với Φ(t) = R e−x2/2dx thì Φ(1, 96) = 0, 975; Φ(2, 58) = 0, 995. −∞ Ghi chú: Sinh viên không được sử dụng tài liệu khi làm bài. 53