Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 5: Mẫu ngẫu nhiên và cách đặc trưng

pdf 98 trang hapham 3320
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 5: Mẫu ngẫu nhiên và cách đặc trưng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_hoc_chuong_5_m.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 5: Mẫu ngẫu nhiên và cách đặc trưng

  1. Lý thuyết Xác suất và Thống kê Toán học PGS.TS. Trần Lộc Hùng Tp. Hồ Chí Minh, 10/ 2013 Ngày 12 tháng 10 năm 2013 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 1 / 47
  2. TRƯỜNG ĐẠI HỌC TÀI CHÍNH-MARKETING KHOA CƠ BẢN, BỘ MÔN TOÁN-THỐNG KÊ PGS. TS. TRẦN LỘC HÙNG LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Tp. Hồ Chí Minh, 10/2013 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 2 / 47
  3. Lý thuyết Xác suất và Thống kê Toán học PGS.TS. Trần Lộc Hùng Tp. Hồ Chí Minh, 10/ 2013 Ngày 12 tháng 10 năm 2013 Chương 5. Mẫu ngẫu nhiên và các đặc trưng PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 3 / 47
  4. Hàm phân phối thực nghiệm Trung bình mẫu, phương sai mẫu, tần suất mẫu Phân phối xác suất của các đặc trưng mẫu Từ khóa (Key Words) Tổng thể và mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 4 / 47
  5. Trung bình mẫu, phương sai mẫu, tần suất mẫu Phân phối xác suất của các đặc trưng mẫu Từ khóa (Key Words) Tổng thể và mẫu Hàm phân phối thực nghiệm PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 4 / 47
  6. Phân phối xác suất của các đặc trưng mẫu Từ khóa (Key Words) Tổng thể và mẫu Hàm phân phối thực nghiệm Trung bình mẫu, phương sai mẫu, tần suất mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 4 / 47
  7. Từ khóa (Key Words) Tổng thể và mẫu Hàm phân phối thực nghiệm Trung bình mẫu, phương sai mẫu, tần suất mẫu Phân phối xác suất của các đặc trưng mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 4 / 47
  8. 2 Nghĩa Hán - Việt của từ "Thống kê" 3 Nghĩa tiếng Anh của từ "Statistics" 4 Phân loại Thống kê (thống kê mô tả, thống kê cổ điển, thống kê lý thuyết, nguyên lý thống kê, Thống kê Bayes) 5 Thống kê tại Việt Nam Lịch sử Thống kê 1 Thống kê thời cổ đại PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 5 / 47
  9. 3 Nghĩa tiếng Anh của từ "Statistics" 4 Phân loại Thống kê (thống kê mô tả, thống kê cổ điển, thống kê lý thuyết, nguyên lý thống kê, Thống kê Bayes) 5 Thống kê tại Việt Nam Lịch sử Thống kê 1 Thống kê thời cổ đại 2 Nghĩa Hán - Việt của từ "Thống kê" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 5 / 47
  10. 4 Phân loại Thống kê (thống kê mô tả, thống kê cổ điển, thống kê lý thuyết, nguyên lý thống kê, Thống kê Bayes) 5 Thống kê tại Việt Nam Lịch sử Thống kê 1 Thống kê thời cổ đại 2 Nghĩa Hán - Việt của từ "Thống kê" 3 Nghĩa tiếng Anh của từ "Statistics" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 5 / 47
  11. 5 Thống kê tại Việt Nam Lịch sử Thống kê 1 Thống kê thời cổ đại 2 Nghĩa Hán - Việt của từ "Thống kê" 3 Nghĩa tiếng Anh của từ "Statistics" 4 Phân loại Thống kê (thống kê mô tả, thống kê cổ điển, thống kê lý thuyết, nguyên lý thống kê, Thống kê Bayes) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 5 / 47
  12. Lịch sử Thống kê 1 Thống kê thời cổ đại 2 Nghĩa Hán - Việt của từ "Thống kê" 3 Nghĩa tiếng Anh của từ "Statistics" 4 Phân loại Thống kê (thống kê mô tả, thống kê cổ điển, thống kê lý thuyết, nguyên lý thống kê, Thống kê Bayes) 5 Thống kê tại Việt Nam PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 5 / 47
  13. 2 Hàm phân phối thực nghiệm 3 Trung bình mẫu 4 Phương sai mẫu và phương sai điều chỉnh 5 Tần suất mẫu 6 Các phân phối xác suất của các đặc trưng mẫu 7 Bài tập Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  14. 3 Trung bình mẫu 4 Phương sai mẫu và phương sai điều chỉnh 5 Tần suất mẫu 6 Các phân phối xác suất của các đặc trưng mẫu 7 Bài tập Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên 2 Hàm phân phối thực nghiệm PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  15. 4 Phương sai mẫu và phương sai điều chỉnh 5 Tần suất mẫu 6 Các phân phối xác suất của các đặc trưng mẫu 7 Bài tập Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên 2 Hàm phân phối thực nghiệm 3 Trung bình mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  16. 5 Tần suất mẫu 6 Các phân phối xác suất của các đặc trưng mẫu 7 Bài tập Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên 2 Hàm phân phối thực nghiệm 3 Trung bình mẫu 4 Phương sai mẫu và phương sai điều chỉnh PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  17. 6 Các phân phối xác suất của các đặc trưng mẫu 7 Bài tập Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên 2 Hàm phân phối thực nghiệm 3 Trung bình mẫu 4 Phương sai mẫu và phương sai điều chỉnh 5 Tần suất mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  18. 7 Bài tập Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên 2 Hàm phân phối thực nghiệm 3 Trung bình mẫu 4 Phương sai mẫu và phương sai điều chỉnh 5 Tần suất mẫu 6 Các phân phối xác suất của các đặc trưng mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  19. Chương 5. Mẫu ngẫu nhiên và các đặc trưng 1 Mẫu ngẫu nhiên 2 Hàm phân phối thực nghiệm 3 Trung bình mẫu 4 Phương sai mẫu và phương sai điều chỉnh 5 Tần suất mẫu 6 Các phân phối xác suất của các đặc trưng mẫu 7 Bài tập PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 6 / 47
  20. 5.1 Mẫu ngẫu nhiên tổng thể Ω = {x1, x2, , xn, }− tập tất cả các số liệu sinh ra từ một biến ngẫu nhiên X và mẫu ngẫu nhiên ωn = {x1, x2, , xn} ⊆ Ω là tập n các số liệu sinh ra từ n quan sát biến ngẫu nhiên X. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 7 / 47
  21. Ví dụ Chiều cao sinh viên Ω = {172, 168, , 159, }− tập tất cả các số liệu sinh ra từ một biến ngẫu nhiên X-chiều cao của sinh viên đại học và mẫu số liệu của 150 sinh viên ω150 = {158, 169, 171, , 173} gồm 150 số liệu về chiều cao của 150 sinh viên. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 8 / 47
  22. 2 Mẫu ngẫu nhiên cỡ n, ωn sinh ra bởi n quan sát độc lập một biến ngẫu nhiên X 3 Mẫu ngẫu nhiên ωn = {X1, X2, , Xn} gồm n biến ngẫu nhiên độc lập cùng phân phối 4 Số n được gọi là kích thước mẫu hay cỡ mẫu Giải thích 1 Biến ngẫu nhiên X đặc trưng cho một tính chất nào đó của tổng thể Ω) như chiều cao, trọng lượng, tuổi thọ, mức sống, PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 9 / 47
  23. 3 Mẫu ngẫu nhiên ωn = {X1, X2, , Xn} gồm n biến ngẫu nhiên độc lập cùng phân phối 4 Số n được gọi là kích thước mẫu hay cỡ mẫu Giải thích 1 Biến ngẫu nhiên X đặc trưng cho một tính chất nào đó của tổng thể Ω) như chiều cao, trọng lượng, tuổi thọ, mức sống, 2 Mẫu ngẫu nhiên cỡ n, ωn sinh ra bởi n quan sát độc lập một biến ngẫu nhiên X PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 9 / 47
  24. 4 Số n được gọi là kích thước mẫu hay cỡ mẫu Giải thích 1 Biến ngẫu nhiên X đặc trưng cho một tính chất nào đó của tổng thể Ω) như chiều cao, trọng lượng, tuổi thọ, mức sống, 2 Mẫu ngẫu nhiên cỡ n, ωn sinh ra bởi n quan sát độc lập một biến ngẫu nhiên X 3 Mẫu ngẫu nhiên ωn = {X1, X2, , Xn} gồm n biến ngẫu nhiên độc lập cùng phân phối PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 9 / 47
  25. Giải thích 1 Biến ngẫu nhiên X đặc trưng cho một tính chất nào đó của tổng thể Ω) như chiều cao, trọng lượng, tuổi thọ, mức sống, 2 Mẫu ngẫu nhiên cỡ n, ωn sinh ra bởi n quan sát độc lập một biến ngẫu nhiên X 3 Mẫu ngẫu nhiên ωn = {X1, X2, , Xn} gồm n biến ngẫu nhiên độc lập cùng phân phối 4 Số n được gọi là kích thước mẫu hay cỡ mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 9 / 47
  26. 2 x[1] = min{x1, x2, , xn}- giá trị bé nhất của mẫu 3 x[n] = max{x1, x2, , xn}- giá trị lớn nhất của mẫu 5.2 Hàm phân phối thực nghiệm (hàm phân phối mẫu) Định nghĩa  0, nếu x < x  [1] nj Fn(x) = n , nếu có nj giá trị của mẫu bé hơn x  1, nếu x ≥ x[n]. 1 Mẫu ngẫu nhiên ωn = {X[1], X[2], , X[n]} là mẫu có thứ tự PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 10 / 47
  27. 3 x[n] = max{x1, x2, , xn}- giá trị lớn nhất của mẫu 5.2 Hàm phân phối thực nghiệm (hàm phân phối mẫu) Định nghĩa  0, nếu x < x  [1] nj Fn(x) = n , nếu có nj giá trị của mẫu bé hơn x  1, nếu x ≥ x[n]. 1 Mẫu ngẫu nhiên ωn = {X[1], X[2], , X[n]} là mẫu có thứ tự 2 x[1] = min{x1, x2, , xn}- giá trị bé nhất của mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 10 / 47
  28. 5.2 Hàm phân phối thực nghiệm (hàm phân phối mẫu) Định nghĩa  0, nếu x < x  [1] nj Fn(x) = n , nếu có nj giá trị của mẫu bé hơn x  1, nếu x ≥ x[n]. 1 Mẫu ngẫu nhiên ωn = {X[1], X[2], , X[n]} là mẫu có thứ tự 2 x[1] = min{x1, x2, , xn}- giá trị bé nhất của mẫu 3 x[n] = max{x1, x2, , xn}- giá trị lớn nhất của mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 10 / 47
  29. 2 Khi n lớn hàm phân phối thực nghiệm có giá trị gần đúng với hàm phân phối lý thuyết Fn(x) ≈ FX (x) 3 Làm thực nghiệm cần xử lý tập lớn số liệu để thông tin nhận được đủ tin cậy Định lý Glivenko-Cantelli Định lý P( lim sup | Fn(x) − FX (x) |= 0) = 1 n→∞ x∈R 1 Hàm phân phối lý thuyết FX (x) = P(X < x)còn được gọi là hàm phân phối chính xác PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 11 / 47
  30. 3 Làm thực nghiệm cần xử lý tập lớn số liệu để thông tin nhận được đủ tin cậy Định lý Glivenko-Cantelli Định lý P( lim sup | Fn(x) − FX (x) |= 0) = 1 n→∞ x∈R 1 Hàm phân phối lý thuyết FX (x) = P(X < x)còn được gọi là hàm phân phối chính xác 2 Khi n lớn hàm phân phối thực nghiệm có giá trị gần đúng với hàm phân phối lý thuyết Fn(x) ≈ FX (x) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 11 / 47
  31. Định lý Glivenko-Cantelli Định lý P( lim sup | Fn(x) − FX (x) |= 0) = 1 n→∞ x∈R 1 Hàm phân phối lý thuyết FX (x) = P(X < x)còn được gọi là hàm phân phối chính xác 2 Khi n lớn hàm phân phối thực nghiệm có giá trị gần đúng với hàm phân phối lý thuyết Fn(x) ≈ FX (x) 3 Làm thực nghiệm cần xử lý tập lớn số liệu để thông tin nhận được đủ tin cậy PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 11 / 47
  32. 2 Pn Kỳ vọng toán E(X ) = µ = j xj pj còn được gọi là trung bình tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 3 2 Pn 2 Phương sai D(X ) = σ = j | xj − µ | pj còn được gọi là phương sai tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 4 Xác suất pj = P(X = xj ) = p, j = 1, 2, n còn được gọi là tần suất tổng thể 5 Các đặc trưng µ, σ2, p được gọi là các tham số tổng thể (tham số lý thuyết) Lưu ý Giả sử X là biến ngẫu nhiên đặc trưng cho tính chất nào đó (cần nghiên cứu) của tổng thể Ω Khi đó, 1 Hàm phân phối lý thuyết FX (x) = P(X < x) còn được gọi là hàm phân phối chính xác PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 12 / 47
  33. 3 2 Pn 2 Phương sai D(X ) = σ = j | xj − µ | pj còn được gọi là phương sai tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 4 Xác suất pj = P(X = xj ) = p, j = 1, 2, n còn được gọi là tần suất tổng thể 5 Các đặc trưng µ, σ2, p được gọi là các tham số tổng thể (tham số lý thuyết) Lưu ý Giả sử X là biến ngẫu nhiên đặc trưng cho tính chất nào đó (cần nghiên cứu) của tổng thể Ω Khi đó, 1 Hàm phân phối lý thuyết FX (x) = P(X < x) còn được gọi là hàm phân phối chính xác 2 Pn Kỳ vọng toán E(X ) = µ = j xj pj còn được gọi là trung bình tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 12 / 47
  34. 4 Xác suất pj = P(X = xj ) = p, j = 1, 2, n còn được gọi là tần suất tổng thể 5 Các đặc trưng µ, σ2, p được gọi là các tham số tổng thể (tham số lý thuyết) Lưu ý Giả sử X là biến ngẫu nhiên đặc trưng cho tính chất nào đó (cần nghiên cứu) của tổng thể Ω Khi đó, 1 Hàm phân phối lý thuyết FX (x) = P(X < x) còn được gọi là hàm phân phối chính xác 2 Pn Kỳ vọng toán E(X ) = µ = j xj pj còn được gọi là trung bình tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 3 2 Pn 2 Phương sai D(X ) = σ = j | xj − µ | pj còn được gọi là phương sai tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 12 / 47
  35. 5 Các đặc trưng µ, σ2, p được gọi là các tham số tổng thể (tham số lý thuyết) Lưu ý Giả sử X là biến ngẫu nhiên đặc trưng cho tính chất nào đó (cần nghiên cứu) của tổng thể Ω Khi đó, 1 Hàm phân phối lý thuyết FX (x) = P(X < x) còn được gọi là hàm phân phối chính xác 2 Pn Kỳ vọng toán E(X ) = µ = j xj pj còn được gọi là trung bình tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 3 2 Pn 2 Phương sai D(X ) = σ = j | xj − µ | pj còn được gọi là phương sai tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 4 Xác suất pj = P(X = xj ) = p, j = 1, 2, n còn được gọi là tần suất tổng thể PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 12 / 47
  36. Lưu ý Giả sử X là biến ngẫu nhiên đặc trưng cho tính chất nào đó (cần nghiên cứu) của tổng thể Ω Khi đó, 1 Hàm phân phối lý thuyết FX (x) = P(X < x) còn được gọi là hàm phân phối chính xác 2 Pn Kỳ vọng toán E(X ) = µ = j xj pj còn được gọi là trung bình tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 3 2 Pn 2 Phương sai D(X ) = σ = j | xj − µ | pj còn được gọi là phương sai tổng thể (xét trường hợp X là biến ngẫu nhiên rời rạc) 4 Xác suất pj = P(X = xj ) = p, j = 1, 2, n còn được gọi là tần suất tổng thể 5 Các đặc trưng µ, σ2, p được gọi là các tham số tổng thể (tham số lý thuyết) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 12 / 47
  37. 2 Không phụ thuộc vào cỡ mẫu, kỳ vọng của trung bình mẫu (thực nghiệm) bằng trung bình lý thuyết: n n n 1 X 1 X 1 X E(X ) = E( X ) = E(X ) = µ = µ n j n j n j=1 j=1 j=1 2 3 σ Phương sai của trung bình mẫu D(X ) = n ↓ 0 khi n ↑ ∞ 5.3 Các đặc trưng của mẫu ngẫu nhiên Trung bình mẫu n 1 X E (X ) = X = X n n j j=1 1 Trung bình mẫu X là một biến ngẫu nhiên. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 13 / 47
  38. 2 3 σ Phương sai của trung bình mẫu D(X ) = n ↓ 0 khi n ↑ ∞ 5.3 Các đặc trưng của mẫu ngẫu nhiên Trung bình mẫu n 1 X E (X ) = X = X n n j j=1 1 Trung bình mẫu X là một biến ngẫu nhiên. 2 Không phụ thuộc vào cỡ mẫu, kỳ vọng của trung bình mẫu (thực nghiệm) bằng trung bình lý thuyết: n n n 1 X 1 X 1 X E(X ) = E( X ) = E(X ) = µ = µ n j n j n j=1 j=1 j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 13 / 47
  39. 5.3 Các đặc trưng của mẫu ngẫu nhiên Trung bình mẫu n 1 X E (X ) = X = X n n j j=1 1 Trung bình mẫu X là một biến ngẫu nhiên. 2 Không phụ thuộc vào cỡ mẫu, kỳ vọng của trung bình mẫu (thực nghiệm) bằng trung bình lý thuyết: n n n 1 X 1 X 1 X E(X ) = E( X ) = E(X ) = µ = µ n j n j n j=1 j=1 j=1 2 3 σ Phương sai của trung bình mẫu D(X ) = n ↓ 0 khi n ↑ ∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 13 / 47
  40. 2 Kỳ vọng của phương sai mẫu không bằng phương sai lý thuyết: n 1 X 2 n − 1 E(S2) = E( | X − X | ) = σ2 6= σ2 n n j n j=1 ˆ2 3 Phải sử dụng phương sai mẫu điều chỉnh Sn 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu n 1 X 2 D (X ) = S2 = | X − X | n n n j j=1 2 1 Phương sai mẫu Sn là một biến ngẫu nhiên. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 14 / 47
  41. ˆ2 3 Phải sử dụng phương sai mẫu điều chỉnh Sn 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu n 1 X 2 D (X ) = S2 = | X − X | n n n j j=1 2 1 Phương sai mẫu Sn là một biến ngẫu nhiên. 2 Kỳ vọng của phương sai mẫu không bằng phương sai lý thuyết: n 1 X 2 n − 1 E(S2) = E( | X − X | ) = σ2 6= σ2 n n j n j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 14 / 47
  42. 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu n 1 X 2 D (X ) = S2 = | X − X | n n n j j=1 2 1 Phương sai mẫu Sn là một biến ngẫu nhiên. 2 Kỳ vọng của phương sai mẫu không bằng phương sai lý thuyết: n 1 X 2 n − 1 E(S2) = E( | X − X | ) = σ2 6= σ2 n n j n j=1 ˆ2 3 Phải sử dụng phương sai mẫu điều chỉnh Sn PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 14 / 47
  43. 2 Kỳ vọng của phương sai mẫu bằng phương sai lý thuyết: n 1 X 2 E(Sˆ2) = E( | X − X | ) = σ2 n n − 1 j j=1 ˆ2 3 Trong thực tế thường sử dụng phương sai mẫu điều chỉnh Sn 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu điều chỉnh n 1 X 2 D ˆ(X ) = Sˆ2 = | X − X | n n n − 1 j j=1 ˆ2 1 Phương sai mẫu điều chỉnh Sn là một biến ngẫu nhiên. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 15 / 47
  44. ˆ2 3 Trong thực tế thường sử dụng phương sai mẫu điều chỉnh Sn 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu điều chỉnh n 1 X 2 D ˆ(X ) = Sˆ2 = | X − X | n n n − 1 j j=1 ˆ2 1 Phương sai mẫu điều chỉnh Sn là một biến ngẫu nhiên. 2 Kỳ vọng của phương sai mẫu bằng phương sai lý thuyết: n 1 X 2 E(Sˆ2) = E( | X − X | ) = σ2 n n − 1 j j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 15 / 47
  45. 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu điều chỉnh n 1 X 2 D ˆ(X ) = Sˆ2 = | X − X | n n n − 1 j j=1 ˆ2 1 Phương sai mẫu điều chỉnh Sn là một biến ngẫu nhiên. 2 Kỳ vọng của phương sai mẫu bằng phương sai lý thuyết: n 1 X 2 E(Sˆ2) = E( | X − X | ) = σ2 n n − 1 j j=1 ˆ2 3 Trong thực tế thường sử dụng phương sai mẫu điều chỉnh Sn PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 15 / 47
  46. ˆ2 2 2 Trong nhiều phần mềm thống kê, Sn được thay cho Sn 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu điều chỉnh và phương sai mẫu n Sˆ2 = S2 n n − 1 n 1 Khi n lớn, hai giá trị đó xấp xỉ nhau, vì n lim = 1 n→∞ n − 1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 16 / 47
  47. 5.3 Các đặc trưng của mẫu ngẫu nhiên Phương sai mẫu điều chỉnh và phương sai mẫu n Sˆ2 = S2 n n − 1 n 1 Khi n lớn, hai giá trị đó xấp xỉ nhau, vì n lim = 1 n→∞ n − 1 ˆ2 2 2 Trong nhiều phần mềm thống kê, Sn được thay cho Sn PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 16 / 47
  48. 5.3 Các đặc trưng của mẫu ngẫu nhiên Dùng trong tính toán n 1 X S2 = X 2 − (X )2 n n j j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 17 / 47
  49. 2 Khi n lớn, tần suất thực nghiệm (mẫu) xấp xỉ tần suất lý thuyết p fn ≈ p 3 Đây là bản chất của xác suất theo quan điểm thống kê và là Luật yếu các số lớn Bernoulli 5.3 Các đặc trưng của mẫu ngẫu nhiên Tần suất mẫu k f = n n 1 n là cỡ mẫu, k là số các thành phần mẫu thỏa mãn điều kiện của người chọn mẫu PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 18 / 47
  50. 3 Đây là bản chất của xác suất theo quan điểm thống kê và là Luật yếu các số lớn Bernoulli 5.3 Các đặc trưng của mẫu ngẫu nhiên Tần suất mẫu k f = n n 1 n là cỡ mẫu, k là số các thành phần mẫu thỏa mãn điều kiện của người chọn mẫu 2 Khi n lớn, tần suất thực nghiệm (mẫu) xấp xỉ tần suất lý thuyết p fn ≈ p PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 18 / 47
  51. 5.3 Các đặc trưng của mẫu ngẫu nhiên Tần suất mẫu k f = n n 1 n là cỡ mẫu, k là số các thành phần mẫu thỏa mãn điều kiện của người chọn mẫu 2 Khi n lớn, tần suất thực nghiệm (mẫu) xấp xỉ tần suất lý thuyết p fn ≈ p 3 Đây là bản chất của xác suất theo quan điểm thống kê và là Luật yếu các số lớn Bernoulli PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 18 / 47
  52. 5.3 Các đặc trưng của mẫu ngẫu nhiên Mô men mẫu n 1 X ν = X k k n j j=1 Mô men trung tâm mẫu n 1 X µ = (X − X )k k n j j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 19 / 47
  53. 2 Mẫu B = {3, 4, 4, 5, 5, 5, 6, 7, 8, 9, 10, 11} có trung vị mẫu med=(5+6)/2=5.5 5.3 Các đặc trưng của mẫu ngẫu nhiên Trung vị mẫu (Median mẫu) Trong một mẫu thứ tự {x[1], x[2], , x[n]} trung vị mẫu là số đứng ở giữa nếu n lẻ, là trung bình cộng hai số đứng giữa nếu n chẵn 1 Mẫu A = {3, 4, 4, 5, 5, 5, 6, 7, 8, 9, 10} có trung vị mẫu med=5 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 20 / 47
  54. 5.3 Các đặc trưng của mẫu ngẫu nhiên Trung vị mẫu (Median mẫu) Trong một mẫu thứ tự {x[1], x[2], , x[n]} trung vị mẫu là số đứng ở giữa nếu n lẻ, là trung bình cộng hai số đứng giữa nếu n chẵn 1 Mẫu A = {3, 4, 4, 5, 5, 5, 6, 7, 8, 9, 10} có trung vị mẫu med=5 2 Mẫu B = {3, 4, 4, 5, 5, 5, 6, 7, 8, 9, 10, 11} có trung vị mẫu med=(5+6)/2=5.5 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 20 / 47
  55. 2 Mẫu B = {3, 4, 4, 4, 5, 5, 6, 7, 8, 9, 10, 11} có số trội mẫu mod=4 5.3 Các đặc trưng của mẫu ngẫu nhiên Số trội mẫu(Mod mẫu) Trong một mẫu {x[1], x[2], , x[n]} số trội mẫu là các số xuất hiện nhiều lần nhất 1 Mẫu A = {3, 4, 4, 5, 5, 5, 6, 7, 8, 9, 10} có số trội mẫu mod=5 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 21 / 47
  56. 5.3 Các đặc trưng của mẫu ngẫu nhiên Số trội mẫu(Mod mẫu) Trong một mẫu {x[1], x[2], , x[n]} số trội mẫu là các số xuất hiện nhiều lần nhất 1 Mẫu A = {3, 4, 4, 5, 5, 5, 6, 7, 8, 9, 10} có số trội mẫu mod=5 2 Mẫu B = {3, 4, 4, 4, 5, 5, 6, 7, 8, 9, 10, 11} có số trội mẫu mod=4 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 21 / 47
  57. 5.3 Các đặc trưng của mẫu ngẫu nhiên Hệ số bất đối xứng mẫu µ3 γ1 = 3 (µ2) 2 Hệ số nhọn mẫu µ4 γ2 = 2 − 3 (µ2) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 22 / 47
  58. 2 Đặc trưng về sự phân tán: phương sai mẫu, phương sai mẫu điều chỉnh, độ rộng mẫu (Rn = x[n] − x[1])) 3 Đặc trưng về hình dáng của phân phối (của hàm mật độ): hệ số bất đối xứng, hệ số nhọn Lưu ý Giả sử ωn là một mẫu ngẫu nhiên có các đặc trưng mẫu. Khi đó, 1 Đặc trưng về vị trí: trung bình mẫu, trung vị mẫu, số trội mẫu. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 23 / 47
  59. 3 Đặc trưng về hình dáng của phân phối (của hàm mật độ): hệ số bất đối xứng, hệ số nhọn Lưu ý Giả sử ωn là một mẫu ngẫu nhiên có các đặc trưng mẫu. Khi đó, 1 Đặc trưng về vị trí: trung bình mẫu, trung vị mẫu, số trội mẫu. 2 Đặc trưng về sự phân tán: phương sai mẫu, phương sai mẫu điều chỉnh, độ rộng mẫu (Rn = x[n] − x[1])) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 23 / 47
  60. Lưu ý Giả sử ωn là một mẫu ngẫu nhiên có các đặc trưng mẫu. Khi đó, 1 Đặc trưng về vị trí: trung bình mẫu, trung vị mẫu, số trội mẫu. 2 Đặc trưng về sự phân tán: phương sai mẫu, phương sai mẫu điều chỉnh, độ rộng mẫu (Rn = x[n] − x[1])) 3 Đặc trưng về hình dáng của phân phối (của hàm mật độ): hệ số bất đối xứng, hệ số nhọn PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 23 / 47
  61. 2 Vẽ biểu đồ mô tả mẫu trên 5.3 Các đặc trưng của mẫu ngẫu nhiên Ví dụ Trọng lượng tính bằng kg của 45 sinh viên 43, 50, 58, 65, 55, 60, 53, 65, 71, 63, 66, 76, 54, 61, 66 49, 55, 58, 65, 54, 61, 54, 65, 70, 64, 61, 75, 56, 69, 67 54, 55, 51, 61, 59, 61, 56, 65, 71, 64, 61, 70, 59, 61, 65 1 Tính các đặc trưng của mẫu trên PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 24 / 47
  62. 5.3 Các đặc trưng của mẫu ngẫu nhiên Ví dụ Trọng lượng tính bằng kg của 45 sinh viên 43, 50, 58, 65, 55, 60, 53, 65, 71, 63, 66, 76, 54, 61, 66 49, 55, 58, 65, 54, 61, 54, 65, 70, 64, 61, 75, 56, 69, 67 54, 55, 51, 61, 59, 61, 56, 65, 71, 64, 61, 70, 59, 61, 65 1 Tính các đặc trưng của mẫu trên 2 Vẽ biểu đồ mô tả mẫu trên PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 24 / 47
  63. 2 Lệnh mean(x) cho biết X = 60.93333 3 2 Lệnh var(x) cho biết S45 = 49.65455 4 Lệnh range(x) cho biết R45 = 76 − 43 = 33 Giải: Sử dụng ngôn ngữ R, với lệnh tạo mẫu x < −c() 1 lệnh summary(x) cho biết Min = 43. 1stQu. = 55 Median = 61. Mean = 60.93 3rdQu. = 65 Max. = 76 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 25 / 47
  64. 3 2 Lệnh var(x) cho biết S45 = 49.65455 4 Lệnh range(x) cho biết R45 = 76 − 43 = 33 Giải: Sử dụng ngôn ngữ R, với lệnh tạo mẫu x < −c() 1 lệnh summary(x) cho biết Min = 43. 1stQu. = 55 Median = 61. Mean = 60.93 3rdQu. = 65 Max. = 76 2 Lệnh mean(x) cho biết X = 60.93333 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 25 / 47
  65. 4 Lệnh range(x) cho biết R45 = 76 − 43 = 33 Giải: Sử dụng ngôn ngữ R, với lệnh tạo mẫu x < −c() 1 lệnh summary(x) cho biết Min = 43. 1stQu. = 55 Median = 61. Mean = 60.93 3rdQu. = 65 Max. = 76 2 Lệnh mean(x) cho biết X = 60.93333 3 2 Lệnh var(x) cho biết S45 = 49.65455 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 25 / 47
  66. Giải: Sử dụng ngôn ngữ R, với lệnh tạo mẫu x < −c() 1 lệnh summary(x) cho biết Min = 43. 1stQu. = 55 Median = 61. Mean = 60.93 3rdQu. = 65 Max. = 76 2 Lệnh mean(x) cho biết X = 60.93333 3 2 Lệnh var(x) cho biết S45 = 49.65455 4 Lệnh range(x) cho biết R45 = 76 − 43 = 33 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 25 / 47
  67. Biểu đồ 1 Sử dụng ngôn ngữ R, với lệnh tạo hist(x) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 26 / 47
  68. 2 Mọi hàm của mẫu được gọi là một thống kê 5.4 Các phân phối của các đại lượng thống kê 1 Giả sử ωn = {X1, X2, , Xn} là một mẫu ngẫu nhiên Định nghĩa f (ωn) = f (X1, X2, , Xn) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 27 / 47
  69. 5.4 Các phân phối của các đại lượng thống kê 1 Giả sử ωn = {X1, X2, , Xn} là một mẫu ngẫu nhiên 2 Mọi hàm của mẫu được gọi là một thống kê Định nghĩa f (ωn) = f (X1, X2, , Xn) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 27 / 47
  70. 2 2 1 Pn 2 Phương sai mẫu Sn = n j=1(Xj − X ) là một thống kê 3 ˆ2 1 Pn 2 Phương sai mẫu điều chỉnh Sn = n−1 j=1(Xj − X ) là một thống kê 4 k Tần suất mẫu fn = n là một thống kê Các ví dụ 1 1 Pn Trung bình mẫu X = n j=1 Xj là một thống kê PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 28 / 47
  71. 3 ˆ2 1 Pn 2 Phương sai mẫu điều chỉnh Sn = n−1 j=1(Xj − X ) là một thống kê 4 k Tần suất mẫu fn = n là một thống kê Các ví dụ 1 1 Pn Trung bình mẫu X = n j=1 Xj là một thống kê 2 2 1 Pn 2 Phương sai mẫu Sn = n j=1(Xj − X ) là một thống kê PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 28 / 47
  72. 4 k Tần suất mẫu fn = n là một thống kê Các ví dụ 1 1 Pn Trung bình mẫu X = n j=1 Xj là một thống kê 2 2 1 Pn 2 Phương sai mẫu Sn = n j=1(Xj − X ) là một thống kê 3 ˆ2 1 Pn 2 Phương sai mẫu điều chỉnh Sn = n−1 j=1(Xj − X ) là một thống kê PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 28 / 47
  73. Các ví dụ 1 1 Pn Trung bình mẫu X = n j=1 Xj là một thống kê 2 2 1 Pn 2 Phương sai mẫu Sn = n j=1(Xj − X ) là một thống kê 3 ˆ2 1 Pn 2 Phương sai mẫu điều chỉnh Sn = n−1 j=1(Xj − X ) là một thống kê 4 k Tần suất mẫu fn = n là một thống kê PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 28 / 47
  74. √ 2 X −µ Thống kê Z = σ n có phân phối chuẩn N(0, 1). Phân phối của trung bình mẫu X Định lý Nếu (X1, X2, , Xn) là một mẫu sinh từ biến ngẫu nhiên có phân phối chuẩn chính tắc N(0, 1), thì 1 1 Pn 2 Trung bình mẫu X = n j=1 Xj có phân phối chuẩn N(µ, σ ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 29 / 47
  75. Phân phối của trung bình mẫu X Định lý Nếu (X1, X2, , Xn) là một mẫu sinh từ biến ngẫu nhiên có phân phối chuẩn chính tắc N(0, 1), thì 1 1 Pn 2 Trung bình mẫu X = n j=1 Xj có phân phối chuẩn N(µ, σ ). √ 2 X −µ Thống kê Z = σ n có phân phối chuẩn N(0, 1). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 29 / 47
  76. 2 2 Hàm mật độ của phân phối χn có dạng  0, nếu x ≤ 0 fU (x, n) = 1 n −1 − x n x 2 e 2 , nếu x > 0, n > 0.  2 n 2 Γ( 2 ) ∞ 3 R a−1 −x Trong đó hàm Gamma Γ(a) = 0 x e dx, (a > 1) ˆ2 Phân phối của phương sai mẫu điều chỉnh Sn Định lý 1 Nếu (X1, X2, , Xn) là một mẫu sinh từ biến ngẫu nhiên có phân phối chuẩn chính tắc N(0, 1), thì 1 2 2 2 Tổng các bình phương U = X1 + + Xn có phân phối χn (khi bình phương) với n bậc tự do. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 30 / 47
  77. ∞ 3 R a−1 −x Trong đó hàm Gamma Γ(a) = 0 x e dx, (a > 1) ˆ2 Phân phối của phương sai mẫu điều chỉnh Sn Định lý 1 Nếu (X1, X2, , Xn) là một mẫu sinh từ biến ngẫu nhiên có phân phối chuẩn chính tắc N(0, 1), thì 1 2 2 2 Tổng các bình phương U = X1 + + Xn có phân phối χn (khi bình phương) với n bậc tự do. 2 2 Hàm mật độ của phân phối χn có dạng  0, nếu x ≤ 0 fU (x, n) = 1 n −1 − x n x 2 e 2 , nếu x > 0, n > 0.  2 n 2 Γ( 2 ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 30 / 47
  78. ˆ2 Phân phối của phương sai mẫu điều chỉnh Sn Định lý 1 Nếu (X1, X2, , Xn) là một mẫu sinh từ biến ngẫu nhiên có phân phối chuẩn chính tắc N(0, 1), thì 1 2 2 2 Tổng các bình phương U = X1 + + Xn có phân phối χn (khi bình phương) với n bậc tự do. 2 2 Hàm mật độ của phân phối χn có dạng  0, nếu x ≤ 0 fU (x, n) = 1 n −1 − x n x 2 e 2 , nếu x > 0, n > 0.  2 n 2 Γ( 2 ) ∞ 3 R a−1 −x Trong đó hàm Gamma Γ(a) = 0 x e dx, (a > 1) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 30 / 47
  79. ˆ2 Phân phối của phương sai mẫu điều chỉnh Sn Định lý 2 Nếu (X1, X2, , Xn) là một mẫu sinh từ biến ngẫu nhiên có phân phối 2 n−1 ˆ2 2 chuẩn N(µ, σ ), thì σ2 Sn có phân phối χn−1 với (n-1) bậc tự do PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 31 / 47
  80. 2 Hàm mật độ phân phối χn 2 Hàm mật độ phân phối χn với n=4 và n=10 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 32 / 47
  81. Phân phối Student (t-phân phối) Định nghĩa Một biến ngẫu nhiên T được gọi là có phân phối Student với ν bậc tự do, nếu hàm mật độ có dạng Γ( ν+1 ) 1 √2 f (t, ν) = ν 2 ν+1 , ν > 0, t ∈ R Γ( ) πν t 2 2 (1 + ν ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 33 / 47
  82. Hàm mật độ phân phối Student Khi ν tăng, thì hàm mật độ f (t, ν) tiệm cận chuẩn. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 34 / 47
  83. Phân phối Student Định lý 1 Biến ngẫu nhiên T có dạng Z √ T = √ n U 2 có phân phối Student; trong đó Z độc lập với U, Z ∈ N(0, 1); U ∈ χn Định lý 2 2 X −µ √ Nếu X ∈ N(µ, σ ), thì biến ngẫu nhiên T = ˆ2 n có phân phối Sn Student với (n-1) bậc tự do PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 35 / 47
  84. Phân phối F (Fisher R.A - Snedecor G.W) Định nghĩa Một biến ngẫu nhiên X được gọi là có phân phối F với ν1 và ν1 bậc tự do, nếu với x > 0, ν1 > 0, ν2 > 0,hàm mật độ xác suất có dạng ν +ν 1 2 ν ν ν +ν Γ( 2 ) ν1 1 1 −1 ν1 1 2 f (t, ν , ν ) = ( ) 2 (x) 2 (1 + x) 2 1 2 ν1 ν2 Γ( 2 )Γ( 2 ) ν2 ν2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 36 / 47
  85. Hàm mật độ phân phối F Khi ν tăng, thì hàm mật độ f (t, ν) tiệm cận chuẩn. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 37 / 47
  86. Phân phối F Định lý 1 Biến ngẫu nhiên F có dạng U ν F = 1 x 2 U2 ν1 có phân phối F với ν1 và ν2 bậc tự do; trong đó U1 và U2 là các biến ngẫu 2 nhiên độc lập có phân phối χ với ν1 và ν2 bậc tự do Định lý 2 ˆ2 2 S1 Nếu X , Y ∈ N(µ, σ ), với X , Y độc lập, thì biến ngẫu nhiên F = ˆ2 có S2 phân phối F với (ν1 − 1) và (ν2 − 1) bậc tự do PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 38 / 47
  87. Phân phối tiệm cận chuẩn Định lý 1 Giả sử (X1, X2, , Xn) là mẫu sinh ra từ n quan sát độc lập của một biến 2 X −µ √ ngẫu nhiên có E(X ) = µ và D(X ) = σ , thì biến ngẫu nhiên Z = σ n có phân phối tiệm cận chuẩn khi n → ∞, tức là   Z x X − µ√ 1 − 1 y 2 lim P n < x = Φ(x) = √ e 2 dy n→∞ σ 2π −∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 39 / 47
  88. Phân phối tiệm cận chuẩn Định lý 2 Giả sử tiến hành n quan sát độc lập, với xác suất thành công của mỗi quan sát là p, p ∈ (0, 1). Gọi k là số quan sát thành công trong n quan k −p √ sát, 0 ≤ k ≤ n. Khi đó, biến ngẫu nhiên Z = √ n n có phân phối p(1−p) tiệm cận chuẩn khi n → ∞, tức là  k  Z x n − p √ 1 − 1 y 2 lim P p n < x = Φ(x) = √ e 2 dy n→∞ p(1 − p) 2π −∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 40 / 47
  89. Phân phối tiệm cận chuẩn Định lý 3 2 Giả sử X có phân phối√ χn với√ n bậc tự do. Khi đó, các biến ngẫu nhiên Z = X√−n và W = ( 2X − 2n − 1) có phân phối tiệm cận chuẩn khi 2n n → ∞, tức là   Z x X − n 1 − 1 y 2 lim P √ < x = Φ(x) = √ e 2 dy n→∞ 2n 2π −∞ và √ √  Z x 1 − 1 y 2 limn→∞P 2X − 2n − 1 < x = Φ(x) = √ e 2 dy 2π −∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 41 / 47
  90. Phân phối tiệm cận chuẩn Định lý 4 Giả sử T có phân phối Student với n bậc tự do. Khi đó, phân phối của T là tiệm cận chuẩn khi n → ∞, tức là   Z x 1 − 1 y 2 lim P T < x = Φ(x) = √ e 2 dy n→∞ 2π −∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 42 / 47
  91. Chú ý Nếu mẫu cỡ n chia thành k lớp với n1 + n2 + nk = n, thì trung bình mẫu k 1 X X = n X n j j j=1 và phương sai mẫu k 1 X 2 S2 = n X 2 − X n n j j n j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 43 / 47
  92. Chú ý Nếu mẫu chia thành k khoảng có độ dài bằng nhau [x0; h + x0], [x1; h + x1], [xk−1; h + xk−1] thì trung bình mẫu có dạng k 1 X 0 X = n X n n i i i=1 và phương sai mẫu k 1 X 0 02 S2 = n X 2 − X n n i i n i=1 0 1 với Xi = 2 [xi−1 + xi ], các điểm giữa các khoảng PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 44 / 47
  93. Chú ý Nếu mẫu chia thành k khoảng có độ dài bằng nhau và các giá trị khoảng lớn, có thể sử dụng phép biến đổi tuyến tính (X − X ) Y = i 0 i h và 2 2 2 Xn = hY + X0; SX = h SY , trong đó X0 ∈ {X1, X2, Xn} và h là độ rộng các khoảng PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 45 / 47
  94. 2 Cho ý kiến nhận xét Bài tập chương 5 Bài tập 1 Kiểm tra thời điểm nhân viên không làm việc tại một đơn vị, người ta có thống kê sau, với thời gian quy định kết thúc giờ làm việc là 5:00 pm. 5 : 10 4 : 55 5 : 05 4 : 37 4 : 58 4 : 55 4 : 59 5 : 11 4 : 50 5 : 00 4 : 35 4 : 59 4 : 54 4 : 58 1 Hãy tính các đặc trưng của mẫu (trung bình, phương sai mẫu, phương sai mẫu điều chỉnh, trung vị, mod, cỡ mẫu, độ rộng mẫu) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 46 / 47
  95. Bài tập chương 5 Bài tập 1 Kiểm tra thời điểm nhân viên không làm việc tại một đơn vị, người ta có thống kê sau, với thời gian quy định kết thúc giờ làm việc là 5:00 pm. 5 : 10 4 : 55 5 : 05 4 : 37 4 : 58 4 : 55 4 : 59 5 : 11 4 : 50 5 : 00 4 : 35 4 : 59 4 : 54 4 : 58 1 Hãy tính các đặc trưng của mẫu (trung bình, phương sai mẫu, phương sai mẫu điều chỉnh, trung vị, mod, cỡ mẫu, độ rộng mẫu) 2 Cho ý kiến nhận xét PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 46 / 47
  96. 2 Tính trung vị và trung bình các độ lệch so với trung vị Pn j=1 nj | Xj − Med | n 3 So sánh kết quả ở (1) và (2) Bài tập chương 5 Bài tập 2 Thống kê số phút đi làm muộn của một cơ quan, có kết quả sau X số phút muộn: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 nj −tần số: 183, 15, 16, 14, 13, 2, 1, 1, 1, 1 1 Hãy tính các đặc trưng của mẫu (trung bình, phương sai mẫu, phương sai mẫu điều chỉnh, trung vị, mod, cỡ mẫu, độ rộng mẫu) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 47 / 47
  97. 3 So sánh kết quả ở (1) và (2) Bài tập chương 5 Bài tập 2 Thống kê số phút đi làm muộn của một cơ quan, có kết quả sau X số phút muộn: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 nj −tần số: 183, 15, 16, 14, 13, 2, 1, 1, 1, 1 1 Hãy tính các đặc trưng của mẫu (trung bình, phương sai mẫu, phương sai mẫu điều chỉnh, trung vị, mod, cỡ mẫu, độ rộng mẫu) 2 Tính trung vị và trung bình các độ lệch so với trung vị Pn j=1 nj | Xj − Med | n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 47 / 47
  98. Bài tập chương 5 Bài tập 2 Thống kê số phút đi làm muộn của một cơ quan, có kết quả sau X số phút muộn: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 nj −tần số: 183, 15, 16, 14, 13, 2, 1, 1, 1, 1 1 Hãy tính các đặc trưng của mẫu (trung bình, phương sai mẫu, phương sai mẫu điều chỉnh, trung vị, mod, cỡ mẫu, độ rộng mẫu) 2 Tính trung vị và trung bình các độ lệch so với trung vị Pn j=1 nj | Xj − Med | n 3 So sánh kết quả ở (1) và (2) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 12 tháng 10 năm 2013 47 / 47