Bài giảng Lý thuyết xác suất và thống kê toán - Chương 7: Ước lượng các tham số của biến ngẫu nhiên

pdf 84 trang hapham 5380
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán - Chương 7: Ước lượng các tham số của biến ngẫu nhiên", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_7_uoc_l.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê toán - Chương 7: Ước lượng các tham số của biến ngẫu nhiên

  1. Giả sử đã biết quy luật phân phối xác suất của biến ngẫu nhiên X song chưa biết tham số θ nào đó của nó. Vấn đề đặt ra là phải xác định một cách gần đúng θ (ước lượng). Có 2 phương pháp để ước lượng: Ước lượng điểm: Dùng một giá trị để thay thế cho tham số cần ước lượng. Ước lượng bằng khoảng tin cậy: Chỉ ra một khoảng chứa tham số đó với một xác suất cho trước. Chương 7: ƯỚC LƯỢNG CÁC THAM SỐ CỦA BIẾN NGẪU NHIÊN
  2. Có 2 phương pháp để ước lượng: Ước lượng điểm: Dùng một giá trị để thay thế cho tham số cần ước lượng. Ước lượng bằng khoảng tin cậy: Chỉ ra một khoảng chứa tham số đó với một xác suất cho trước. Chương 7: ƯỚC LƯỢNG CÁC THAM SỐ CỦA BIẾN NGẪU NHIÊN Giả sử đã biết quy luật phân phối xác suất của biến ngẫu nhiên X song chưa biết tham số θ nào đó của nó. Vấn đề đặt ra là phải xác định một cách gần đúng θ (ước lượng).
  3. Chương 7: ƯỚC LƯỢNG CÁC THAM SỐ CỦA BIẾN NGẪU NHIÊN Giả sử đã biết quy luật phân phối xác suất của biến ngẫu nhiên X song chưa biết tham số θ nào đó của nó. Vấn đề đặt ra là phải xác định một cách gần đúng θ (ước lượng). Có 2 phương pháp để ước lượng: Ước lượng điểm: Dùng một giá trị để thay thế cho tham số cần ước lượng. Ước lượng bằng khoảng tin cậy: Chỉ ra một khoảng chứa tham số đó với một xác suất cho trước.
  4. Để ước lượng tham số θ của X (tổng thể), người ta xuất phát từ tham số θˆ tương ứng của mẫu sao cho θˆ mang nhiều thông tin nhất về θ, để có thể xấp xỉ θ một cách tốt nhất (dùng một tham số của mẫu thay cho một tham số chưa biết của tổng thể). Có hai phương pháp ước lượng điểm: Phương pháp hàm ước lượng Phương pháp ước lượng hợp lý tối đa PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM
  5. Có hai phương pháp ước lượng điểm: Phương pháp hàm ước lượng Phương pháp ước lượng hợp lý tối đa PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM Để ước lượng tham số θ của X (tổng thể), người ta xuất phát từ tham số θˆ tương ứng của mẫu sao cho θˆ mang nhiều thông tin nhất về θ, để có thể xấp xỉ θ một cách tốt nhất (dùng một tham số của mẫu thay cho một tham số chưa biết của tổng thể).
  6. PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM Để ước lượng tham số θ của X (tổng thể), người ta xuất phát từ tham số θˆ tương ứng của mẫu sao cho θˆ mang nhiều thông tin nhất về θ, để có thể xấp xỉ θ một cách tốt nhất (dùng một tham số của mẫu thay cho một tham số chưa biết của tổng thể). Có hai phương pháp ước lượng điểm: Phương pháp hàm ước lượng Phương pháp ước lượng hợp lý tối đa
  7. Khái niệm Lập mẫu ngẫu nhiên : W = (X1,X2, ,Xn). Chọn lập thống kê: G = f (X1, X2, , Xn) đặc trưng tương ứng với θ. Định nghĩa Thống kê G được gọi là hàm ước lượng của θ nếu f (x1, , xn) ≈ θ với mọi mẫu cụ thể w = (x1,. . . , xn). Chú ý: Có vô số cách chọn thống kê để có thể dùng làm ước lượng của θ. Vì vậy cần đưa ra các tiêu chuẩn để đánh giá chất lượng thống kê: Ước lượng không chệch Ước lượng hiệu quả Ước lượng vững Phương pháp hàm ước lượng
  8. Định nghĩa Thống kê G được gọi là hàm ước lượng của θ nếu f (x1, , xn) ≈ θ với mọi mẫu cụ thể w = (x1,. . . , xn). Chú ý: Có vô số cách chọn thống kê để có thể dùng làm ước lượng của θ. Vì vậy cần đưa ra các tiêu chuẩn để đánh giá chất lượng thống kê: Ước lượng không chệch Ước lượng hiệu quả Ước lượng vững Phương pháp hàm ước lượng Khái niệm Lập mẫu ngẫu nhiên : W = (X1,X2, ,Xn). Chọn lập thống kê: G = f (X1, X2, , Xn) đặc trưng tương ứng với θ.
  9. Chú ý: Có vô số cách chọn thống kê để có thể dùng làm ước lượng của θ. Vì vậy cần đưa ra các tiêu chuẩn để đánh giá chất lượng thống kê: Ước lượng không chệch Ước lượng hiệu quả Ước lượng vững Phương pháp hàm ước lượng Khái niệm Lập mẫu ngẫu nhiên : W = (X1,X2, ,Xn). Chọn lập thống kê: G = f (X1, X2, , Xn) đặc trưng tương ứng với θ. Định nghĩa Thống kê G được gọi là hàm ước lượng của θ nếu f (x1, , xn) ≈ θ với mọi mẫu cụ thể w = (x1,. . . , xn).
  10. Phương pháp hàm ước lượng Khái niệm Lập mẫu ngẫu nhiên : W = (X1,X2, ,Xn). Chọn lập thống kê: G = f (X1, X2, , Xn) đặc trưng tương ứng với θ. Định nghĩa Thống kê G được gọi là hàm ước lượng của θ nếu f (x1, , xn) ≈ θ với mọi mẫu cụ thể w = (x1,. . . , xn). Chú ý: Có vô số cách chọn thống kê để có thể dùng làm ước lượng của θ. Vì vậy cần đưa ra các tiêu chuẩn để đánh giá chất lượng thống kê: Ước lượng không chệch Ước lượng hiệu quả Ước lượng vững
  11. Định nghĩa Thống kê G của mẫu được gọi là ước lượng không chệch của tham số θ của biến ngẫu nhiên gốc X nếu E(G) = θ. Nếu E(G) 6= θ, G được gọi là ước lượng chệch của θ. Ví dụ E(X¯ ) = µ → Trung bình mẫu X¯ là ước lượng không chệch của kỳ vọng toán µ. E(f) = p → tần suất mẫu f là ước lượng không chệch của xác suất biến ngẫu nhiên gốc p. E(S2) = σ2; E(S∗2) = σ2 → S2 và S∗2 là ước lượng không chệch của σ2. Ước lượng không chệch
  12. Ví dụ E(X¯ ) = µ → Trung bình mẫu X¯ là ước lượng không chệch của kỳ vọng toán µ. E(f) = p → tần suất mẫu f là ước lượng không chệch của xác suất biến ngẫu nhiên gốc p. E(S2) = σ2; E(S∗2) = σ2 → S2 và S∗2 là ước lượng không chệch của σ2. Ước lượng không chệch Định nghĩa Thống kê G của mẫu được gọi là ước lượng không chệch của tham số θ của biến ngẫu nhiên gốc X nếu E(G) = θ. Nếu E(G) 6= θ, G được gọi là ước lượng chệch của θ.
  13. Ước lượng không chệch Định nghĩa Thống kê G của mẫu được gọi là ước lượng không chệch của tham số θ của biến ngẫu nhiên gốc X nếu E(G) = θ. Nếu E(G) 6= θ, G được gọi là ước lượng chệch của θ. Ví dụ E(X¯ ) = µ → Trung bình mẫu X¯ là ước lượng không chệch của kỳ vọng toán µ. E(f) = p → tần suất mẫu f là ước lượng không chệch của xác suất biến ngẫu nhiên gốc p. E(S2) = σ2; E(S∗2) = σ2 → S2 và S∗2 là ước lượng không chệch của σ2.
  14. Giải X + X + X  1 3E(X ) E(X¯ ) = E 1 3 5 = (EX + EX + EX ) = = µ 1 3 3 1 3 5 3 Tương tự, E(X¯2) = µ. Vậy X¯1 và X¯2 đều là ước lượng không chệch của µ. Ước lượng không chệch Ví dụ 2 Giả sử X ∼ N(µ,σ ). Lấy mẫu W=(X1, , X6). X + X + X X + 2X + 3X X = 1 3 5 ; X = 2 4 6 ; 1 3 2 6 a) X¯1, X¯2 có là ước lượng không chệch của µ. b) Trong 2 ước lượng trên, ước lượng nào có phương sai nhỏ hơn.
  15. Ước lượng không chệch Ví dụ 2 Giả sử X ∼ N(µ,σ ). Lấy mẫu W=(X1, , X6). X + X + X X + 2X + 3X X = 1 3 5 ; X = 2 4 6 ; 1 3 2 6 a) X¯1, X¯2 có là ước lượng không chệch của µ. b) Trong 2 ước lượng trên, ước lượng nào có phương sai nhỏ hơn. Giải X + X + X  1 3E(X ) E(X¯ ) = E 1 3 5 = (EX + EX + EX ) = = µ 1 3 3 1 3 5 3 Tương tự, E(X¯2) = µ. Vậy X¯1 và X¯2 đều là ước lượng không chệch của µ.
  16. Ước lượng không chệch Ví dụ b) 1 σ2 1 14σ2 V (X¯ ) = · 3σ2 = ; V (X¯ ) = (σ2 + 4σ2 + 9σ2) = 1 9 3 2 36 36 ⇒ V (X¯1) < V (X¯2) ⇒ X¯1 có phương sai nhỏ hơn X¯2.
  17. Định nghĩa Thống kê G của mẫu được gọi là ước lượng hiệu quả của tham số θ của bnn gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó. Để kiểm tra tính hiệu quả nhất của ước lượng không chệch, người ta dùng bất đẳng thức Crammer - Rao: ˆ 1 V (θ) ≥ 2 h ∂ ln f (x,θ) i nE ∂θ trong đó f (x, θ) là biểu thức xác suất của X trong trường hợp nó rời rạc và hàm mật độ xác suất của X trong trường hợp nó liên tục. Ước lượng hiệu quả
  18. Để kiểm tra tính hiệu quả nhất của ước lượng không chệch, người ta dùng bất đẳng thức Crammer - Rao: ˆ 1 V (θ) ≥ 2 h ∂ ln f (x,θ) i nE ∂θ trong đó f (x, θ) là biểu thức xác suất của X trong trường hợp nó rời rạc và hàm mật độ xác suất của X trong trường hợp nó liên tục. Ước lượng hiệu quả Định nghĩa Thống kê G của mẫu được gọi là ước lượng hiệu quả của tham số θ của bnn gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó.
  19. Ước lượng hiệu quả Định nghĩa Thống kê G của mẫu được gọi là ước lượng hiệu quả của tham số θ của bnn gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó. Để kiểm tra tính hiệu quả nhất của ước lượng không chệch, người ta dùng bất đẳng thức Crammer - Rao: ˆ 1 V (θ) ≥ 2 h ∂ ln f (x,θ) i nE ∂θ trong đó f (x, θ) là biểu thức xác suất của X trong trường hợp nó rời rạc và hàm mật độ xác suất của X trong trường hợp nó liên tục.
  20. ES2 = σ2; V (S2) 6= min→ S2 là ước lượng không chệnh của σ2 nhưng không là ước lượng hiệu quả. X ∼ A(p). f là ước lượng hiệu quả của p vì E(f ) = p và p(p−1) V (f ) = n = min Ước lượng hiệu quả Ví dụ Giả sử X ∼ N(µ, σ2) E(X¯ ) = µ, suy ra X¯ là ước lượng không chênh lệch của µ, ¯ σ2 hơn nữa V (X ) = n = min (= vế phải bất đẳng thức Crammer - Rao) do đó X¯ là ước lượng hiệu quả của µ.
  21. X ∼ A(p). f là ước lượng hiệu quả của p vì E(f ) = p và p(p−1) V (f ) = n = min Ước lượng hiệu quả Ví dụ Giả sử X ∼ N(µ, σ2) E(X¯ ) = µ, suy ra X¯ là ước lượng không chênh lệch của µ, ¯ σ2 hơn nữa V (X ) = n = min (= vế phải bất đẳng thức Crammer - Rao) do đó X¯ là ước lượng hiệu quả của µ. ES2 = σ2; V (S2) 6= min→ S2 là ước lượng không chệnh của σ2 nhưng không là ước lượng hiệu quả.
  22. Ước lượng hiệu quả Ví dụ Giả sử X ∼ N(µ, σ2) E(X¯ ) = µ, suy ra X¯ là ước lượng không chênh lệch của µ, ¯ σ2 hơn nữa V (X ) = n = min (= vế phải bất đẳng thức Crammer - Rao) do đó X¯ là ước lượng hiệu quả của µ. ES2 = σ2; V (S2) 6= min→ S2 là ước lượng không chệnh của σ2 nhưng không là ước lượng hiệu quả. X ∼ A(p). f là ước lượng hiệu quả của p vì E(f ) = p và p(p−1) V (f ) = n = min
  23. Định nghĩa Thống kê G của mẫu được gọi là ước lượng vững của tham số θ của biến ngẫu nhiên gốc X nếu G hội tụ theo xác suất đến θ khi n −→ ∞. lim P(|G − θ| 0 n→∞ bé tùy ý. Nếu G đã là một ước lượng không chệch của θ thì điều kiện để nó là ước lượng vững là: lim V (G) = 0 n→∞ Ước lượng vững
  24. Ước lượng vững Định nghĩa Thống kê G của mẫu được gọi là ước lượng vững của tham số θ của biến ngẫu nhiên gốc X nếu G hội tụ theo xác suất đến θ khi n −→ ∞. lim P(|G − θ| 0 n→∞ bé tùy ý. Nếu G đã là một ước lượng không chệch của θ thì điều kiện để nó là ước lượng vững là: lim V (G) = 0 n→∞
  25. Ước lượng vững Ví dụ Theo luật số lớn của Trêbưsep và luật số lớn của Bernoulli ta suy ra trung bình mẫu X¯ và tần suất mẫu f lần lượt là ước lượng vững của µ và p của biến ngẫu nhiên gốc X.
  26. Trung bình mẫu X¯ là ước lượng không chệch, hiệu quả, vững của trung bình tổng thể µ. Tần suất mẫu f là ước lượng không chệch, hiệu quả, vững của tần suất tổng thể p. Phương sai mẫu S2 và S∗2 là ước lượng không chệch của phương sai tổng thể σ2. Các kết luận của phương pháp hàm ước lượng
  27. Các kết luận của phương pháp hàm ước lượng Trung bình mẫu X¯ là ước lượng không chệch, hiệu quả, vững của trung bình tổng thể µ. Tần suất mẫu f là ước lượng không chệch, hiệu quả, vững của tần suất tổng thể p. Phương sai mẫu S2 và S∗2 là ước lượng không chệch của phương sai tổng thể σ2.
  28. Giả sử cần ước lượng tham số θ của biến ngẫu nhiên gốc X có hàm mật độ xác suất f(x, θ). Định nghĩa Hàm n Y L(x1, , xn, θ) = f (xi , θ) i=1 được gọi là hàm hợp lý của θ, trong đó (x1, , xn) là một mẫu cụ thể. Giá trị θˆ của đối số θ mà tại đó hàm hợp lý đạt cực đại gọi là ước lượng hợp lý tối đa của θ. Phương pháp ước lượng hợp lý tối đa
  29. Phương pháp ước lượng hợp lý tối đa Giả sử cần ước lượng tham số θ của biến ngẫu nhiên gốc X có hàm mật độ xác suất f(x, θ). Định nghĩa Hàm n Y L(x1, , xn, θ) = f (xi , θ) i=1 được gọi là hàm hợp lý của θ, trong đó (x1, , xn) là một mẫu cụ thể. Giá trị θˆ của đối số θ mà tại đó hàm hợp lý đạt cực đại gọi là ước lượng hợp lý tối đa của θ.
  30. Phương pháp ước lượng hợp lý tối đa Do hàm L và lnL đạt cực đại tại cùng một giá trị của θ nên có thể tìm θ để lnL đạt cực đại theo các bước: ∂ ln L Tính ∂θ = 0 ∂ ln L ˆ Giải phương trình ∂θ = 0 → nghiệm θ = f (x1, , x2) ∂2 ln L  ˆ ˆ Nếu ∂θ2 x1, , xn, θ < 0 thì θ ước lượng hợp lý tối đa của θ.
  31. Giải Lập mẫu ngẫu nhiên W = (X1,. . . , Xn) −θx −θx −θx n −θ(Pn x ) Hàm hợp lý: L = θe 1 θe 2 θe n = θ e i=1 i n X lnL = nlnθ − θ xi i=n n ∂ ln L n X ∂ ln L n 1 = − xi ; = 0 ⇔ θ = Pn = ∂θ θ ∂θ xi x¯ i=1 i=1 Phương pháp ước lượng hợp lý tối đa Ví dụ Tìm ước lượng hợp lý tối đa của tham số θ của biến ngẫu nhiên X có hàm mật độ xác suất: f (x) = θe−θx , ∀x
  32. Phương pháp ước lượng hợp lý tối đa Ví dụ Tìm ước lượng hợp lý tối đa của tham số θ của biến ngẫu nhiên X có hàm mật độ xác suất: f (x) = θe−θx , ∀x Giải Lập mẫu ngẫu nhiên W = (X1,. . . , Xn) −θx −θx −θx n −θ(Pn x ) Hàm hợp lý: L = θe 1 θe 2 θe n = θ e i=1 i n X lnL = nlnθ − θ xi i=n n ∂ ln L n X ∂ ln L n 1 = − xi ; = 0 ⇔ θ = Pn = ∂θ θ ∂θ xi x¯ i=1 i=1
  33. Ví dụ X ∼ N(µ, σ2)). Ước lượng hợp lý tối đa của µ là X¯ (giáo trình). Phương pháp ước lượng hợp lý tối đa Ví dụ ∂2 ln L n = − < 0, ∀θ ∂θ2 θ2 1 ⇒ lnL = max tại θ = x¯ 1 Vậy ước lượng hợp lý tối đa của θ là x¯ .
  34. Phương pháp ước lượng hợp lý tối đa Ví dụ ∂2 ln L n = − < 0, ∀θ ∂θ2 θ2 1 ⇒ lnL = max tại θ = x¯ 1 Vậy ước lượng hợp lý tối đa của θ là x¯ . Ví dụ X ∼ N(µ, σ2)). Ước lượng hợp lý tối đa của µ là X¯ (giáo trình).
  35. Khái niệm Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Ước lượng phương sai của biến ngẫu nhiên phân phối chuẩn Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY
  36. PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY Khái niệm Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Ước lượng phương sai của biến ngẫu nhiên phân phối chuẩn Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một
  37. Để ước lượng tham số θ của biến ngẫu nhiên gốc X, người ta xây dựng một khoảng giá trị của mẫu (θ1, θ2) sao cho với một xác suất cho trước, tham số θ sẽ rơi vào khoảng (θ1, θ2) đó. Để xây dựng khoảng giá trị nói trên, xuất phát từ một ước lượng điểm tốt nhất θˆ của mẫu, chọn một thống kê G = G(θˆ;θ) là một hàm của θˆ và θ song lại có quy luật phân phối xác suất không phụ thuộc θˆ. Khái niệm
  38. Khái niệm Để ước lượng tham số θ của biến ngẫu nhiên gốc X, người ta xây dựng một khoảng giá trị của mẫu (θ1, θ2) sao cho với một xác suất cho trước, tham số θ sẽ rơi vào khoảng (θ1, θ2) đó. Để xây dựng khoảng giá trị nói trên, xuất phát từ một ước lượng điểm tốt nhất θˆ của mẫu, chọn một thống kê G = G(θˆ;θ) là một hàm của θˆ và θ song lại có quy luật phân phối xác suất không phụ thuộc θˆ.
  39. Khái niệm Từ đó, với xác suất 1 - α khá lớn, tìm được hai giá trị tương ứng của G là G1 và G2 để P(G1 < G < G2) = 1 - α, do đó P(θ1 < θ < θ2) = 1 - α. Khoảng (θ1, θ2) được gọi là khoảng tin cậy của ước lượng. Xác suất 1 - α được gọi là độ tin cậy của ước lượng. Xác suất α được gọi là xác suất mắc sai lầm của ước lượng.
  40. Khái niệm Chú ý. Khoảng tin cậy (θ1, θ2) là khoảng ngẫu nhiên. Với mẫu cụ thể ta có khoảng tin cậy cụ thể. Do xác suất 1 - α khá lớn nên theo nguyên lý xác suất lớn, biến cố (θ1 < θ < θ2) hầu như chắc chắn xảy ra trong một phép thử, tức là ta coi nó luôn đúng với một mẫu cụ thể: θ1 < θ < θ2
  41. Giả sử X ∼ N(µ, σ2), µ chưa biết. Để ước lượng µ, từ tổng thể lập mẫu kích thước n: W = (X1, , Xn) → X¯ Để chọn thống kê G thích hợp, ta xét các trường hợp sau: Đã biết phương sai σ2 Chưa biết phương sai tổng thể σ2 Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn
  42. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Giả sử X ∼ N(µ, σ2), µ chưa biết. Để ước lượng µ, từ tổng thể lập mẫu kích thước n: W = (X1, , Xn) → X¯ Để chọn thống kê G thích hợp, ta xét các trường hợp sau: Đã biết phương sai σ2 Chưa biết phương sai tổng thể σ2
  43. Chọn thống kê: √ X¯ − µ n G = U = ∼ N (0, 1) σ Với độ tin cậy 1 - α cho trước, tìm được α1, α2 sao cho α1 + α2 = α và từ đó tìm được 2 giá trị tới hạn chuẩn tương ứng và thỏa mãn: P(U uα2 ) = α2 ⇒ P(u1−α1 < U < uα2 ) = 1 − α. √ ! X¯ − µ n ⇒ P −u < < u = 1 − α α1 σ α2  σ σ  ⇒ P X¯ − √ u < µ < X¯ + √ u = 1 − α n α2 n α1 Đã biết phương sai σ2
  44. Đã biết phương sai σ2 Chọn thống kê: √ X¯ − µ n G = U = ∼ N (0, 1) σ Với độ tin cậy 1 - α cho trước, tìm được α1, α2 sao cho α1 + α2 = α và từ đó tìm được 2 giá trị tới hạn chuẩn tương ứng và thỏa mãn: P(U uα2 ) = α2 ⇒ P(u1−α1 < U < uα2 ) = 1 − α. √ ! X¯ − µ n ⇒ P −u < < u = 1 − α α1 σ α2  σ σ  ⇒ P X¯ − √ u < µ < X¯ + √ u = 1 − α n α2 n α1
  45. Đã biết phương sai σ2 Nếu lấy α1 = α2 = α/2: ta được khoảng tin cậy đối xứng của µ  σ σ  P X¯ − √ u X¯ − √ u = 1 − α n α Nếu α1 = α; α2 = 0: Khoảng tin cậy bên trái (dùng để ước lượng giá trị tối đa của µ)  σ  P µ < X¯ + √ u = 1 − α n α
  46. Đã biết phương sai σ2 √σ ε = n uα/2 được gọi là độ chính xác của ước lượng. Độ dài ngắn nhất của khoảng tin cậy I đạt được khi khoảng tin cậy là đối xứng: 2σ I = 2ε = √ · u n α/2 Kích thước mẫu tối thiểu n cần điều tra sao cho với độ tin cậy 1 - α cho trước, độ dài khoảng tin cậy không vượt qúa I0 cho trước được tìm bởi công thức: 2 2 4σ 2 σ 2 n ≥ 2 · uα/2 = 2 · uα/2 I0 ε0
  47. Giải Gọi X là tuổi thọ bóng đèn. X ∼ N(µ; σ2). Đây là bài toán ước lượng bằng khoảng tin cậy đối xứng tham số µ của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai tổng thể. Ta có: n = 100 ;x ¯ = 3000; 1 - α = 0,95 ⇒ α = 0,05 ⇒ uα/2 = u0,025= 1,96 Đã biết phương sai σ2 Ví dụ Tuổi thọ của 1 loại bóng đèn là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36h. Từ 1 lô bóng mới sản xuất, kiểm tra ngẫu nhiên 100 bóng tìm được tuổi thọ trung bình của chúng là 3000h. Với độ tin cậy 0,95 hãy ước lượng tuổi thọ trung bình của loại bóng đèn nói trên.
  48. Đã biết phương sai σ2 Ví dụ Tuổi thọ của 1 loại bóng đèn là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36h. Từ 1 lô bóng mới sản xuất, kiểm tra ngẫu nhiên 100 bóng tìm được tuổi thọ trung bình của chúng là 3000h. Với độ tin cậy 0,95 hãy ước lượng tuổi thọ trung bình của loại bóng đèn nói trên. Giải Gọi X là tuổi thọ bóng đèn. X ∼ N(µ; σ2). Đây là bài toán ước lượng bằng khoảng tin cậy đối xứng tham số µ của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai tổng thể. Ta có: n = 100 ;x ¯ = 3000; 1 - α = 0,95 ⇒ α = 0,05 ⇒ uα/2 = u0,025= 1,96
  49. Đã biết phương sai σ2 Ví dụ Khi đó khoảng tin cậy của µ có dạng: σ σ x¯ − √ u < µ < x¯ + √ u n α/2 n α/2 36 36 3000 − √ · 1, 96 < µ < 3000 + √ · 1, 96 100 100 2992, 944 < µ < 3007, 056 Vậy, với độ tin cậy 0,95, từ mẫu cụ thể đã cho, tuổi thọ trung bình của loại bóng đèn nói trên nằm trong khoảng từ 2992,944h đến 3007,056h.
  50. Chọn thống kê: √ X¯ − µ n G = T = ∼ T (n − 1) S Tương tự như trên, khoảng tin cậy mức 1 - α của µ có dạng:  S S  P X¯ − √ t(n−1) < µ < X¯ + √ t(n−1) = 1 − α n α2 n α1 Chưa biết phương sai tổng thể σ2
  51. Chưa biết phương sai tổng thể σ2 Chọn thống kê: √ X¯ − µ n G = T = ∼ T (n − 1) S Tương tự như trên, khoảng tin cậy mức 1 - α của µ có dạng:  S S  P X¯ − √ t(n−1) < µ < X¯ + √ t(n−1) = 1 − α n α2 n α1
  52. Chưa biết phương sai tổng thể σ2 α1 = α2 = α/2: Khoảng tin cậy đối xứng.  S S  P X¯ − √ t(n−1) X¯ − √ t(n−1) = 1 − α n α α1 = α; α2 = 0: Khoảng tin cậy bên trái  S  P µ < X¯ + √ t(n−1) = 1 − α n α
  53. Chưa biết phương sai tổng thể σ2 (n−1) √2S Độ dài ngắn nhất của khoảng tin cậy: I = 2ε = n tα/2 Để tìm kích thước mẫu n cần điều tra sao cho với độ tin cậy 1 - α cho trước, độ dài khoảng tin cậy không vượt quá I0 cho trước, người ta dùng phương pháp mẫu kép sau: Điều tra 1 mẫu sơ bộ kích thước m ≥ 2: W1 = (X1, ,Xm), từ đó tìm được: m m 1 X 1 X S 2 = (X − X¯ )2; X¯ = X m − 1 i m i i=1 i=1 Khi đó kích thước mẫu chính thức n cần điều tra được tìm 4S2 m−1 2 S2 m−1 2 bằng công thức: n ≥ 2 · (t ) = 2 · (t ) I0 α/2 ε0 α/2 Như vậy chỉ cần điều tra thêm 1 mẫu bổ sung kích thước n - m là đủ: W2 = (Xm+1, ,Xn)
  54. Chưa biết phương sai tổng thể σ2 Ví dụ Năng suất một loại cây trồng là biến ngẫu nhiên có phân phối chuẩn. Thu hoạch tại một số điểm được kết quả sau: NS (tấn/ha) 30 31 32 33 34 35 Số điểm 2 3 6 7 4 3 Với độ tin cậy 0,95, hãy ước lượng năng suất trung bình bằng khoảng tin cậy đối xứng.
  55. Chưa biết phương sai tổng thể σ2 Ví dụ Gọi X là năng suất loại cây trồng X ∼ N(µ, σ2). Từ mẫu đã cho, ta tính được: n = 25; x¯ = 32, 68; s = 1, 435 (n−1) (24) Với độ tin cậy 0,95 = 1 - α ⇒ α = 0,05; tα/2 = t0,025 = 2, 064 Vậy khoảng tin cậy của năng suất trung bình có dạng: s s x¯ − √ · tn−1 < µ < x¯ + √ · tn−1 n α/2 n α/2 1, 435 1, 435 32, 68 − √ · 2, 064 < µ < 32, 68 + √ · 2, 064 25 25 32,09 < µ < 33,27. Với độ tin cậy 0,95, từ mẫu cụ thể đã cho, năng suất trung bình của loại cây trồng nói trên nằm trong khoảng (32,09; 33,27).
  56. Giả sử trong tổng thể X ∼ N(µ, σ2), σ2 chưa biết. 2 ∗2 Từ tổng thể lập mẫu W = (X1,X2,. . . , Xn) → S ,S Để chọn thống kê G thích hợp, xét các trường hợp: Đã biết kỳ vọng toán µ Chưa biết kỳ vọng toán µ Ước lượng phương sai của biến ngẫu nhiên phân phối chuẩn
  57. Ước lượng phương sai của biến ngẫu nhiên phân phối chuẩn Giả sử trong tổng thể X ∼ N(µ, σ2), σ2 chưa biết. 2 ∗2 Từ tổng thể lập mẫu W = (X1,X2,. . . , Xn) → S ,S Để chọn thống kê G thích hợp, xét các trường hợp: Đã biết kỳ vọng toán µ Chưa biết kỳ vọng toán µ
  58. Chọn thống kê: nS∗2 G = χ2 = ∼ χ2 (n) σ2 Với độ tin cậy 1 - α cho trước, ta tìm được α1 và α2 sao cho α1 + α2 = α. Từ đó tìm được hai giá trị tới hạn khi bình phương χ2(n) , χ2(n) để: 1−α1 α2 P(χ2(n) < χ2 < χ2(n)) = 1 − α 1−α1 α2 2 2 ! nS∗ nS∗ ⇒ P < σ2 < = 1 − α χ2(n) χ2(n) α2 1−α1 Đã biết kỳ vọng toán µ
  59. Đã biết kỳ vọng toán µ Chọn thống kê: nS∗2 G = χ2 = ∼ χ2 (n) σ2 Với độ tin cậy 1 - α cho trước, ta tìm được α1 và α2 sao cho α1 + α2 = α. Từ đó tìm được hai giá trị tới hạn khi bình phương χ2(n) , χ2(n) để: 1−α1 α2 P(χ2(n) < χ2 < χ2(n)) = 1 − α 1−α1 α2 2 2 ! nS∗ nS∗ ⇒ P < σ2 < = 1 − α χ2(n) χ2(n) α2 1−α1
  60. Đã biết kỳ vọng toán µ α1 = α2 = α/2: Khoảng tin cậy đối xứng.   nS∗2 nS∗2 P = 1 − α 2(n) χα α1 = α; α2= 0: Khoảng tin cậy bên trái. 2 ! nS∗ P σ2 < = 1 − α 2(n) χ1−α
  61. Chọn thống kê G: (n − 1) S2 G = χ2 = ∼ χ2 (n − 1) σ2 Tương tự như trên, khoảng tin cậy mức 1-α của σ2 có dạng: ! (n − 1) S2 (n − 1) S2 P < σ2 < = 1 − α χ2(n−1) χ2(n−1) α2 1−α1 Chưa biết kỳ vọng toán µ
  62. Chưa biết kỳ vọng toán µ Chọn thống kê G: (n − 1) S2 G = χ2 = ∼ χ2 (n − 1) σ2 Tương tự như trên, khoảng tin cậy mức 1-α của σ2 có dạng: ! (n − 1) S2 (n − 1) S2 P < σ2 < = 1 − α χ2(n−1) χ2(n−1) α2 1−α1
  63. Chưa biết kỳ vọng toán µ α1 = α2 = α/2: Khoảng tin cậy đối xứng.   (n − 1) S2 (n − 1) S2 P = 1 − α 2(n−1) χα α1 = α; α2= 0: Khoảng tin cậy bên trái. ! (n − 1)S2 P σ2 < = 1 − α 2(n−1) χ1−α
  64. Chưa biết kỳ vọng toán µ Ví dụ Sai số của đồng hồ là biến ngẫu nhiên phân phối theo quy luật chuẩn. Sau một tháng (31 ngày) theo dõi, người ta tính được s = 5 giây/ngày. Hãy ước lượng độ chính xác của đồng hồ bằng khoảng tin cậy 95%. Giải Gọi X là sai số của đồng hồ. X ∼ N(µ, σ2). Trong đó µ là sai số trung bình, σ2 là độ biến động của sai số (độ chính xác của đồng hồ). Theo yêu cầu của bài toán ta phải tìm khoảng tin cậy hai phía với độ tin cậy 1-α = 0,95 cho tham số σ2 cho trường hợp µ chưa biết.
  65. Chưa biết kỳ vọng toán µ Ví dụ Khoảng tin cậy đó là: (n − 1) s2 (n − 1) s2 < σ2 < 2(n−1) 2(n−1) χα/2 χ1−α/2 2 2 2(n−1) 2(30) Tính toán: s = 5 Tra bảng: χα/2 = χ0,025 = 46, 96; 2(n−1) 2(30) χ1−α/2 = χ0,975 = 16, 79 Thay vào khoảng tin cậy nói trên ta được 30.52 30.52 < σ2 < ⇒ 15, 964 < σ2 < 44, 67 46, 96 16, 79
  66. Giả sử X ∼ A(p), p chưa biết. Lập mẫu kích thước n: W = (X1,. . . , Xn) → f. Ta chỉ xét trường hợp mẫu lớn: n ≥ 100. Chọn thống kê: √ (f − p) n G = U = ∼ N (0; 1) pf (1 − f ) Khoảng tin cậy mức 1 - α của p có dạng: " # pf (1 − f ) pf (1 − f ) P f − √ u < p < f + √ u = 1 − α n α2 n α1 Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một
  67. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Giả sử X ∼ A(p), p chưa biết. Lập mẫu kích thước n: W = (X1,. . . , Xn) → f. Ta chỉ xét trường hợp mẫu lớn: n ≥ 100. Chọn thống kê: √ (f − p) n G = U = ∼ N (0; 1) pf (1 − f ) Khoảng tin cậy mức 1 - α của p có dạng: " # pf (1 − f ) pf (1 − f ) P f − √ u < p < f + √ u = 1 − α n α2 n α1
  68. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một α1 = α2 = α/2: Khoảng tin cậy đối xứng. " # pf (1 − f ) pf (1 − f ) P f − √ u f − √ u = 1 − α n α α1 = α; α2 = 0: Khoảng tin cậy bên trái. " # pf (1 − f ) P p < f + √ u = 1 − α n α
  69. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Độ dài ngắn nhất của khoảng tin cậy đạt được khi nó đối xứng: pf (1 − f ) I = 2ε = 2 √ u n α/2 Kích thước mẫu tối thiểu n cần điều tra sao cho với độ tin cậy 1 - α cho trước, độ dài khoảng tin cậy không vượt quá I0 cho trước được tìm bởi công thức: 4f (1 − f ) 2 f (1 − f ) 2 n ≥ 2 uα/2 = 2 uα/2 I0 ε0 Trong đó f là tần suất mẫu sơ bộ kích thước m ≥2.
  70. Giải Gọi p là tỷ lệ cử tri bỏ phiếu cho ứng cử viên A. Đây là bài toán ước lượng bằng khoảng tin cậy bên phải tham số p của biến ngẫu nhiên phân phối A(p) khi kích thước mẫu n > 100. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ Trong đợt vận động bầu cử tổng thống, người ta phỏng vấn ngẫu nhiên 1600 cử tri thì được biết 960 người trong số đó sẽ bỏ phiếu cho ứng cử viên A. Với độ tin cậy 99%, ứng cử viên A sẽ chiếm được tối thiểu bao nhiêu phần trăm số phiếu bầu?
  71. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ Trong đợt vận động bầu cử tổng thống, người ta phỏng vấn ngẫu nhiên 1600 cử tri thì được biết 960 người trong số đó sẽ bỏ phiếu cho ứng cử viên A. Với độ tin cậy 99%, ứng cử viên A sẽ chiếm được tối thiểu bao nhiêu phần trăm số phiếu bầu? Giải Gọi p là tỷ lệ cử tri bỏ phiếu cho ứng cử viên A. Đây là bài toán ước lượng bằng khoảng tin cậy bên phải tham số p của biến ngẫu nhiên phân phối A(p) khi kích thước mẫu n > 100.
  72. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ 960 Từ mẫu cụ thể ta có: n = 1600 ; f = 1600 = 0, 6 1 - α = 0,99 ⇒ uα = u0,01 = 2,33. √ pf (1 − f ) 0, 6.0, 4 p > f − √ u = 0, 6 − · 2, 33 = 0, 5715 n α 40 Kết luận: Với độ tin cậy 0,99, từ mẫu cụ thể đã cho, ứng cử viên A sẽ được tối thiểu 57,15% số phiếu bầu.
  73. Giải Gọi N là số cá hiện có trong hồ và p là tỷ lệ cá được đánh dấu 2000 ⇒ p = N Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ Để đánh giá trữ lượng cá có trong hồ, người ta bắt 2000 con cá, đánh dấu rồi thả xuống hồ. Sau đó bắt lại 400 con thì thấy 80 con có dấu. a) Với độ tin cậy 0,95 hãy ước lượng trữ lượng cá hiện có trong hồ. b) Nếu muốn sai số của ước lượng giảm đi một nửa thì lần sau phải đánh bắt bao nhiêu con cá.
  74. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ Để đánh giá trữ lượng cá có trong hồ, người ta bắt 2000 con cá, đánh dấu rồi thả xuống hồ. Sau đó bắt lại 400 con thì thấy 80 con có dấu. a) Với độ tin cậy 0,95 hãy ước lượng trữ lượng cá hiện có trong hồ. b) Nếu muốn sai số của ước lượng giảm đi một nửa thì lần sau phải đánh bắt bao nhiêu con cá. Giải Gọi N là số cá hiện có trong hồ và p là tỷ lệ cá được đánh dấu 2000 ⇒ p = N
  75. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ a) Bài toán đưa đến việc ước lượng bằng khoảng tin cậy đối xứng tham số p của biến ngẫu nhiên phân phối A(p) khi kích thước mẫu 80 n > 100. Từ mẫu cụ thể n = 400; f = 400 = 0, 2. 1 - α = 0,95 ⇒ uα/2 = u0,025 = 1,96. f (1 − f ) pf (1 − f ) ⇒ f − √ u < p < f + √ u n α/2 n α/2 ⇒ 0,1608 < p < 0,2392 ⇒ 8361,2 < N < 12437,8 ⇒ 8362 ≤ N ≤ 12437. Vậy với độ tin cậy 0,95, từ mẫu cụ thể đã cho, số cá hiện có trong hồ thuộc khoảng (8362; 12437).
  76. Ước lượng kỳ vọng toán của biến ngẫu nhiên phân phối không - một Ví dụ b) Từ mẫu sơ bộ: m - 400; f = 0,2; ε = 0,0392. ε Sai số ước lượng giảm đi một nửa tức: ε0 = 2 = 0, 0196 Số cá tối thiểu cần đánh bắt để kiểm tra: f (1 − f ) 2 0, 2.0, 8 2 n = 2 uα/2 = 2 · 1, 96 = 1600 (con) ε0 0, 0196
  77. Bài toán “Bắt cá” : Cần ước lượng M - số cá chép (hoặc N - tổng số cá) Phép thử : Bắt ngẫu nhiên một con cá trong hồ. A là biến cố: M “Bắt cá chép”. P(A) = N = p chưa biết. Tìm khoảng tin cậy cho p : p1< p < p2 Suy ra khoảng tin cậy cho M (hoặc N) : M M Np1 < M < Np2 ( < N < ) p2 p1 Ứng dụng: M Bắt M con cá rồi đánh dấu sau đó thả lại hồ: p = N M∗ Thả thêm vào hồ M* con cá đã đánh dấu: p = N+M∗ Bài toán ước lượng cơ cấu tổng thể
  78. Cần ước lượng M - số cá chép (hoặc N - tổng số cá) Phép thử : Bắt ngẫu nhiên một con cá trong hồ. A là biến cố: M “Bắt cá chép”. P(A) = N = p chưa biết. Tìm khoảng tin cậy cho p : p1< p < p2 Suy ra khoảng tin cậy cho M (hoặc N) : M M Np1 < M < Np2 ( < N < ) p2 p1 Ứng dụng: M Bắt M con cá rồi đánh dấu sau đó thả lại hồ: p = N M∗ Thả thêm vào hồ M* con cá đã đánh dấu: p = N+M∗ Bài toán ước lượng cơ cấu tổng thể Bài toán “Bắt cá” :
  79. Ứng dụng: M Bắt M con cá rồi đánh dấu sau đó thả lại hồ: p = N M∗ Thả thêm vào hồ M* con cá đã đánh dấu: p = N+M∗ Bài toán ước lượng cơ cấu tổng thể Bài toán “Bắt cá” : Cần ước lượng M - số cá chép (hoặc N - tổng số cá) Phép thử : Bắt ngẫu nhiên một con cá trong hồ. A là biến cố: M “Bắt cá chép”. P(A) = N = p chưa biết. Tìm khoảng tin cậy cho p : p1< p < p2 Suy ra khoảng tin cậy cho M (hoặc N) : M M Np1 < M < Np2 ( < N < ) p2 p1
  80. M Bắt M con cá rồi đánh dấu sau đó thả lại hồ: p = N M∗ Thả thêm vào hồ M* con cá đã đánh dấu: p = N+M∗ Bài toán ước lượng cơ cấu tổng thể Bài toán “Bắt cá” : Cần ước lượng M - số cá chép (hoặc N - tổng số cá) Phép thử : Bắt ngẫu nhiên một con cá trong hồ. A là biến cố: M “Bắt cá chép”. P(A) = N = p chưa biết. Tìm khoảng tin cậy cho p : p1< p < p2 Suy ra khoảng tin cậy cho M (hoặc N) : M M Np1 < M < Np2 ( < N < ) p2 p1 Ứng dụng:
  81. M∗ Thả thêm vào hồ M* con cá đã đánh dấu: p = N+M∗ Bài toán ước lượng cơ cấu tổng thể Bài toán “Bắt cá” : Cần ước lượng M - số cá chép (hoặc N - tổng số cá) Phép thử : Bắt ngẫu nhiên một con cá trong hồ. A là biến cố: M “Bắt cá chép”. P(A) = N = p chưa biết. Tìm khoảng tin cậy cho p : p1< p < p2 Suy ra khoảng tin cậy cho M (hoặc N) : M M Np1 < M < Np2 ( < N < ) p2 p1 Ứng dụng: M Bắt M con cá rồi đánh dấu sau đó thả lại hồ: p = N
  82. Bài toán ước lượng cơ cấu tổng thể Bài toán “Bắt cá” : Cần ước lượng M - số cá chép (hoặc N - tổng số cá) Phép thử : Bắt ngẫu nhiên một con cá trong hồ. A là biến cố: M “Bắt cá chép”. P(A) = N = p chưa biết. Tìm khoảng tin cậy cho p : p1< p < p2 Suy ra khoảng tin cậy cho M (hoặc N) : M M Np1 < M < Np2 ( < N < ) p2 p1 Ứng dụng: M Bắt M con cá rồi đánh dấu sau đó thả lại hồ: p = N M∗ Thả thêm vào hồ M* con cá đã đánh dấu: p = N+M∗
  83. Giải p = 6000/N Bài toán ước lượng cơ cấu tổng thể Ví dụ Một trạm tiêm phòng của huyện A đã tiêm phòng viêm gan B cho 6000 người của huyện. Kiểm tra ngẫu nhiên 2000 dân của huyện có 600 người đã tiêm phòng trong đó có 400 người tiêm phòng ở trạm của huyện. Ước lượng tối đa số người của huyện đã được tiêm phòng với độ tin cậy 0,95.
  84. Bài toán ước lượng cơ cấu tổng thể Ví dụ Một trạm tiêm phòng của huyện A đã tiêm phòng viêm gan B cho 6000 người của huyện. Kiểm tra ngẫu nhiên 2000 dân của huyện có 600 người đã tiêm phòng trong đó có 400 người tiêm phòng ở trạm của huyện. Ước lượng tối đa số người của huyện đã được tiêm phòng với độ tin cậy 0,95. Giải p = 6000/N