Bài giảng Thủy văn công trình - Chương 3: Phương pháp thống kê xác suất trong thuỷ văn

ppt 56 trang hapham 1880
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thủy văn công trình - Chương 3: Phương pháp thống kê xác suất trong thuỷ văn", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_thuy_van_cong_trinh_chuong_3_phuong_phap_thong_ke.ppt

Nội dung text: Bài giảng Thủy văn công trình - Chương 3: Phương pháp thống kê xác suất trong thuỷ văn

  1. Chương 3 Phương pháp thống kê xác suất trong thuỷ văn
  2. I. Một số kiến thức cơ bản về lý thuyết xác suất ◼ Phép thử: ◼ Được hiểu là các thử nghiệm hoặc các quan sát được thực hiện đối với một hiện tượng ngẫu nhiên nào đó. Các thử nghiệm và các quan sát đó phải được thực hiện trong cùng một điều kiện nhất định. ◼ Kết quả của phép thử ngẫu nhiên gọi là biến cố ngẫu nhiên, hoặc nói ngắn gọn là biến cố.
  3. Phân loại biến cố ◼ Biến cố chắc chắn: là biến cố nhất định phải xuất hiện trong một phép thử. ◼ Biến cố không thể có: là biến cố không thể xuất hiện trong một phép thử. ◼ Biến cố độc lập: là biến cố mà sự xuất hiện của nó không phụ thuộc vào sự xuất hiện của các biến cố khác ◼ Biến cố phụ thuộc: là biến cố mà sự xuất hiện của nó phụ thuộc vào sự xuất hiện của biến cố khác ◼ Biến cố xung khắc: Hai biến cố A và B được gọi là hai biến cố xung khắc nếu chúng không cùng xuất hiện trong một phép thử. ◼ Biến cố đối lập: A được gọi là đối lập với biến cố A nếu biến cố A và biến cố A không xảy ra trong phép thử nhưng một trong hai biến cố chắc chắn phải xuất hiện.
  4. Phân loại biến cố (tiếp) ◼ Biến cố tổng: biến cố C được gọi là biến cố tổng của hai biến cố A và B nếu hoặc A xuất hiện, hoặc B xuất hiện, hoặc cả A và B cùng xuất hiện. ◼ Biến cố tích: Biến cố C được gọi là biến cố tích của hai biến cố A và B nếu biến cố C xuất hiện là do biến cố A và B cùng xuất hiện tạo nên. A A B B C=A+B C=A.B
  5. Định nghĩa xác suất ◼ Định nghĩa cổ điển: ◼ Xác suất xuất hiện của một biến cố A nào đó bằng tỷ số giữa số biến cố cơ bản thuận lợi cho A xuất hiện trên tổng các biến cố cơ bản của không gian biến cố. ◼ Công thức tính xác suất của biến cố A là: m P(A) = n ◼ Trong đó: n là tổng số các biến cố cơ bản của không gian biến cố đang xét; m là số biến cố cơ bản thuận lợi cho biến cố A xuất hiện.
  6. Định nghĩa xác suất (tiếp) ◼ Định nghĩa xác suất theo thống kê: ◼ Xác suất xuất hiện của một biến cố A nào đó trong một phép thử là tần số xuất hiện của biến cố đó khi số lần thực hiện phép thử tăng lên vô hạn. ◼ Công thức tính xác suất: m P(A) = lim n→ n ◼ Trong đó: n là số lần thực hiện phép thử; m là số lần xuất hiện biến cố A
  7. Một số định lý ◼ Định lý cộng xác suất: ◼ Xác suất của tổng hai biến cố bằng tổng xác suất xuất hiện của từng biến cố trừ đi xác suất xuất hiện của vùng trùng lặp. ◼ P(C)= P(A)+P(B)-P(AB) ◼ Định lý nhân xác suất: ◼ Xác suất của biến cố tích của hai biến cố AB bằng xác suất của một biến cố nhân với xác suất có điều kiện của biến cố còn lại với điều kiện biến cố đầu đã xảy ra. ◼ P(AB)=P(A).P(B/A)=P(B).P(A/B)
  8. Đại lượng ngẫu nhiên ◼ Đại lượng ngẫu nhiên là một đại lượng mà trong một phép thử nó nhận một giá trị có thể với xác suất tương ứng của nó. ◼ Phân loại: ◼ Đại lượng ngẫu nhiên rời rạc: ◼ Nếu nó nhận một số giá trị hữu hạn trong khoảng xác định của nó. ◼ Đại lượng ngẫu nhiên liên tục: ◼ Nếu nó nhận bất kỳ giá trị trong khoảng xác định của nó
  9. Luật phân phối xác suất ◼ Là quy luật liên hệ những giá trị có thể của đại lượng ngẫu nhiên với những xác suất tương ứng của chúng. ◼ VD: Bảng phân phối xác suất của ĐLNN là số đọc trên mặt con xúc sắc (phép thử gieo con xúc sắc). xi 1 2 3 4 5 6 Pi 1/6 1/6 1/6 1/6 1/6 1/6
  10. Hàm phân phối xác suất ◼ Hàm phân phối xác suất F(x) là xác suất để cho đại lượng ngẫu nhiên X nhận các giá trị lớn hơn hoặc bằng một giá trị x, trong đó x là biến số nhận các giá trị có thể trên miền xác định của nó. F(x)=P(X x)
  11. Đồ thị hàm phân phối xác suất 1 F(x) 0 x
  12. Hàm phân phối xác suất (tiếp) ◼ Tính chất: ◼ Luôn dương và nhận giá trị trong khoảng [0,1] ◼ F(- )=1 ◼ F( )=0 ◼ Là hàm nghịch biến và không tăng trên toàn trục số ◼ x2 x1 thì F(x2) F(x1) ◼ Liên tục bên phải tại mỗi điểm x0 F x = F x lim ( ) ( 0 ) x→x0 +0
  13. Hàm mật độ xác suất ◼ Công thức: P(x X x + x) f (x) = lim x→0 x ◼ Tính chất: ◼ 1. F(x) = f (x)dx x ◼ 2. Hàm f(x) luôn dương và biến đổi từ 0 đến 1 ◼ 3. f (x)dx =1 −
  14. Đồ thị hàm mật độ xác suất f(x) x
  15. Đặc điểm của đồ thị hàm mật độ xác suất ◼ Hoàn toàn nằm trên trục hoành ◼ Diện tích giới hạn bởi đồ thị của hàm mật độ xác suất với trục hoành có giá trị bằng 1 ◼ Hàm mật độ xác suất nhận trục 0x làm tiệm cận ngang ◼ Có ít nhất một giá trị cực đại
  16. Các đặc trưng của đại lượng ngẫu nhiên ◼ Kỳ vọng toán ◼ Nếu X là ĐLNN rời rạc, có E X = x p phân phối xác suất P(X = xk) ( )  i i i=1 = pk thì ◼ Nếu X là ĐLNN liên tục với hàm mật độ f(x) thì E(X ) = xf(x)dx ◼ Phương sai − D(X ) = E(X − E(X ))2 ◼ Khoảng lệch quân phương  = D(X )
  17. Các đặc trưng của đại lượng ngẫu nhiên (tiếp) ◼ Hệ số phân tán  C = v E(X ) ◼ Hệ số thiên lệch E(X − E(X ))3 C = s  3
  18. Ý nghĩa của các đặc trưng ◼ Trị số bình quân ◼ là đại biểu chung cho chuỗi số ◼ bị ảnh hưởng lớn bởi các giá trị cực đoan nhất là trong trường hợp chuỗi thống kê ngắn ◼ Khoảng lệch quân phương: ◼ biểu thị độ phân tán của chuỗi số ◼ Là một số có thứ nguyên nên không thể dùng để so sánh các chuỗi số có thứ nguyên khác nhau ◼ Hệ số phân tán: ◼ Biểu thị độ phân tán của chuỗi số ◼ Là một số không có thứ nguyên nên có thể dùng để so sánh các chuỗi số có thứ nguyên khác nhau ◼ Hệ số thiên lệch: ◼ Nếu Cs>0 đường phân bố lệch dương ◼ Nếu Cs<0 đường phân bố lệch âm ◼ Nếu Cs=0 đường phân bố đối xứng
  19. II. Thống kê toán học ứng dụng trong tính toán thủy văn ◼ Thống kê toán học là môn học nghiên cứu những quy luật ngẫu nhiên trên cơ sở ghi nhận, mô tả và phân tích những kết quả quan sát hoặc thực nghiệm, được tiến hành đối với các hiện tượng ngẫu nhiên. ◼ Những nội dung cơ bản của thống kê toán học: ◼ Phương pháp lựa chọn số liệu thống kê (phương pháp chọn mẫu) ◼ Ước lượng các đặc trưng thống kê (tham số thống kê) ◼ Phân tích các quy luật ngẫu nhiên của hiện tượng từ tài liệu thống kê và lựa chọn các hàm phân phối xác suất phù hợp với đại lượng ngẫu nhiên ◼ Phân tích tương quan giữa các đại lượng ngẫu nhiên
  20. Tổng thể và mẫu ◼ Tổng thể là tập hợp tất cả các giá trị mà đại lượng ngẫu nhiên X có thể nhận được. Ký hiệu: N ◼ Mẫu là một bộ phận của tổng thể, một phần rất nhỏ của tổng thể mà thông qua quan sát đo đạc có được. Ký hiệu: n ◼ Các yêu cầu của mẫu trong thống kê: ◼ Tính đồng nhất: cùng loại, cùng nguyên nhân hình thành hoặc cùng điều kiện xuất hiện ◼ Tính độc lập: các số liệu của mẫu không phụ thuộc lẫn nhau ◼ Tính đại biểu: mẫu được chọn có những tính chất của tổng thể. Muốn vậy, dung lượng mẫu phải đủ lớn đảm bảo sai số lấy mẫu; mẫu phải bao gồm các giá trị số đặc trưng lớn, nhỏ và trung bình
  21. Ước lượng các tham số thống kê ◼ Hai giả thiết: ◼ Đại lượng ngẫu nhiên liên tục, nhưng các giá trị của mẫu chỉ là tập hợp một số hữu hạn các giá trị rời rạc của tổng thể. Do đó, coi đại lượng ngẫu nhiên liên tục bị rời rạc hóa ◼ Các giá trị thu được từ mẫu (dung lượng: n) được coi là các biến cố xung khắc từng đôi một, xác suất xuất hiện của từng giá trị tuân theo luật phân phối đều, tức là: p(xi)=1/n
  22. Các đặc trưng thống kê của một mẫu ◼ Vì mẫu chỉ là một bộ phận rất nhỏ của tổng thể nên các đặc trưng thống kê của mẫu không bằng các đặc trưng thống kê của tổng thể, nó có một sai số nhất định gọi là sai số lấy mẫu. ◼ Trị số bình quân: x x =  i n (k −1)2 ◼ Hệ số phân tán: C =  i v n −1 3 (ki −1) ◼ Hệ số thiên lệch: Cs = 3 (n − 3)Cv
  23. Sai số lấy mẫu Sai số tuyệt đối Sai số tương đối ◼ Đối với trị số bình quân  x 100Cv  x =  (%) = n x n ◼ Đối với hệ số phân tán Cv 2 100 2  = 1+ C  Cv (%) = 1+ Cv (%) Cv 2n v 2n ◼ Đối với hệ số thiên lệch 6 2 4 100 6 2 4  Cs = (1+ 6Cv +5Cv )  Cs (%) = (1+ 6Cv + 5Cv ) n Cs n
  24. Tần suất ◼ Tần suất là tỷ số giữa số lần biến cố xuất hiện chia cho tổng số lần thực hiện phép thử ◼ Tần suất tích luỹ: là tỷ số giữa số lần xuất hiện một trị số bằng hoặc lớn hơn trị số đã cho chia cho tổng số lần thực hiện phép thử ◼ Tần suất kinh nghiệm là tần suất tính theo chuỗi số liệu thực đo
  25. Các công thức tính tần suất kinh nghiệm thường dùng trong thuỷ văn ◼ Công thức số trung bình Hazen m − 0,5 P = 100% n ◼ Công thức kỳ vọng Kritxki Menken m P = 100% n +1 ◼ Công thức số giữa Chêgôđaép m − 0,3 P = 100% n + 0,4 Trong đó: m là số lần xuất hiện trị số lớn hơn hoặc bằng trị số đã cho; n là độ dài mẫu
  26. Đường tần suất ◼ Đường tần suất là đường quan hệ giữa tần suất luỹ tích và giá trị của biến ngẫu nhiên ◼ Đường tần suất kinh nghiệm: ◼ là đường cong trơn đi qua trung tâm nhóm điểm biểu diễn tần suất xuất hiện của đại lượng ngẫu nhiên nhận giá trị X≥xi ◼ Đường tần suất lý luận ◼ là đường cong toán học được dùng để biểu thị quy luật phân bố xác suất của đại lượng ngẫu nhiên
  27. Vẽ đường tần suất kinh nghiệm ◼ Lập bảng mẫu TT Xi Ki Pi ◼ Cột 1: Thứ tự ◼ Cột 2: Chuỗi số liệu đã sắp xếp từ lớn đến nhỏ (1) (2) (3) (4) ◼ Cột 3: Hệ số biến suất Ki=Xi/Xbq ◼ Cột 4: Tính tần suất kinh nghiệm theo một trong các công thức tần suất kinh nghiệm thường dùng trong thuỷ văn ◼ Chấm quan hệ cột 1 hoặc cột 3 và cột 4 lên giấy tần suất ◼ Vẽ đường cong trơn đi qua trung tâm nhóm điểm được đường tần suất kinh nghiệm Th.h 3 đ
  28. Đường tần suất kinh nghiệm lưu lượng bình quân năm vẽ trên giấy thường 1400 1300 1200 1100 1000 900 800 Qn(m3/s) 700 600 500 400 0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00 P(%)
  29. L•îng m•a X(mm) 1000 1200 1400 200 400 600 800 0 Giấy tầnsuất 0,01% madrak -tr¹m mïa m•a l•îng suÊt tÇn §•êng 0,10% 0,20% 0,33% 0,50% 1,00% 1,50% 2,00% 3,00% 5,00% 10,00% 20,00% 25,00% 30,00% 40,00% 50,00% 60,00% 70,00% 75,00% 80,00% 85,00% Pearson bè: ph©n D¹ng C¸c tham sè thèng kª thèng sè tham C¸c 90,00% 95,00% X TB C C = 558mm = 97,00% V S = 0,5 = 0,25 = III 99,00% 99,90%P(%) 99,99%
  30. Luật phân phối xác suất Pearson III ◼ Tác giả: Nhà thống kê sinh vật học người Anh Pearson ◼ Điều kiện để lập họ đường cong hàm mật độ xác suất: ◼ Tại số đông hệ số góc của tiếp tuyến bằng 0 ◼ Hai đầu hoặc một đầu nhận trục hoành làm đường tiệm cận ◼ PT vi phân của họ đường cong hàm mật độ xác suất: (x − xd ) f (x) df (x) = 2 dx c0 + c1x + c2 x
  31. Luật phân phối xác suất Pearson III (tiếp) ◼ Chuyển gốc tọa độ về trị số bình quân và giải được 13 nghiệm khác nhau (họ đường Pearson) ◼ Với c2=0 thì nghiệm là hàm mật độ Pearson III có dạng:  −1 − (x−x ) f (x) = (x − x ) e 0 ( ) 0 ◼ Trong đó: 4 CvCs = 2 ; = x Cs 2 ◼ x0: giá trị nhỏ nhất của hàm mật độ xác suất 2Cv x0 = x − x Cs
  32. Luật phân phối xác suất Pearson III (tiếp) ◼ Khi chuyển trục tọa độ về vị trí số đông, phương trình hàm mật độ có dạng: y a − x x d − d y0 y = y0 1+ e a a d ◼ Trong đó x® x ◼ y0: là giá trị lớn nhất của hàm tương ứng với số đông xđ ◼ d: bán kính lệch (khoảng cách giữa trị số bình quân và số đông) ◼ a: khoảng cách từ vị trí số đông đến giá trị nhỏ nhất
  33. Luật phân phối xác suất Pearson III (tiếp) ◼ Đặc điểm chính: ◼ Dạng hàm mật độ xác suất có một số đông, một đầu bị chặn tại x=x0, một đầu nhận trục hoành làm đường tiệm cận khi x →+ ◼ Có 3 đặc trưng x, Cv, Cs là tham số. Khi các đặc trưng này được xác định thì hàm mật độ xác suất và đường tần suất được xác định ◼ Phân phối lệch phụ thuộc vào bán kính lệch d ◼ d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số bình quân) ◼ d<0: lệch âm (đỉnh của hàm mật độ nằm bên phải trị số bình quân) ◼ d=0: đỉnh của hàm mật độ trùng với vị trí số bình quân ◼ Điều kiện ứng dụng: 2C v x0 2Cv Cs ;k0 = 1− k0 x
  34. Bảng Fôxtơ-Rưpkin ◼ Hai ông Fôxtơ-Rưpkin dựa trên kết quả tích phân phương trình hàm mật độ tần suất đã lập sẵn bảng tra để sử dụng khi vẽ đường tần suất ◼ Giả sử cần tìm xp (giá trị của ĐLNN X tương ứng với tần suất P) ◼ Đặt x − x K −1 F = p = p  x Cv ◼ Trong đó: Kp là hệ số biến suất của đại lượng X tương ứng với tần suất P: Kp=xp/x ◼ F gọi là khoảng lệch tung độ ◼ Đối với hàm PIII, F chỉ phụ thuộc vào Cs và P. Vì vậy, hai ông Fôxtơ-Rưpkin đã lập bảng quan hệ F theo Cs và P.
  35. Trích bảng Fôxtơ-Rưpkin Bảng tra khoảng lệch tung độ F của đường tần suất lý luận Piếc-sơn III Cs P 0,01 0,1 0,5 1 3 5 10 20 50 70 75 90 95 97 99 99,9 0,0 3,72 3,09 2,58 2,33 1,88 1,64 1,28 0,84 0,00 -0,52 -0,67 -1,28 -1,64 -1,88 -2,33 -3,09 0,1 3,94 3,23 2,67 2,40 1,92 1,67 1,29 0,84 -0,02 -0,53 -0,68 -1,27 -1,62 -1,84 -2,25 -2,95 0,2 4,16 3,38 2,76 2,47 1,96 1,70 1,30 0,83 -0,03 -0,55 -0,69 -1,26 -1,59 -1,79 -2,18 -2,81 0,3 4,38 3,52 2,86 2,54 2,00 1,73 1,31 0,82 -0,05 -0,56 -0,70 -1,24 -1,55 -1,75 -2,10 -2,67 0,4 4,61 3,67 2,95 2,62 2,04 1,75 1,32 0,82 -0,07 -0,57 -0,71 -1,23 -1,52 -1,70 -2,03 -2,54 0,6 5,05 3,96 3,13 2,75 2,12 1,80 1,33 0,80 -0,10 -0,59 -0,72 -1,20 -1,45 -1,61 -1,88 -2,27
  36. Ứng dụng bảng Fôxtơ-Rưpkin P(%) 0.1 1.0 5 10 50 75 80 90 99 99.9 F(Cs,P) Kp=F.Cv+ 1 xp=Kp.x Lưu ý: Khi Cs 0) VD: F1%(Cs=-1)=-F99%(Cs=1)=1,59
  37. Luật phân phối xác suất Kritxki-Menken ◼ Điều kiện: ◼ Có thể dùng 3 đặc trưng x, Cv, Cs làm tham số của hàm mật độ ◼ Chỉ có một số đông ◼ Giá trị của ĐLNN nằm trong phạm vi 0 x + ◼ Phương trình hàm mật độ xác suất: 1 − x b −1 − b a f (x) = x e b b( ) 2 x 1 = = ◼ Trong đó: a, b là các hằng số; 2  x Cv ◼ Ứng dụng: Tương tự hai ông Kritxki-Menken cũng lập bảng tra sẵn hệ số môđuyn Kp phụ thuộc vào Cv, Cs và P.
  38. Ảnh hưởng của các tham số thống kê đến đường tần suất ◼ Ảnh hưởng của trị số bình quân: Cv=const Cs=const X1 X>X1 X2 X1 X P% ◼ Trị số trung bình ảnh hưởng đến vị trí của đường tần suất so với trục hoành.
  39. Ảnh hưởng của các tham số thống kê đến đường tần suất (tiếp) ◼ Ảnh hưởng của hệ số phân tán X =const Cs=const Kp Cv2 > Cv1 Cv1 Cv2 P% ◼ Hệ số Cv ảnh hưởng đến độ dốc của đường tần suất
  40. Ảnh hưởng của các tham số thống kê đến đường tần suất (tiếp) ◼ Ảnh hưởng của hệ số thiên lệch X =const Cv=const Kp Cs2 > Cs1 Cs 0 Cs=0 P% ◼ Hệ số Cs ảnh hưởng đến độ cong của đường tần suất
  41. Hai phương pháp vẽ đường tần suất lý luận thường dùng ◼ Phương pháp thích hợp dần ◼ Phương pháp 3 điểm của Alechxayep Nguyên tắc chung: ◼ Xác định các tham số thống kê (X, Cv, Cs) ◼ Lựa chọn dạng phân phối xác suất ◼ Sử dụng các bảng tra xác định tọa độ đường tần suất lý luận ◼ Kiểm tra sự phù hợp giữa ĐTSKN và ĐTSLL và điều chỉnh P(%) 0.1 1.0 5 10 50 75 80 90 99 99.9 Kp xp=Kp.X
  42. Phương pháp thích hợp dần ◼ Vẽ đường tần suất kinh nghiệm ◼ Xác định các đặc trưng thống kê: X, Cv ◼ Giả định Cs=mCv, với m=1(hoặc 2,3,4,5,6) ◼ Lựa chọn dạng đường phân phối xác suất (PIII hoặc KM) ◼ Xây dựng đường tần suất lý luận ◼ Kiểm tra sự phù hợp giữa đường TSLL và đường TSKN ◼ Nếu chưa phù hợp giả thiết lại m và tính lại ◼ Nhận xét: Phương pháp trực quan, dễ dàng nhận xét và xử lý điểm. Nhược điểm là phải thử dần mất nhiều thời gian
  43. Phương pháp 3 điểm ◼ Vẽ đường tần suất kinh nghiệm ◼ Lựa chọn bộ 3 điểm trên đường TSKN (x1, p1), (x2, p2), (x3,p3) ◼ Nên chọn bộ 3 điểm đã có sẵn bảng tra: VD: (X1%, X50%, X99%) (X3%, X50%, X97%) (X5%, X50%, X95%) (X10%, X50%, X90%) ◼ Tính hệ số lệch S x + x − 2x  + − 2 S = 1 3 2 = 1 3 2 x1 − x3 1 −3
  44. Phương pháp 3 điểm (tiếp) ◼ Tra quan hệ S=f(Cs) xác định Cs ◼ Tra F50%, F1-F3 theo Cs ◼ Tính độ lệch quân phương x − x  = 1 3 1 −3 ◼ Tính Xtb =X50%-F50% ◼ Tính hệ số phân tán Cv  C = v X ◼ CóX, Cv, Cs vẽ đường TSLL. Kiểm tra sự phù hợp của Đường TSLL và đường TSKN
  45. Ví dụ bảng tra S~Cs trường hợp P=1_50_99% S 0 1 2 3 4 5 6 7 8 9 0 0.00 0.03 0.05 0.07 0.10 0.12 0.15 0.17 0.20 0.23 0.1 0.26 0.28 0.31 0.34 0.36 0.39 0.41 0.44 0.47 0.49 0.2 0.52 0.54 0.57 0.59 0.62 0.65 0.67 0.70 0.73 0.76 0.3 0.78 0.81 0.84 0.86 0.89 0.92 0.94 0.97 1.00 1.02 0.4 1.05 1.08 1.10 1.13 1.16 1.18 1.21 1.24 1.27 1.30 0.5 1.32 1.36 1.39 1.42 1.45 1.40 1.51 1.55 1.58 1.61 0.6 1.64 1.68 1.71 1.74 1.78 1.81 1.84 1.88 1.92 1.95 0.7 1.99 2.03 2.07 2.11 2.16 2.20 2.25 2.30 2.40 2.39 0.8 2.44 2.50 2.55 2.61 2.67 2.74 2.81 2.89 2.97 3.05 0.9 3.14 3.22 3.33 3.46 3.59 3.73 3.92 4.14 4.44 4.90
  46. Ví dụ về bảng tra quan hệ Cs~F Cs F50% F1%-F99% F3%-F97% F5%-F95% F10%-F90% 0 0.000 4.652 3.762 3.290 2.564 0.1 -0.017 4.648 3.756 3.287 2.560 0.2 -0.233 4.645 3.750 3.284 2.557 0.3 -0.055 4.641 3.743 3.278 2.550 0.4 -0.680 6.637 3.736 3.273 2.543 0.5 -0.081 4.633 3.732 3.266 2.532 0.6 -0.100 4.629 3.727 3.259 2.522 0.7 -0.116 4.624 3.718 3.246 2.510 0.8 -0.132 4.620 3.709 3.233 2.498
  47. L•îng m•a X(mm) 1000 1200 1400 ĐTSLL và ĐTSKN Ví dụ về sosánhsựphù hợp giữa 200 400 600 800 0 0,01% §•êng tÇn suÊt l•îng m•a mïa -tr¹m -tr¹m mïa m•a l•îng suÊt tÇn §•êng 0,10% 0,20% 0,33% 0,50% 1,00% 1,50% 2,00% 3,00% 5,00% Chưaphù hợp 10,00% madrak 20,00% 25,00% 30,00% 40,00% 50,00% 60,00% 70,00% 75,00% 80,00% 85,00% C¸c tham sè thèng kª thèng sè tham C¸c 90,00% 95,00% X TB C C 97,00% 558mm = S V = 0,2 = = 0,1 = 99,00% 99,90% P(%) 99,99%
  48. L•îng m•a X(mm) 1000 1200 1400 ĐTSLL và ĐTSKN Ví dụ về sosánhsựphù hợp giữa 200 400 600 800 0 0,01% §•êng tÇn suÊt l•îng m•a mïa -tr¹m -tr¹m mïa m•a l•îng suÊt tÇn §•êng 0,10% 0,20% 0,33% 0,50% 1,00% 1,50% 2,00% 3,00% Phù hợp 5,00% 10,00% madrak 20,00% 25,00% 30,00% 40,00% 50,00% 60,00% 70,00% 75,00% 80,00% 85,00% C¸c tham sè thèng kª thèng sè tham C¸c 90,00% 95,00% X TB C C 97,00% 558mm = S V = 0,4 = = 0,2 = 99,00% 99,90% P(%) 99,99%
  49. III. Phân tích tương quan 1. Khái niệm chung y y y Quan hệ hàm số x x y y Quan hệ độc lập (Không quan hệ) c x x
  50. Quan hệ tương quan ◼ Hai đại lượng X và Y được gọi là có quan hệ tương quan thống kê với nhau nếu với mỗi trị số của X, đại lượng Y có thể nhận các giá trị khác nhau một cách ngẫu nhiên. Ngược lại, với mỗi giá trị của Y thì X cũng có thể nhận các giá trị khác nhau một cách ngẫu nhiên. Tuy nhiên, nếu tập hợp nhiều số liệu thống kê thì quan hệ giữa X và Y có tính quy luật và tạo thành một xu thế nào đó. y y x x Tương quan tuyến tính Tương quan phi tuyến
  51. Đường hồi quy ◼ Đặt tương ứng mỗi giá trị của đại lượng này với giá trị trung bình của các giá trị tương ứng của đại lượng kia ta được hàm hồi quy. Đường phối hợp tốt nhất biểu thị hàm hồi quy của tổng thể được gọi là đường hồi quy. ◼ Tương quan giữa hai đại lượng X và Y được gọi là tuyến tính nếu cả hai hàm hồi quy đều là tuyến tính. ◼ Đường hồi quy của y theo x là: y = f1(x) ◼ Đường hồi quy của x theo y là: x=f2(y)
  52. Xác định phương trình của đường thẳng hồi quy ◼ Phương trình của đường thẳng hồi quy y = ax +b ◼ Khoảng lệch giữa điểm thực đo (xi, yi) với đường thẳng hồi quy là: yi- y = yi – (axi+b) ◼ Theo nguyên lý bình phương nhỏ nhất, muốn cho đường thẳng phối hợp tốt nhất thì tổng bình phương của khoảng lệch phải nhỏ nhất, nghĩa là: n n 2 2 (yi − y) = (yi − b − axi ) = min i=1 i=1
  53. Xây dựng phương trình hồi quy của Y theo X 25.00 20.00 y = 0.041x + 1.1284 15.00 (xi,yi) yi (xi,y) Y y 10.00 5.00 0.00 xi 0.0 100.0 200.0 300.0 400.0 500.0 X
  54. Xác định phương trình của đường thẳng hồi quy (tiếp)  (y − ax − b)2 ◼ Muốn vậy:  i i = 0 a  (y − ax − b)2  i i = 0 b ◼ Giải hệ phương trình trên rút ra a, b và thay vào ta có:  y − y = g y (x − x)  x ◼ Trong đó g là hệ số tương quan n (xi − x)(yi − y) g = i=1 n n 2 2 (xi − x) (yi − y) i=1 i=1
  55. 2 2 STT Xi Yi (Xi-Xtb) (Yi-Ytb) (Xi-Xtb) (Yi-Ytb) (Xi-Xtb)(Yi-Ytb) 1 359.7 9.49 79.70 Ví-3.11 dụ 6351.48 9.679 -247.95 2 236.9 7.56 -43.09 -5.04 1856.64 25.410 217.20 3 199.6 6.70 -80.46 -5.90 6473.75 34.806 474.68 4 268.3 14.04 -11.73 1.43 137.48 2.058 -16.82 ◼5 Xây205.3 dựng11.34 quan hệ-74.73 tương-1.26 quan5584.68 giữa hai1.599 đại lượng94.49 Y 6 và215.0 X dựa 10.80trên tài-65.02 liệu thực-1.81 đo.4228.06 3.258 117.37 7 212.6 9.73 -67.46 -2.88 4551.14 8.284 194.17 8 250.6 9.21 -29.44 -3.40 866.82 11.545 100.04 9 255.3 9.78 -24.73 -2.82 611.80 7.949 69.74 10 329.7 12.31 49.65 -0.30 2465.31 0.088 -14.70 11 181.2 12.41 -98.80 -0.20 9761.19 0.039 19.54 12 312.6 12.29 32.59 -0.31 1061.97 0.095 -10.07 13 301.7 11.78 21.62 -0.82 467.42 0.675 -17.76 14 249.4 14.80 -30.65 2.20 939.46 4.821 -67.30 15 206.4 12.21 -73.65 -0.39 5424.12 0.153 28.82 16 401.7 19.18 121.64 6.58 14796.93 43.304 800.48 17 298.0 14.69 17.92 2.09 321.23 4.368 37.46 18 286.2 10.29 6.20 -2.31 38.49 5.338 -14.33 19 402.8 22.46 122.72 9.86 15060.03 97.197 1209.87 20 427.8 20.99 147.72 8.38 21821.00 70.274 1238.32 TB 280.0 12.60 Tổng 102819.01 330.94 4213.26
  56. Xây dựng phương trình hồi quy của Y theo X 25.00 20.00 y = 0.041x + 1.1284 15.00 Y g = 0.7 10.00 5.00 0.00 0.0 100.0 200.0 300.0 400.0 500.0 X