Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Việt Dũng

pdf 30 trang hapham 1710
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Việt Dũng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_ung_dung_trong_kinh_doanh_chuong_14_du_ba.pdf

Nội dung text: Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Việt Dũng

  1. CHƯƠNG 14 DỰ BÁO DỰA TRÊN DỮ LIỆU CHUỖI THỜI GIAN Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn
  2. MỤC TIÊU CỦA CHƯƠNG ● Sau khi học xong chương này, người học sẽ ● Phát biểu được chuỗi thời gian là gì ● Phân biệt được các khái niệm và các cách tiếp cận trong dự báo ● Thực hiện được các phương pháp dự báo dựa trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc độ phát triển bình quân ● Thực hiện được một số phương pháp dự báo theo mơ hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 2
  3. CÁC NỘI DUNG CHÍNH 14.1 Chuỗi thời gian 14.2 Các phương pháp dự báo dựa trên chuỗi thời gian 14.3 Dự báo bằng mơ hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 3
  4. 14.1 CHUỖI THỜI GIAN ● 14.1.1 Khái niệm ● 14.1.2 Các đại lượng mơ tả chuỗi thời gian © Nguyễn Tiến Dũng Thống kê ứng dụng 4
  5. 14.1.1 Khái niệm ● Time-series data ● Chuỗi các giá trị của một chỉ tiêu NC (đại lượng) được sắp xếp theo thứ tự thời gian ● Y = {Y1, Y2, Y3, Yn} ● Chuỗi số thời kỳ: ● DL thu thập trong kỳ ● Cĩ tính cộng: cộng các thời kỳ khác nhau với nhau được ● TD ● Chuỗi số thời điểm ● DL thu thập tại một thời điểm ● Khơng cộng lại với nhau để đưa ra con số tích luỹ được ● TD © Nguyễn Tiến Dũng Thống kê ứng dụng 5
  6. Phân biệt DL thời kỳ và DL thời điểm ● DL thời kỳ: cĩ tính ● DL thời điểm: khơng cĩ tính cộng cộng ● Số lao động của một ● Lượng bán, Doanh doanh nghiệp thu ● Giá bán ● Tài sản, vốn chủ sở hữu, ● Chi phí SXKD, Lợi nợ phải trả nhuận = Doanh thu – ● CPI – Chỉ số giá tiêu Chi phí dùng ● GDP, thu nhập ● Điểm TB học tập của từng học kỳ (GPA học kỳ) ● Chi tiêu sinh hoạt ● Mức độ hài lịng của khách hàng – khảo sát theo quý. © Nguyễn Tiến Dũng Thống kê ứng dụng 6
  7. 14.1.2 Các đại lượng mơ tả chuỗi thời gian ● 14.1.2.1 Giá trị TB ● Chuỗi thời kỳ 1 n YY  i ● Chuỗi thời điểm n i 1 ● Nếu khoảng cách giữa các thời điểm bằng 1 YYYYYY (0,5 0,5 ) nhau n 1 1 2 3nn 1 n ● Nếu khoảng cách giữa Ytii các thời điểm khơng Y i 1 bằng nhau, nhưng thời n t gian NC là liên tục  i i 1 © Nguyễn Tiến Dũng Thống kê ứng dụng 7
  8. 14.1.2.2 Lượng tăng giảm tuyệt đối (so sánh tuyệt đối) ● Lượng tăng giảm tuyệt đối  YY (i=2,n) liên hồn i i i 1 ● Lượng tăng giảm tuyệt đối ii YY 1 (i=2,n) định gốc n ni i 2 ● Lượng tăng giảm tuyệt đối TB n 1 i   i nn 11i 2 © Nguyễn Tiến Dũng Thống kê ứng dụng 8
  9. 14.1.2.3 Tốc độ phát triển Y t i i Y ● Tốc độ phát triển liên i 1 hồn Yi Ti ● Tốc độ phát triển định Y1 n gốc Yn Ttni  Y1 i 2 ● Liên hệ giữa tốc độ phát triển liên hồn và tốc độ n n 1 n 1 phát triển định gốc t  tin T i 2 ● Tốc độ phát triển TB © Nguyễn Tiến Dũng Thống kê ứng dụng 9
  10. 14.1.2.4 Tốc độ tăng trưởng YYii 1 ● Tốc độ tăng trưởng liên hồn atii 1 Yi 1 YYii 1 ● Tốc độ tăng trưởng định gốc ATii 1 YY11 ● Tốc độ tăng trưởng TB at 1 © Nguyễn Tiến Dũng Thống kê ứng dụng 10
  11. 14.2 DỰ BÁO DỰA TRÊN CHUỖI THỜI GIAN ● Hoạch định tốt Thành cơng cao ● Dự báo hoạch định (lập kế hoạch) ● Các cách tiếp cận trong DB ● Cách tiếp cận định tính: phỏng vấn sâu, thảo luận nhĩm đối với chuyên gia và khách hàng ● Cách tiếp cận định lượng: ● Sử dụng X để dự báo Y: PT tương quan và hồi quy ● Sử dụng các GT quá khứ của Y để dự báo các GT tương lai của Y ● Các điều kiện và giả định để DB định lượng ● Cĩ sẵn DL quá khứ ● Cĩ thể lượng hố DL quá khứ ● Các quy luật quá khứ sẽ tiếp diễn trong tương lai © Nguyễn Tiến Dũng Thống kê ứng dụng 11
  12. 14.2.1 Một số vấn đề liên quan đến dự báo ● 14.2.1.1 Thời đoạn DB ● Là tần suất thời gian mà DL phục vụ dự báo được thu thập, như ngày, tuần, tháng, quý, năm. ● 14.2.1.2 Tầm xa DB ● DB tức thì: dưới 1 tháng ● DB ngắn hạn: từ 1 đến 3 tháng ● DB trung hạn: từ 3 tháng đến hơn 1 năm. ● DB dài hạn: từ 2 năm trở lên © Nguyễn Tiến Dũng Thống kê ứng dụng 12
  13. 14.2.1.3 Các chỉ tiêu đánh giá mức độ phù hợp của mơ hình dự báo ● Sai số tuyệt đối TB – MAE YYYY {}; ; , (Mean Absolute Error) 12 n FFFF {}12; ; , n n e Y- F ||ei i i i MAE i 1 n ● Sai số phần trăm tuyệt đối TB – MAPE (Mean Absolute Percent Error) n |eYii | / MPAE i 1 n © Nguyễn Tiến Dũng Thống kê ứng dụng 13
  14. ● Sai số bình phương TB – MSE (Mean Square Error) và Căn bậc hai của sai số bình phương TB n n e2 2  i  ei MSE i 1 RMSE MS E i 1 n n ● Chỉ số U RMSE của mô hình dự báo đang sử dụng U RMSE của mô hình dự báo ngây thơ (naive) © Nguyễn Tiến Dũng Thống kê ứng dụng 14
  15. 14.2.2 Các phương pháp DB đơn giản ● 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● 14.2.2.2 Dự báo dựa vào tốc độ phát triển TB ● 14.2.2.3 Dự báo bằng phương pháp TB trượt (moving average) © Nguyễn Tiến Dũng Thống kê ứng dụng 15
  16. 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● L: tầm xa dự báo (L = 1,2,3, ) FYLn L n  . ● Ft+L: giá trị dự báo ở thời gian t+L ● 훿 : lượng tăng trưởng tuyệt đối TB ● TD t 1 2 3 4 Y 100 118 121 ? delta - 18 3 1  (18 3) 10,5 2 FFY4 3 1 3 1. 121 10,5 131,5 © Nguyễn Tiến Dũng Thống kê ứng dụng 16
  17. 14.2.2.2 Dự báo dựa vào tốc độ phát triển trung bình t 1 2 3 4 Y 100 118 121 ? Tốc độ PT - 118/100 = 121/118 = liên hồn 1,18 1,025 L Fn L Y n .( t ) t Y31/ Y 121/100 1,1 (1,18).(1,025) 1,099 F4 F 3 1 Y 3. t 121 1,1 133,1 © Nguyễn Tiến Dũng Thống kê ứng dụng 17
  18. 14.2.2.3 Dự báo bằng phương pháp trung bình trượt (Moving Average Method) ● Phạm vi áp dụng và ý nghĩa: ● Chuỗi số liệu cĩ thành phần xu hướng (tăng/giảm tuyến tính) và cĩ thành phần bất thường (nhiễu loạn) ● Số điểm lấy TB: ● m = 2k+1 hoặc m = 2k ● Nếu m lẻ, khơng phải trung tâm hố ● Nếu m chẵn, phải trung tâm hố ● Chọn m bằng bao nhiêu? ● Dãy số cĩ mức độ biến động ít, chọn m nhỏ (TD, m=3) ● Dãy số cĩ mức độ biến động nhiều, chọn m lớn hơn (m = 5, 7 ) ● Phương pháp “Trial-and-error”: thử các giá trị m khác nhau, phương pháp nào cĩ MSE nhỏ nhất thì chọn. ● m càng lớn, đường dự báo càng trơn © Nguyễn Tiến Dũng Thống kê ứng dụng 18
  19. 14.2.2.4 Mơ hình ngoại suy xu thế ● Sử dụng các mơ hình hồi ˆ quy tuyến tính đơn biến và Y b01 b X đa biến để dự báo © Nguyễn Tiến Dũng Thống kê ứng dụng 19
  20. 14.3 DỰ BÁO BẰNG MƠ HÌNH NHÂN ● Mơ hình nhân (Multiplication Model) ● Chuỗi số liệu theo thời gian: Y = {Y1, Y2, , Yn} ● Các thành phần cĩ thể cĩ mặt: ● TP xu thế (Trend) Ti ● TP chu kỳ dài hạn (Cyclical) Ci ● TP mùa vụ (Seasonal) Si ● TP bất thường (Erratic) Ei ● Mơ hình nhân: Yi=Ti.Ci.Si.Ei ● Quy trình dự báo theo mơ hình nhân ● Nhận diện các thành phần của chuỗi ● Tách riêng các thành phần ● Lắp ghép chúng lại để cĩ giá trị dự báo mong muốn © Nguyễn Tiến Dũng Thống kê ứng dụng 20
  21. Quy trình dự báo theo PP Holt-Winter Bước 1: Tính TB di động và trung tâm hố Bước 2: Tính chỉ số mùa St Bước 3: Lọc yếu tố bất thường Et Bước 4: Kiểm tra chỉ số mùa Bước 5: Hiệu chỉnh chỉ số mùa (St*) Bước 6: Xác định các chỉ số mùa ở những điểm dữ liệu cịn thiếu Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi dữ liệu gốc Bước 8: Sử dụng hồi quy tuyến tính xác định phương trình hồi quy của dãy dữ liệu dự báo Bước 9: Xác định các giá trị của dãy dữ liệu dự báo chưa cĩ thành phần mùa Bước 10: Nhân trả lại thành phần mùa để cĩ dãy dữ liệu dự báo cĩ thành phần mùa © Nguyễn Tiến Dũng Thống kê ứng dụng 21
  22. YYYY ● B1: Tách thành phần mùa MA t 2 t 1 t t 1 vụ và bất thường ra khỏi t 0,5 4 YYYY chuỗi dữ liệu bằng phương MA t 1 t t 1 t 2 pháp trung bình trượt trung t 0,5 4 CMA MA MA tâm hố (Centered t t 0,5 t 0,5 Moving Average) t 3 ● Nếu DL theo quý, chọn số điểm lấy TB trượt là m = 4, rồi trung tâm hố ● MA: Moving Average ● CMA: Centered Moving Average © Nguyễn Tiến Dũng Thống kê ứng dụng 22
  23. ● Nếu dữ liệu thu thập theo tháng, chọn số điểm lấy TB trượt là 12, rồi trung tâm hố YYYYYYYYYYYY MA tttttttttttt 654321 12345 t 0,5 12 YYYYYYYYYYYY MA tttttttttttt 54321 123456 t 0,5 12 CMAt MA t 0,5 MA t 0,5 t 7 © Nguyễn Tiến Dũng Thống kê ứng dụng 23
  24. TD: Tính TB trượt trung tâm hố CMA 4 điểm TT Yt MAt CMAt 1 Y1 - 2 Y2 - MA2,5 3 Y3 CMA3 MA3,5 4 Y4 CMA4 MA4,5 5 Y5 CMA5 MA5,5 6 Y6 CMA6 MA6,5 7 Y7 CMA7 MA7,5 8 Y8 CMA8 MA8,5 9 Y9 CMA9 MA9,5 10 Y10 CMA10 MA10,5 11 Y11 - 12 Y12 - © Nguyễn Tiến Dũng Thống kê ứng dụng 24
  25. Lọc thành phần mùa vụ St và bất thường Et ● St.Et = Yt/CMAt © Nguyễn Tiến Dũng Thống kê ứng dụng 25
  26. 14.4 DỰ BÁO BẰNG HÀM TĂNG TRƯỞNG MŨ ● Chuỗi thời gian cĩ tốc độ tăng bt Yt a. e trưởng hầu như khơng đổi qua các giai đoạn ● TD: ● Quy hoạch điện quốc gia ● Chuỗi nhà hàng Western Steakhouses 1978-1992 – Trang 444 © Nguyễn Tiến Dũng Thống kê ứng dụng 26
  27. 14.5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ ● 14.5.1 San bằng hàm mũ đơn giản ● 14.5.2 Phương pháp Holt ● 14.5.3 Phương pháp Holt-Winter © Nguyễn Tiến Dũng Thống kê ứng dụng 27
  28. 14.5.1 Phương pháp san bằng mũ đơn giản ● Exponential Smoothing Method FYFt 1 t (1 ) t ● Ft+1 là giá trị dự báo ở giai đoạn t+1 ● Yt là giá trị thực tế ở giai đoạn t, t = 1,2,3, , n ● α là hệ số làm trơn, 0 < α < 1. ● Giá trị dự báo: Fn+1 = αYn + (1- α)Fn. ● Tư tưởng: GT dự báo là TB cĩ trọng số của các GT trước đĩ, các quan sát càng gần hiện tại cĩ trọng số càng lớn. ● Phạm vi áp dụng ● Dãy DL khơng cĩ thành phần xu hướng và mùa vụ © Nguyễn Tiến Dũng Thống kê ứng dụng 28
  29. 14.5.2 Phương pháp Holt ● Áp dụng: dãy DL cĩ thành phần xu hướng, khơng cĩ thành phần mùa vụ LY11 b1 Y 2 Y 1 Lt Y t (1 )( L t 11 b t ) bt ( L t L t 11 ) (1 ). b t Ft m L t m. b t © Nguyễn Tiến Dũng Thống kê ứng dụng 29
  30. 14.5.3 Phương pháp Holt-Winter ● Phạm vi áp dụng: Dãy DL cĩ tính xu hướng và mùa vụ ● Các cơng thức tính Lt ( Y t / S t s ) (1 )( L t 11 b t ) bt ( L t L t 11 ) (1 ) b t SYLSt ( t / t ) (1 ) t s Ft m ( L t m . b t ). S t s m ● s là số giai đoạn trong một vịng thời vụ (đối với DL quý thì s=4; với DL tháng thì s=12) ● Lt là đại điện cho mức độ của chuỗi thời gian ● bt là thành phần đại diện cho xu hướng ● St là thành phần mùa vụ ● Ft+m là giá trị dự báo cho m thời đoạn về sau © Nguyễn Tiến Dũng Thống kê ứng dụng 30