Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Việt Dũng
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Việt Dũng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_thong_ke_ung_dung_trong_kinh_doanh_chuong_14_du_ba.pdf
Nội dung text: Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 14: Dự báo dựa trên dữ liệu chuỗi thời gian - Nguyễn Việt Dũng
- CHƯƠNG 14 DỰ BÁO DỰA TRÊN DỮ LIỆU CHUỖI THỜI GIAN Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn
- MỤC TIÊU CỦA CHƯƠNG ● Sau khi học xong chương này, người học sẽ ● Phát biểu được chuỗi thời gian là gì ● Phân biệt được các khái niệm và các cách tiếp cận trong dự báo ● Thực hiện được các phương pháp dự báo dựa trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc độ phát triển bình quân ● Thực hiện được một số phương pháp dự báo theo mơ hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 2
- CÁC NỘI DUNG CHÍNH 14.1 Chuỗi thời gian 14.2 Các phương pháp dự báo dựa trên chuỗi thời gian 14.3 Dự báo bằng mơ hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 3
- 14.1 CHUỖI THỜI GIAN ● 14.1.1 Khái niệm ● 14.1.2 Các đại lượng mơ tả chuỗi thời gian © Nguyễn Tiến Dũng Thống kê ứng dụng 4
- 14.1.1 Khái niệm ● Time-series data ● Chuỗi các giá trị của một chỉ tiêu NC (đại lượng) được sắp xếp theo thứ tự thời gian ● Y = {Y1, Y2, Y3, Yn} ● Chuỗi số thời kỳ: ● DL thu thập trong kỳ ● Cĩ tính cộng: cộng các thời kỳ khác nhau với nhau được ● TD ● Chuỗi số thời điểm ● DL thu thập tại một thời điểm ● Khơng cộng lại với nhau để đưa ra con số tích luỹ được ● TD © Nguyễn Tiến Dũng Thống kê ứng dụng 5
- Phân biệt DL thời kỳ và DL thời điểm ● DL thời kỳ: cĩ tính ● DL thời điểm: khơng cĩ tính cộng cộng ● Số lao động của một ● Lượng bán, Doanh doanh nghiệp thu ● Giá bán ● Tài sản, vốn chủ sở hữu, ● Chi phí SXKD, Lợi nợ phải trả nhuận = Doanh thu – ● CPI – Chỉ số giá tiêu Chi phí dùng ● GDP, thu nhập ● Điểm TB học tập của từng học kỳ (GPA học kỳ) ● Chi tiêu sinh hoạt ● Mức độ hài lịng của khách hàng – khảo sát theo quý. © Nguyễn Tiến Dũng Thống kê ứng dụng 6
- 14.1.2 Các đại lượng mơ tả chuỗi thời gian ● 14.1.2.1 Giá trị TB ● Chuỗi thời kỳ 1 n YY i ● Chuỗi thời điểm n i 1 ● Nếu khoảng cách giữa các thời điểm bằng 1 YYYYYY (0,5 0,5 ) nhau n 1 1 2 3nn 1 n ● Nếu khoảng cách giữa Ytii các thời điểm khơng Y i 1 bằng nhau, nhưng thời n t gian NC là liên tục i i 1 © Nguyễn Tiến Dũng Thống kê ứng dụng 7
- 14.1.2.2 Lượng tăng giảm tuyệt đối (so sánh tuyệt đối) ● Lượng tăng giảm tuyệt đối YY (i=2,n) liên hồn i i i 1 ● Lượng tăng giảm tuyệt đối ii YY 1 (i=2,n) định gốc n ni i 2 ● Lượng tăng giảm tuyệt đối TB n 1 i i nn 11i 2 © Nguyễn Tiến Dũng Thống kê ứng dụng 8
- 14.1.2.3 Tốc độ phát triển Y t i i Y ● Tốc độ phát triển liên i 1 hồn Yi Ti ● Tốc độ phát triển định Y1 n gốc Yn Ttni Y1 i 2 ● Liên hệ giữa tốc độ phát triển liên hồn và tốc độ n n 1 n 1 phát triển định gốc t tin T i 2 ● Tốc độ phát triển TB © Nguyễn Tiến Dũng Thống kê ứng dụng 9
- 14.1.2.4 Tốc độ tăng trưởng YYii 1 ● Tốc độ tăng trưởng liên hồn atii 1 Yi 1 YYii 1 ● Tốc độ tăng trưởng định gốc ATii 1 YY11 ● Tốc độ tăng trưởng TB at 1 © Nguyễn Tiến Dũng Thống kê ứng dụng 10
- 14.2 DỰ BÁO DỰA TRÊN CHUỖI THỜI GIAN ● Hoạch định tốt Thành cơng cao ● Dự báo hoạch định (lập kế hoạch) ● Các cách tiếp cận trong DB ● Cách tiếp cận định tính: phỏng vấn sâu, thảo luận nhĩm đối với chuyên gia và khách hàng ● Cách tiếp cận định lượng: ● Sử dụng X để dự báo Y: PT tương quan và hồi quy ● Sử dụng các GT quá khứ của Y để dự báo các GT tương lai của Y ● Các điều kiện và giả định để DB định lượng ● Cĩ sẵn DL quá khứ ● Cĩ thể lượng hố DL quá khứ ● Các quy luật quá khứ sẽ tiếp diễn trong tương lai © Nguyễn Tiến Dũng Thống kê ứng dụng 11
- 14.2.1 Một số vấn đề liên quan đến dự báo ● 14.2.1.1 Thời đoạn DB ● Là tần suất thời gian mà DL phục vụ dự báo được thu thập, như ngày, tuần, tháng, quý, năm. ● 14.2.1.2 Tầm xa DB ● DB tức thì: dưới 1 tháng ● DB ngắn hạn: từ 1 đến 3 tháng ● DB trung hạn: từ 3 tháng đến hơn 1 năm. ● DB dài hạn: từ 2 năm trở lên © Nguyễn Tiến Dũng Thống kê ứng dụng 12
- 14.2.1.3 Các chỉ tiêu đánh giá mức độ phù hợp của mơ hình dự báo ● Sai số tuyệt đối TB – MAE YYYY {}; ; , (Mean Absolute Error) 12 n FFFF {}12; ; , n n e Y- F ||ei i i i MAE i 1 n ● Sai số phần trăm tuyệt đối TB – MAPE (Mean Absolute Percent Error) n |eYii | / MPAE i 1 n © Nguyễn Tiến Dũng Thống kê ứng dụng 13
- ● Sai số bình phương TB – MSE (Mean Square Error) và Căn bậc hai của sai số bình phương TB n n e2 2 i ei MSE i 1 RMSE MS E i 1 n n ● Chỉ số U RMSE của mô hình dự báo đang sử dụng U RMSE của mô hình dự báo ngây thơ (naive) © Nguyễn Tiến Dũng Thống kê ứng dụng 14
- 14.2.2 Các phương pháp DB đơn giản ● 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● 14.2.2.2 Dự báo dựa vào tốc độ phát triển TB ● 14.2.2.3 Dự báo bằng phương pháp TB trượt (moving average) © Nguyễn Tiến Dũng Thống kê ứng dụng 15
- 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● L: tầm xa dự báo (L = 1,2,3, ) FYLn L n . ● Ft+L: giá trị dự báo ở thời gian t+L ● 훿 : lượng tăng trưởng tuyệt đối TB ● TD t 1 2 3 4 Y 100 118 121 ? delta - 18 3 1 (18 3) 10,5 2 FFY4 3 1 3 1. 121 10,5 131,5 © Nguyễn Tiến Dũng Thống kê ứng dụng 16
- 14.2.2.2 Dự báo dựa vào tốc độ phát triển trung bình t 1 2 3 4 Y 100 118 121 ? Tốc độ PT - 118/100 = 121/118 = liên hồn 1,18 1,025 L Fn L Y n .( t ) t Y31/ Y 121/100 1,1 (1,18).(1,025) 1,099 F4 F 3 1 Y 3. t 121 1,1 133,1 © Nguyễn Tiến Dũng Thống kê ứng dụng 17
- 14.2.2.3 Dự báo bằng phương pháp trung bình trượt (Moving Average Method) ● Phạm vi áp dụng và ý nghĩa: ● Chuỗi số liệu cĩ thành phần xu hướng (tăng/giảm tuyến tính) và cĩ thành phần bất thường (nhiễu loạn) ● Số điểm lấy TB: ● m = 2k+1 hoặc m = 2k ● Nếu m lẻ, khơng phải trung tâm hố ● Nếu m chẵn, phải trung tâm hố ● Chọn m bằng bao nhiêu? ● Dãy số cĩ mức độ biến động ít, chọn m nhỏ (TD, m=3) ● Dãy số cĩ mức độ biến động nhiều, chọn m lớn hơn (m = 5, 7 ) ● Phương pháp “Trial-and-error”: thử các giá trị m khác nhau, phương pháp nào cĩ MSE nhỏ nhất thì chọn. ● m càng lớn, đường dự báo càng trơn © Nguyễn Tiến Dũng Thống kê ứng dụng 18
- 14.2.2.4 Mơ hình ngoại suy xu thế ● Sử dụng các mơ hình hồi ˆ quy tuyến tính đơn biến và Y b01 b X đa biến để dự báo © Nguyễn Tiến Dũng Thống kê ứng dụng 19
- 14.3 DỰ BÁO BẰNG MƠ HÌNH NHÂN ● Mơ hình nhân (Multiplication Model) ● Chuỗi số liệu theo thời gian: Y = {Y1, Y2, , Yn} ● Các thành phần cĩ thể cĩ mặt: ● TP xu thế (Trend) Ti ● TP chu kỳ dài hạn (Cyclical) Ci ● TP mùa vụ (Seasonal) Si ● TP bất thường (Erratic) Ei ● Mơ hình nhân: Yi=Ti.Ci.Si.Ei ● Quy trình dự báo theo mơ hình nhân ● Nhận diện các thành phần của chuỗi ● Tách riêng các thành phần ● Lắp ghép chúng lại để cĩ giá trị dự báo mong muốn © Nguyễn Tiến Dũng Thống kê ứng dụng 20
- Quy trình dự báo theo PP Holt-Winter Bước 1: Tính TB di động và trung tâm hố Bước 2: Tính chỉ số mùa St Bước 3: Lọc yếu tố bất thường Et Bước 4: Kiểm tra chỉ số mùa Bước 5: Hiệu chỉnh chỉ số mùa (St*) Bước 6: Xác định các chỉ số mùa ở những điểm dữ liệu cịn thiếu Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi dữ liệu gốc Bước 8: Sử dụng hồi quy tuyến tính xác định phương trình hồi quy của dãy dữ liệu dự báo Bước 9: Xác định các giá trị của dãy dữ liệu dự báo chưa cĩ thành phần mùa Bước 10: Nhân trả lại thành phần mùa để cĩ dãy dữ liệu dự báo cĩ thành phần mùa © Nguyễn Tiến Dũng Thống kê ứng dụng 21
- YYYY ● B1: Tách thành phần mùa MA t 2 t 1 t t 1 vụ và bất thường ra khỏi t 0,5 4 YYYY chuỗi dữ liệu bằng phương MA t 1 t t 1 t 2 pháp trung bình trượt trung t 0,5 4 CMA MA MA tâm hố (Centered t t 0,5 t 0,5 Moving Average) t 3 ● Nếu DL theo quý, chọn số điểm lấy TB trượt là m = 4, rồi trung tâm hố ● MA: Moving Average ● CMA: Centered Moving Average © Nguyễn Tiến Dũng Thống kê ứng dụng 22
- ● Nếu dữ liệu thu thập theo tháng, chọn số điểm lấy TB trượt là 12, rồi trung tâm hố YYYYYYYYYYYY MA tttttttttttt 654321 12345 t 0,5 12 YYYYYYYYYYYY MA tttttttttttt 54321 123456 t 0,5 12 CMAt MA t 0,5 MA t 0,5 t 7 © Nguyễn Tiến Dũng Thống kê ứng dụng 23
- TD: Tính TB trượt trung tâm hố CMA 4 điểm TT Yt MAt CMAt 1 Y1 - 2 Y2 - MA2,5 3 Y3 CMA3 MA3,5 4 Y4 CMA4 MA4,5 5 Y5 CMA5 MA5,5 6 Y6 CMA6 MA6,5 7 Y7 CMA7 MA7,5 8 Y8 CMA8 MA8,5 9 Y9 CMA9 MA9,5 10 Y10 CMA10 MA10,5 11 Y11 - 12 Y12 - © Nguyễn Tiến Dũng Thống kê ứng dụng 24
- Lọc thành phần mùa vụ St và bất thường Et ● St.Et = Yt/CMAt © Nguyễn Tiến Dũng Thống kê ứng dụng 25
- 14.4 DỰ BÁO BẰNG HÀM TĂNG TRƯỞNG MŨ ● Chuỗi thời gian cĩ tốc độ tăng bt Yt a. e trưởng hầu như khơng đổi qua các giai đoạn ● TD: ● Quy hoạch điện quốc gia ● Chuỗi nhà hàng Western Steakhouses 1978-1992 – Trang 444 © Nguyễn Tiến Dũng Thống kê ứng dụng 26
- 14.5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ ● 14.5.1 San bằng hàm mũ đơn giản ● 14.5.2 Phương pháp Holt ● 14.5.3 Phương pháp Holt-Winter © Nguyễn Tiến Dũng Thống kê ứng dụng 27
- 14.5.1 Phương pháp san bằng mũ đơn giản ● Exponential Smoothing Method FYFt 1 t (1 ) t ● Ft+1 là giá trị dự báo ở giai đoạn t+1 ● Yt là giá trị thực tế ở giai đoạn t, t = 1,2,3, , n ● α là hệ số làm trơn, 0 < α < 1. ● Giá trị dự báo: Fn+1 = αYn + (1- α)Fn. ● Tư tưởng: GT dự báo là TB cĩ trọng số của các GT trước đĩ, các quan sát càng gần hiện tại cĩ trọng số càng lớn. ● Phạm vi áp dụng ● Dãy DL khơng cĩ thành phần xu hướng và mùa vụ © Nguyễn Tiến Dũng Thống kê ứng dụng 28
- 14.5.2 Phương pháp Holt ● Áp dụng: dãy DL cĩ thành phần xu hướng, khơng cĩ thành phần mùa vụ LY11 b1 Y 2 Y 1 Lt Y t (1 )( L t 11 b t ) bt ( L t L t 11 ) (1 ). b t Ft m L t m. b t © Nguyễn Tiến Dũng Thống kê ứng dụng 29
- 14.5.3 Phương pháp Holt-Winter ● Phạm vi áp dụng: Dãy DL cĩ tính xu hướng và mùa vụ ● Các cơng thức tính Lt ( Y t / S t s ) (1 )( L t 11 b t ) bt ( L t L t 11 ) (1 ) b t SYLSt ( t / t ) (1 ) t s Ft m ( L t m . b t ). S t s m ● s là số giai đoạn trong một vịng thời vụ (đối với DL quý thì s=4; với DL tháng thì s=12) ● Lt là đại điện cho mức độ của chuỗi thời gian ● bt là thành phần đại diện cho xu hướng ● St là thành phần mùa vụ ● Ft+m là giá trị dự báo cho m thời đoạn về sau © Nguyễn Tiến Dũng Thống kê ứng dụng 30