Bài giảng Phương pháp dự báo chuỗi thời gian - Hồ Thanh Trí

86 trang hapham 5470

Download

Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phương pháp dự báo chuỗi thời gian - Hồ Thanh Trí", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

bai_giang_phuong_phap_du_bao_chuoi_thoi_gian_ho_thanh_tri.pdf

Nội dung text: Bài giảng Phương pháp dự báo chuỗi thời gian - Hồ Thanh Trí

PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN Hồ Thanh Trí
GIỚI THIỆU • Dự báo là bằng chứng thuyết phục để chúng ta quyết định, lựa chọn chính sách trong quản lý, điều hành kinh tế vĩ mô hay vi mô. Hiện nay dự báo đang trở thành một trong những khâu quan trọng ở các bộ phận hoạch định chiến lược ở tầm vĩ mô cũng như ở các đơn vị kinh doanh
GIỚI THIỆU . Có 2 phương pháp dự báo thường được sử dụng:  Phương pháp định tính (còn được gọi là phương pháp chuyên gia) thường được sử dụng khi dữ liệu (quá khứ) không đầy đủ hay đối tượng dự báo bị ảnh hưởng bỡi những nhân tố không thể lượng hóa. Phương pháp định lượng, ngược với phương pháp định tính, sẽ sử dụng dữ liệu quá khứ theo thời gian; vẽ ra và mô hình hóa chiều hướng vận động của đối tượng phù hợp với một mô hình toán học nào đó, đồng thời sử dụng mô hình này cho việc dự báo xu hướng tương lai. Có hai loại phương pháp định lượng là phương pháp dự báo theo chuỗi thời gian và các phương pháp kinh tế lượng (mô hình nhân quả).  Trong phần này, chúng ta tiếp cận phương pháp dự báo định lượng, sử dụng chuỗi thời gian với mô hình xu thế (tuyến tính và phi tuyến tính) và mô hình san bằng mũ – Winter.
MÔ HÌNH HÓA XU THẾ BẰNG PHÂN TÍCH HỒI QUY Xu thế vận động tăng, giảm của dữ liệu chuỗi thời gian có thể mô tả bằng đường thẳng (tuyến tính) hay đường cong (phi tuyến). Phân tích hồi quy là cách thức mô hình hóa mối quan hệ giữa Yt và t (biến thời gian t sử dụng như một biến giải thích) Phần này giới thiệu hai mô hình xu thế thường được sử dụng trong phân tích, dự báo kinh tế, xã hội. Đó là Mô hình xu thế tuyến tính và Mô hình tăng trưởng mũ.
Bảng các hàm xu thế STT Mô hình Phương trình Hình thức tuyến tính 1 Linear (tuyến tính) Ybbt o 1 2 Logarit Ybbt 01ln( ) 3 Quadratic (bậc 2) 2 Ybbtb o t 12 5 Exponential growth (tăng trưởng mũ) bt1 ln(Y ) ln( b ) b t Yt b0 e o 1
Dự báo bằng hàm tăng trưởng mũ • Tình huống: Có file dữ liệu VietNam data.sav, thống kê về Kinh tế Việt Nam từ năm 1990 đến 2008 (nguồn IMF - Quỹ tiền tệ quốc tế). Chúng ta cần dự báo giá trị xuất khẩu của Việt Nam vào năm 2009 và 2010?
Dự báo bằng hàm tăng trưởng mũ • Sử dụng phần mềm thống kê SPSS để phân tích và dự báo; • Hình 1 Dữ liệu đầu vào như hình 1
Dự báo bằng hàm tăng trưởng mũ 1) Khai báo thuộc tính chuỗi thời gian • Hình 2.
Dự báo bằng hàm tăng trưởng mũ • Hình 3. Chọn Data View, Chúng ta thấy dữ liệu có thêm 2 cột (biến) mới
Dự báo bằng hàm tăng trưởng mũ 2) Nhận diện mô hình bằng đồ thị • Hình 4. Từ thanh menu, chọn Analyze Forecasting Sequence Charts
Dự báo bằng hàm tăng trưởng mũ • Hình 5. Trong Hình 5, đưa biến exps vào khung Variables Nhấp OK, sẽ xuất hiện đồ thị như Hình 6
Dự báo bằng hàm tăng trưởng mũ • Hình 6. Hình 6 cho thấy, đường cong có thể là một nhánh của Parabol - dạng hàm bậc 2; cũng có thể là hàm tăng trưởng mũ.
Dự báo bằng hàm tăng trưởng mũ • 3. Chọn hàm xu thế phù hợp Chọn • Hình 7. Analyze Regression Curve Estimation
Dự báo bằng hàm tăng trưởng mũ • Hình 8. - Đưa biến exps vào khung Dependent(s) - Nhấp chọn Time - Chọn mô hình phù hợp: Quadratic hoặc Exponential - Nhấp chọn Display ANOVA table Sau đó nhấp nút Save và khai báo như Hình 8
Dự báo bằng hàm tăng trưởng mũ • Hình 9.
Dự báo bằng hàm tăng trưởng mũ • Hình 10.
Dự báo bằng hàm tăng trưởng mũ • 4. Phân tích kết quả • Kết quả ước lượng và kiểm định mô hình (chúng ta có hai mô hình cạnh tranh nhau, mô hình 1 và mô hình 2) • Mô hình 1 (Quadratic) Model Summary Std. Error of the R R Square Adjusted R Square Estimate .984 .968 .964 3234.512 ANOVA Sum of Squares df Mean Square F Sig. 5006388280.768 Regression 2 2503194140.3 239.264 .000 167393075.759 Residual 16 10462067.2 5173781356.526 Total 18 Coefficients Standardized Unstandardized Coefficients Coefficients B Std. Error Beta t Sig. Case Sequence -2074.576 571.694 -.689 -3.629 .002 Case Sequence 2 239.870 27.770 1.639 8.638 .000 (Constant) 6873.531 2482.933 2.768 .014
Dự báo bằng hàm tăng trưởng mũ • Mô hình 2 (Exponential) Model Summary Std. Error of the R R Square Adjusted R Square Estimate .995 .990 .990 .111 ANOVA Sum of Squares df Mean Square F Sig. Regression 21.080 1 21.080 1715.751 .000 Residual .209 17 .012 Total 21.289 18 Coefficients Standardized Unstandardized Coefficients Coefficients B Std. Error Beta t Sig. Case Sequence .192 .005 .995 41.422 .000 (Constant) 1542.434 81.649 18.891 .000 The dependent variable is ln(xuat khau trieu (USD)).
Dự báo bằng hàm tăng trưởng mũ
Dự báo bằng hàm tăng trưởng mũ
Dự báo bằng hàm tăng trưởng mũ • Hình 11. Các biến mới được tạo ra;
Dự báo bằng hàm tăng trưởng mũ • Hình 12. Kết quả dự báo
Dự báo bằng hàm tăng trưởng mũ • 5. Tính chỉ tiêu MSE • Chọn Transform\ Compute. Hộp thoại như hình 13a & 13b xuất hiện. Tạo biến mới tên là ERRSQ1 và ERRSQ2 • Hình 13a.
Dự báo bằng hàm tăng trưởng mũ
Dự báo bằng hàm tăng trưởng mũ • Hình 14
Dự báo bằng hàm tăng trưởng mũ • Hình 15
Dự báo bằng hàm tăng trưởng mũ • Cột Mean cho giá trị MSE (sai số bình phương trung bình) Descriptive Statistics N Minimum Maximum Mean Std. Deviation ERRSQ1 19 111310.5 50600844.6 8810161.882 11844898.5063 ERRSQ2 19 376.4 6935694.2 1652878.346 1906779.4834 Valid N (listwise) 19
Dự báo bằng hàm tăng trưởng mũ • Hình 16 thể hiện giá trị dự báo đến năm 2010 cho cả hai mô hình cạnh tranh.
MÔ HÌNH XU THẾ TUYẾN TÍNH • Mô hình xu hướng tuyến tính phù hợp với dữ liệu chuỗi thời gian có giá trị quan sát tăng, giảm một khoảng không đổi theo thời gian, Yt+1 – Yt = không đổi. • Tình huống: Chúng ta thể hiện xu thế về quy mô dân số Việt Nam trong giai đoạn 1990-2008; đồng thời dự báo dân số Viết Nam vào năm 2009 và 2010. • Trong file dữ liệu VietNam data.sav, dân số thể hiện qua biến popu.
MÔ HÌNH XU THẾ TUYẾN TÍNH • Bước 1. Khai báo thuộc tính dữ liệu chuỗi thời gian. Trong SPSS, Data / Define Dates • Nhập số 1990 vào khung Year (hình 17)
MÔ HÌNH XU THẾ TUYẾN TÍNH • Bước 2. Nhận dạng chuỗi thời gian (quá khứ) có xu hướng đường thẳng hay đường cong? Dùng phương pháp đồ thị để nhận dạng. • Trong SPSS: Analyze / Forecasting / Sequence Charts • Hình 18
MÔ HÌNH XU THẾ TUYẾN TÍNH • Hình 19 Hình 19 cho thấy có thể sử dụng đường thẳng để biểu diễn xu hướng phát triển của dân số.
MÔ HÌNH XU THẾ TUYẾN TÍNH • Bước 3. Lựa chọn mô hình xu thế và dự báo. • Trong SPSS: Analyze / Regression / Curve Estimation • Hình 20
MÔ HÌNH XU THẾ TUYẾN TÍNH
MÔ HÌNH XU THẾ TUYẾN TÍNH • Hình 21
MÔ HÌNH XU THẾ TUYẾN TÍNH • Bảng kết quả: • SPSS sẽ tạo mới thêm 4 biến: • FIT_1 giá trị ước lượng của dân số từ năm 1990 đến năm 2008 và giá trị dự báo cho năm 2009 và 2010 (giá trị nằm trên đường thẳng). • LCL_1 và UCL_1 cận dưới và cận trên của giá trị ước lượng (dự báo khoảng). • ERR_1 phần dư (chênh lệch giữa giá trị dự đoán và giá trị thực tế). • Theo mô hình xu hướng tuyến tính, dân số năm 2009 là 87,86 triệu, năm 2010 là 88,89 triệu người.
MÔ HÌNH XU THẾ TUYẾN TÍNH
MÔ HÌNH XU THẾ TUYẾN TÍNH
DỰ BÁO BẮNG MÔ HÌNH SAN BẰNG HÀM MŨ- WINTERS • Khi dự báo trong ngắn hạn, dữ liệu thường theo quý hoặc theo tháng. Nếu chúng ta thấy dữ liệu có yếu tố mùa vụ và có yếu tố xu thế tuyến tính thì ta có thể sử dụng mô hình Winter để dự báo. Tình huống: Dữ liệu về thu ngân sách theo quý của địa phương trong các năm 2000-2004(xem bảng). Chúng ta cần dự báo về tình hình thu ngân sách từng quý trong năm 2005 và 2006?
DỰ BÁO BẮNG MÔ HÌNH SAN BẰNG HÀM MŨ- WINTERS Bảng : Thu ngân sách của địa phương (tỷ VNĐ) Năm Quý 1 Quý 2 Quý 3 Quý 4 2001 48 58 57 65 2002 50 61 59 68 2003 52 62 59 69 2004 52 64 60 73 2005 53 65 60 75
DỰ BÁO BẮNG MÔ HÌNH SAN BẰNG HÀM MŨ- WINTERS • Nhập dữ liệu vào SPSS
DỰ BÁO BẮNG MÔ HÌNH SAN BẰNG HÀM MŨ- WINTERS • Lưu ý: trước khi phân tích, dữ liệu chuỗi thời gian bằng SPSS, chúng ta cần khai báo thuộc tính thời gian. Từ menu Data/Define dates chọn Years, quarters và nhập thông số như trong hình
DỰ BÁO BẮNG MÔ HÌNH SAN BẰNG HÀM MŨ- WINTERS Trong khung Data view sẽ xuất hiện thêm 3 cột dữ liệu mới
CÁC BƯỚC THỰC HIỆN (Bước 1) • Bước 1: nhận dạng mô hình (nhân tính hay cộng tính) Mô hình Winters được sử dụng nếu dữ liệu có yếu tố mùa vụ kết hợp nhân với yếu tố xu thế (mô hình Winters nhân tính, hình a) hoặc yếu tố mùa vụ kết hợp cộng với yếu tố xu thế (mô hình Winters cộng tính, hình b). Bằng đồ thị, chúng ta có thể nhận dạng được dữ liệu có yếu tố mùa vụ hay không, nếu có thì yếu tố mùa vụ hết hợp nhân hay cộng với yếu tố xu thế.
Hình a: Yếu tố xu thế kết hợp nhân với yếu tố mùa vụ
Hình b: Yếu tố xu thế kết hợp cộng với yếu tố mùa vụ
CÁC BƯỚC THỰC HIỆN (Bước 1) • Chúng ta dùng đồ thị để nhận dạng tính mùa vụ của dữ liệu “ngân sách” Từ menu chọn: Analyze Forecasting Sequence chart
Nhìn vào biểu đồ ta thấy dữ liệu có yếu tố mùa vụ (tính lặp lại sau mỗi năm); có thể diễn tả như sau: quý 1 thường có ngân sách thấp nhất, sau đó tăng mạnh vào quý 2, rồi giảm nhẹ vào quý 3, cuối cùng tăng mạnh trở lại vào quý 4. Có yếu tố xu thế tuyến tính tăng dần: ngân sách tăng theo thời gian.
•Chúng ta đang có 2 lựa chọn kế tiếp. Dự báo bằng mô hình xu thế kết hợp nhân với yếu tố mùa vụ (mô hình 1) hay mô hình xu thế kết hợp cộng với yếu tố mùa vụ (mô hình 2). Mô hình nào thích hợp hơn với dữ liệu của chúng ta?
MÔ HÌNH 1: XU THẾ KẾT HỢP NHÂN VỚI YẾU TỐ MÙA VỤ (BƯỚC 2) • Chọn công cụ san bằng hàm mũ Chọn Analyze Forecasting Create Models
Trong hộp thoại Time series modeler , tại ngăn Variables đưa biến cần dự báo (biến Ngansach) vào ô Dependent Vaviables, chọn Exponertal Smoothing ở khung Method, chọn Crteria để khai báo là mô hình nhân tính hay cộng tinh; sau đó, lần lượt chọn các ngăn và khai báo như các hình ở sau.
Khi chọn nút Criteria, hộp thoại Time Series Modeler: ExPonential Smoothing Criteria mở ra. Trong hộp thoại này, chọn Winter multiplicative (nếu là mô hình cộng tính thì chọn Winters addltive. Nhấn vào nút Continue để quay trở lại ban đầu.
Chọn ngăn Statistics, đánh dấu Root mean square error để tính RMSE của mô hình, đánh dấu chọn Display forecasts để thể hiện kết quả dự báo
Chọn ngăn Plots, đánh dấu vào Forecasts và Fit values để vẽ đường biểu diễn cả giá trị ước lượng và giá trị thực tế lên cùng một đồ thị để đánh giá độ chính xác của mô hình
Chọn ngăn Options, nhấp chọn First case after end of estimation period through a specified date, và nhập 2006 vào ô Year, nhập số 4 vào ô Quarter nếu chúng ta muốn dự báo đến quý 4 năm 2006
KẾT QUẢ DỰ BÁO CỦA MÔ HÌNH 1
KẾT QUẢ DỰ BÁO CỦA MÔ HÌNH 1
KẾT QUẢ DỰ BÁO CỦA MÔ HÌNH 1
NHẬN XÉT KẾT QUẢ DỰ BÁO TỪ MÔ HÌNH 1 • Ở bảng Model Statistics, RMSE bằng 1,024. Nếu chúng ta muốn lựa chọn mô hình tốt hơn từ các mô hình dự báo cạnh tranh thì chúng ta sẽ chọn mô hình có RMSE nhỏ hơn. Bảng Forecast cho thấy kết quả dự báo điểm và kết quả dự báo khoảng ở độ tin cậy 95%. Ví dụ, Quý 4 năm 2005, Ngân sách theo kết quả dự báo điểm sẽ là 76,7; nếu dự báo khoảng, Ngân sách dao động trong khoảng 74,6 đến 78,9. Quý 4 năm 2006 Ngân sách theo dự báo điểm sẽ là 78,6; nếu dự báo khoảng, Ngân sách sẽ dao động trong khoảng 75,7 đến 81,4
MÔ HÌNH 2: XU THẾ KẾT HỢP CỘNG VỚI YẾU TỐ MÙA VỤ • Chỉ có 1 khác biệt trong thao tác để xây dựng mô hình 2, đó là chọn Winter’s additive thay vì Winter’s multiplicate trong khung Time Series Modeler: Exponential Smoothing Criteria
KẾT QUẢ MÔ HÌNH 2
NHẬN XÉT KẾT QUẢ DỰ BÁO TỪ MÔ HÌNH 2 • Ở bảng Model Statistics, RMSE bằng 1,082. Bảng Forecast cho thấy kết quả dư báo điểm và kết quả dự báo khoảng ở độ tin cậy 95%. Ví dụ: quý 4 năm 2005, Ngân sách theo kết quả dự báo điểm sẽ là 76,5; nếu sử dụng dự báo khoảng, Ngân sách dao động trong khoảng từ 74,2 đến 78,8. Quý 4 năm 2006, Ngân sách theo kết quả dự báo điểm sẽ là 78,1; nếu sử dụng dự báo khoảng, Ngân sách dao động trong khoảng từ 74,9 đến 81,2 • Lựa chọn mô hình 1 hay mô hình 2? • Căn cứ vào giá trị RMSE giữa hai mô hình, mô hình có RMSE nhỏ hơn sẽ được chọn
Phương pháp Box-Jenkins (mô hình ARIMA)
MÔ HÌNH ARIMA •
MÔ HÌNH ARIMA ARIMA AR: tự hồ quy MA: trung bình trượt
MÔ HÌNH ARIMA • Mô hình tự hồi quy ( Yt = a + bYt-1 ) (độ trễ) T Yt Yt-1 1 Y1 2 Y2 3 Y3 4 Y4 . . . • Dạng tổng quát: Yp =  + 1Yt-1 + 2Yt-2 + + pYt-p + et
MÔ HÌNH ARIMA • Mô hình trung bình trượt: Yt = (Yt-1 + Yt-2)/2 T Yt Yt-1 Yt-2 1 Y1 2 Y2 Y1 3 Y3 Y2 Y1 4 Y4 Y3 Y2 5 Y5 Y4 Y3 . . • Dạng tổng quát: Yt =  - 1et-1 - 2et-2 - qet-q + et
XÁC ĐỊNH MÔ HÌNH ARIMA • Xác đinh mô hình ARIMA cũng có nghĩa là xác định xem những thời điểm có liên quan trong mô hình là thời điểm nào ? • Giá trị Yt có liên quan tới Yt-1, Yt-2 hay với Yt-p ? • Giá trị Yt có liên quan tới sai số et-1 et-2 , . Hay với et-q ? • P,d,q bằng bao nhiêu ?
CÁC BƯỚC CƠ BẢN MÔ HÌNH ARIMA • B1: kiểm tra dữ liệu có tính dừng hay không dừng? Có tính mùa vụ hay không mùa vụ? • B2: Xác định hàm tương quan (SAC/ACF) và hàm tự tương quan (SPAC/PACF). • B3: ước lượng tham số p,d,q của mô hình. • B4: Kiểm định mô hình. • B5: dự báo.
TÍNH DỪNG VÀ CÁCH XỬ LÝ • Tính dừng: để xác định mô hình ARIMA cho chuỗi thời gian trước hết dữ liệu phải có tính dừng, có nghĩa là dãy số có GTTB và phương sai không đổi theo thời gian ( chia ra các thời đoạn và lấy GTTB) • Xử lý: lấy sai phân (chênh lệch) • Zt = Yt - Yt-1
TÍNH MÙA VỤ VÀ CÁCH XỬ LÝ • Tính mùa vụ: Chuỗi thời gian có tính mùa vụ khi các giá trị trong chuỗi thời gian thay đổi theo chu kỳ và lặp đi lặp lại. VD: thu chi ngân sách, mùa du lịch hàng năm • Xử lý: lấy log hoặc xác định chu kỳ rồi lấy căn bậc theo chu kỳ xác định rối mới lấy sai phân để xác định tính dừng.
Chuỗi dữ liệu sau khi đã xử lý gọi là chuỗi làm việc (working series) và được dùng trong phân tích dự báo mô hình
DỰ BÁO GIÁ GẠO THEO MÔ HÌNH ARIMA
• Vẽ biểu đồ GRAPH (QUICK GRAPH) • Chọn Line & Symbol, Raw Data
Tính ACF và PACF của RICE • Quick Series Statistics Correlogram
Tính ACF và PACF của RICE Nhìn kết quả ACF Dữ liệu không dừng
• Lấy sai phân bậc 1 và tính lại ACF • Lấy sai phân bậc 1: tạo biến mới Ztgao= rice- rice(-1) Quick Generate Series .
XÁC ĐỊNH p,d,q của giá giạo • Giá gạo sau khi lấy sai phân bậc 1 thì dừng nên d = 1. Xđ p,q bằng cách coi xem • Nhìn vào biểu đồ ACF p = 1. biểu đồ và xác định độ trễ • Nhìn vào biểu đồ PACF q= 1. • Mục đích của xác định độ trễ của ACF và PACF để xem tự tương quan của thời điểm Yt và Yt- độ trễ. • Như vậy mô hình ARIMA của giá gạo là ARIMA (1,1,1)
VIẾT PHƯƠNG TRÌNH • Quick Estimate Equation pt ARIMA (1,1,1) (Ztgao c AR(1) MA (1) ) • Nếu ARIMA (4,1,1) Ztgao c AR(1) AR(2) AR(3) AR(4) MA(1) • Pt ARIMA(1,1,1) NHƯ SAU: • Ztgao = 0,024 + 0,249Zt-1 + 0,17et-1
KIỂM TRA ĐỘ THÍCH HỢP CỦA MÔ HÌNH (TINH NHIỄU TRẮNG) • Kiểm định tính nhiễu trắng tức là kiểm định phần dư giữa Y dự báo vào Y thực tế. Bằng cách chạy lại ACF và PACF của phần dư.
Nhìn vào cột Sig tại các độ trễ của phần dư (nếu Sig không có nghĩa thống kê có tính nhiễu trắng mô hình tốt). Nếu mô hình nào không thỏa mãn thì loại
DỰ BÁO • Ta có Ztgaof = Ytf - Yt-1 Ytf = Ztgaof + Yt-1
THANKS YOU