Luận văn Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian

68 trang hapham 5160

Download

Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

luan_van_mo_hinh_chuoi_thoi_gian_mo_trong_du_bao_chuoi_thoi.pdf

Nội dung text: Luận văn Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian

ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN NGUYỄN THỊ KIM LOAN MÔ HÌNH CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO CHUỖI THỜI GIAN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 Giáo viên hướng dẫn: TS. NGUYỄN CÔNG ĐIỀU THÁI NGUYÊN - 2009 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC MỞ ĐẦU 1 CHƢƠNG 1. CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN 5 1. Chuỗi thời gian và quá trình ngẫu nhiên 5 1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên 5 1.2. Quá trình ngẫu nhiên dừng 6 1.3. Hàm tự tƣơng quan 7 1.4. Toán tử tiến, toán tử lùi 8 2. Quá trình ARMA 9 2.1. Quá trình tự hồi quy 9 2.2. Quá trình trung bình trƣợt 11 2.3. Quá trình tự hồi quy trung bình trƣợt 13 3. Ƣớc lƣợng tham số mô hình ARMA 15 4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính 16 CHƢƠNG 2. LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ 23 1. Lý thuyết tập mờ 23 1.1. Tập mờ 23 1.2. Các phép toán trên tập mờ 25 2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ 30 2.1. Quan hệ mờ 30 2.2. Suy luận xấp xỉ và suy diễn mờ 31 3. Hệ mờ 33 3.1. Bộ mờ hoá 33 3.2. Hệ luật mờ 34 3.3. Động cơ suy diễn 35 3.4. Bộ giải mờ 36 3.5. Ví dụ minh hoạ 37 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
CHƢƠNG 3. MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN 39 1. Một số khái niệm 39 1.1. Định nghĩa tập mờ và chuỗi thời gian mờ 39 1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ 40 2. Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ 41 2.1. Mô hình thuật toán của Song và Chissom 41 2.2. Mô hình thuật toán của Chen 42 2.3. Thuật toán của Singh 43 2.4. Mô hình Heuristic cho chuỗi thời gian mờ 45 3. Ứng dụng trong dự báo chứng khoán 48 3.1. Bài toán chỉ số chứng khoán Đài Loan 48 3.2. Xây dựng chƣơng trình 60 KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 65 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỞ ĐẦU Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tích trong kinh tế, xã hội cũng như trong nghiên cứu khoa học. Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công cụ để phân tích chuỗi thời gian. Trong những năm trước, công cụ chủ yếu để phân tích chuỗi thời gian là sử dụng các công cụ thống kê như hồi qui, phân tích Furie và một vài công cụ khác. Nhưng hiệu quả nhất có lẽ là mô hình ARIMA của Box-Jenkins. Mô hình này đã cho một kết quả khá tốt trong phân tích dữ liệu. Tuy nhiên sự phức tạp của thuật toán đã gây khó khăn khi ứng dụng trong phân tích chuỗi số liệu, nhất là khi chuỗi số liệu có những thay đổi phản ánh sự phi tuyến của mô hình. Để vượt qua được những khó khăn trên, gần đây nhiều tác giả đã sử dụng mô hình chuỗi thời gian mờ. Khái niệm tập mờ được Zadeh đưa ra từ năm 1965 và ngày càng tìm được ứng dụng trong nhiều lĩnh vực khác nhau nhất là trong điều khiển và trí tuệ nhân tạo. Trong lĩnh vực phân tích chuỗi thời gian, Song và Chissom đã đưa khái niệm chuỗi thời gian mờ phụ thuộc vào thời gian và không phụ thuộc vào thời gian để dự báo. Chen đã cải tiến và đưa ra phương pháp mới đơn giản và hữu hiệu hơn so với phương pháp của Song và Chissom. Trong phương pháp của mình, thay vì sử dụng các phép tính tổ hợp Max- Min phức tạp, Chen đã tính toán bằng các phép tính số học đơn giản để thiết lập mối quan hệ mờ. Phương pháp của Chen cho hiệu quả cao hơn về mặt sai số dự báo và độ phức tạp của thuật toán. Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm 1993, hiện nay mô hình này đang được sử dụng để dự báo rất nhiều lĩnh vực trong kinh tế hay xã hội như trong lĩnh vực giáo dục để dự báo số sinh viên nhập trường, hay trong lĩnh vực dự báo thất nghiệp, trong lĩnh vực dân số, Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 1
chứng khoán và trong nhiều lĩnh vực khác như tiêu thụ điện, hay dự báo nhiệt độ của thời tiết Tuy nhiên xét về độ chính xác của dự báo, một số thuật toán trên còn cho kết quả chưa cao. Để nâng cao độ chính xác của dự báo, một số thuật toán cho moo hình chuỗi thời gian mờ liên tiếp được đưa ra. Chen sử dụng mô hình bậc cao của chuỗi thời gian mờ để tính toán. Sah và Degtiarev thay vì dự báo chuỗi thời gian đã sử dụng chuỗi thời gian là hiệu số bậc nhất để nâng cao độ chính xác. Đây cũng là một phương pháp hay được sử dụng trong mô hình Box-Jenkins để loại bỏ tính không dừng của chuỗi thời gian. Huarng đã sử dụng các thông tin có trước trong tính chất của chuỗi thời gian như mức độ tăng giảm để đưa ra mô hình heuristic chuỗi thời gian mờ. Trong thời gian gần đây, đề tài này vẫn luôn được một số tác giả nghiên cứu. Các hướng hiện nay vẫn là tập trung nâng cao độ chính xác dự báo của mô hình chuỗi thời gian mờ. Bài báo của I-Hong Kuo và các tác giả (2008) đưa ra phương pháp tăng độ chính xác của dự báo bằng tối ưu các phần tử đám đông (Particle swarm optimaization). Ching Hsue Cheng và các đồng tác giả (2008) mở rông nghiên cứu bằng các phương pháp kỳ vọng (Exspectation method) và Phương pháp lựa chọn mức (Grade Selection Method) thông qua các ma trận chuyển dịch có trọng. Ngoài ra hiện nay có xu hướng sử dụng kết hợp các phương pháp khác nhau với chuỗi thời gian mờ như phương pháp mạng Nơ ron như Cagdas H. Aladag (2008) hay Medey Khascay (2008). Ngay cả một nhà nghiên cứu sâu trong lĩnh vực này là Huarng cũng đã mở rộng theo hướng này từ năm 2006. Thuật toán di truyền cũng tìm được ứng dụng trong hướng nghiên cứu này. Năm 2007 có bài báo của Li-Wei Lee sử dụng mối quan hệ mờ và thuật toán di truyền để dự báo nhiệt độ và chỉ số tài chính của Đài Loan. Ngoài ra một số tác giả khác tìm những thuật toán khác đơn giản để dự báo như bài báo của Singh (2007) hay thuật toán dựa vào trend của chuỗi thời gian (Baldwin 2000). Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 2
Nghiên cứu dự báo chuỗi thời gian luôn là một bài toán gây được sự chú ý của các nhà toán học, kinh tế, xã hội học, Các quan sát trong thực tế thường được thu thập dưới dạng chuỗi số liệu. Từ những chuỗi số liệu này người ta có thể rút ra được những quy luật của một quá trình được mô tả thông qua chuỗi số liệu. Nhưng ứng dụng quan trọng nhất là dự báo khả năng xảy ra khi cho một chuỗi số liệu. Những thí dụ dẫn ra trong các bài báo đều đưa ra khả năng dự báo trong kinh tế như dự báo chỉ số chứng khoán, mức tăng dân số, dự báo nhu cầu sử dụng điện, dự báo số lượng sinh viên nhập học của một trường đại học Các thí dụ này đều có thể dẫn ra trong mỗi ngành kinh tế kỹ thuật. Như đã trình bày ở phần trên, có khá nhiều phương pháp dự báo chuỗi thời gian. Thông thường để dự báo, người ta sử dụng một công cụ khá mạnh của thống kê là mô hình ARIMA. Mô hình này thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính. Trong mỗi bộ chương trình xử lý số liệu đều có một phần để dự báo chuỗi thời gian. Nhưng đối với các chuỗi số liệu phi tuyến, nhất là trong số liệu kinh tế, sử dụng mô hình ARIMA kém hiệu quả. Chính vì vậy phải có những phương pháp khác nhau để xử lý chuỗi số liệu phi tuyến. Đã có nhiều người sử dụng công cụ mạng nơ ron để xử lý tính chất phi tuyên của chuỗi số liệu. Đây là một hướng đi đã được nhiều người tiếp cận và đã có những sách chuyên khảo về vấn đề này thí dụ như cuốn của Mandic và Chambers “ Recurrent neural network and prediction” in vào năm 2001. Một hướng đi khác là sử dụng khái niệm mờ để đưa ra thuật ngữ “ Chuỗi thời gian mờ”. Phương pháp sử dụng chuỗi thời gian mờ đã được đưa ra từ năm 1994 và đến nay vẫn đang được tiếp tục nghiên cứu để làm tăng độ chính xác của dự báo. Trong đề tài này em trình bày phương pháp dự báo chỉ số chứng khoán bằng công cụ chuỗi thời gian mờ đã được một số tác giả phát triển. Tư tưởng chính của phương pháp là sử dụng một số khái niệm của Huarng và Chen, Hsu để phát triển thuật toán mới. Dựa trên thuật toán đề ra, em đã tính toán một bài toán thực tế dựa trên dữ liệu lấy từ thị trường chứng khoán Đài Loan để kiểm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 3
chứng. Kết quả thu được rất khả quan. Độ chính xác của dự báo được nâng lên khá nhiều so với các thuật toán trước đây đề ra. Nội dung chính của luận văn nghiên cứu những khái niệm, tính chất và những thuật toán khác nhau trong mô hình chuỗi thời gian mờ để dự báo cho một số chuỗi số trong kinh tế xã hội, được trình bày trong 3 chương: Chương 1: trình bày các kiến thức cơ bản về chuỗi thời gian. Chương 2: trình bày Lý thuyết tập mờ và chuỗi thời gian mờ. Chương 3: trình bày một số thuật toán cơ bản trong chuỗi thời gian mờ và một số thuật toán cải tiến. Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS Nguyễn Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy. Tác giả xin chân thành cảm ơn các thầy giáo Viện công nghệ thông tin, khoa Công nghệ thông tin Đại học Thái Nguyên đã tham gia giảng dạy giúp đỡ em trong suốt qúa trình học tập nâng cao trình độ kiến thức. Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót. Tác giả rất mong các thầy cô giáo và bạn đóng góp ý kiến để đề tài được hoàn thiện hơn. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 4
CHƢƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN Trong phần này, chúng ta sẽ tìm hiểu về một lớp mô hình chuỗi thời gian hết sức thông dụng trong thực tế. Đó là mô hình quy trình trượt ARMA(Autoregressive Moving Average). Ta sẽ nghiên cứu các đặc trưng của quá trình ARMA, xem xét tổng quan về phương pháp ước lượng tham số của lớp mô hình này và cũng thấy rõ được hạn chế của nó khi áp dụng vào chuỗi thời gian tài chính. Ngoài ra, mô hình ARMA còn đóng vai trò quan trong như là cơ sở để xây dựng mô hình ARCH sau này. 1. Chuỗi thời gian và quá trình ngẫu nhiên Trước khi đi vào chi tiết tìm hiểu về mô hình ARMA, ta sẽ nhắc lại một số khái niệm liên quan đến chuỗi thời gian và quá trình ngẫu nhiên. Dù là ta đi vào chi tiết mô hình gì đi chăng nữa thì các khái niệm cơ bản này vẫn sẽ theo chúng ta trong suốt quá trình nghiên cứu về chuỗi thời gian. 1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2, xn} được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n. Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian. Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học phù hợp với tập dữ liệu cho trước X:={x1, x2, xn}nào đó. Để có thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể hiện của biến ngẫu nhiên Xt với t T. Ở đây T được gọi là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X:={x1, x2, xn} là thể hiện của quá Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 5
trình ngẫu nhiên Xt, t T. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên như sau Định nghĩa 1.1(Quá trình ngẫu nhiên) Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên Xt, t T được định nghĩa trên một không gian xác suất(, ,). Chú ý: Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ như là tập {1,2 } hay tập (- ,+ ). Tất nhiên cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhưng trong giới hạn của luận văn này ta chỉ xét cho trường hợp T R. Và thường thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện. 1.2. Quá trình ngẫu nhiên dừng Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai) Giả sử Xt, t Z là một quá trình ngẫu nhiên có var(Xt)< với mỗi t Z. Khi đó hàm tự hiệp phương sai của Xt được định nghĩa theo công thức sau:  x (r,s) : cov(X r , X s ) E[(X r EXr )(X s EXs)], với r, s Z. Định nghĩa 1.3 (Quá trình dừng) Chuỗi thời gian Xt, t Z được gọi là dừng nếu nó thoả mãn 3 điều kiện sau: 2 - E X t ,t Z - EX t m,t Z -  x (r, s)  x (r t, s t),t,r, s Z Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 6
Định lý 1.1 Nếu Xt, t Z là một quá trình dừng, và nếu như at R, i Z thoả mãn điều kiện  ai thì hệ thức Yt : ai X t-i ,t Z sẽ định nghĩa một quá dừng. i i Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, đừng theo nghĩa rộng hay dừng bậc hai. Tuy nhiên ở đây ta chỉ xem xét tính dừng theo nghĩa đã định nghĩa ở trên Khi chuỗi thời gian Xt, t Z là dừng thì yx (r,s)   x(r s,0),r,s Z, Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp phương sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng Xt, t Z ta có: y (h)   (h,0) Cov(X , X ),t,h Z x x t h t Hàm số y x (.) được gọi là hàm tự hiệp phương sai của Xt, còn x(h)là giá trị của nó tại “trễ” h. Đối với một quá trình dừng thì ta thường ký hiệu hàm tự hiệp phương sai bởi (.) thay vì x(.). Với một quá trình dừng thì hàm hiệp phương sai có các tính chất (0) 0, (h) (0), h Z Và nó còn là một hàm chẵn nghĩa là: (h) = (-h),h Z. 1.3. Hàm tự tƣơng quan Định nghĩa 1.4 Hàm tự tương quan của quá trình ngẫu nhiên Xt, t Z được định nghĩa tại trễ h như sau: (h): = (h)/(0):=corr(Xt+h,Xt), t, h Z Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 7
Chú ý: Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={xt, t = 1,2, n}của một chuỗi thời gian đừng nên về nguyên tắc ta không thể biết chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X. Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi công thức 1 1n h c(h) : n n  (x x)(x x),0 h n j 1 j j h n 1 Và c(h) : c( h),n h 0,trong đó x n  x j là trung bình mẫu. j 1 Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua hàm tự hiệp phương sai mẫu như sau: r(h) : c(h)/ c(0), h n. 1.4. Toán tử tiến, toán tử lùi Toán tử lùi B kết hợp với một quá trình ngẫu nhiên Xt, t Z là quá trình ngẫu nhiên Yt, t Z sao cho Yt : BX t : X t 1 Toán tử lìu B là toán tử tuyến tính va khả nghịch. Nghịch đảo của nó B-1:=F được gọi là toán tử tiến, định nghĩa bởi công thức: FXt :=Xt+1 Các toán tử B, F thoả mãn hệ thức n n B Xt = Xt-n, F Xt :=Xt+n Và n i n  aiB Xt  aiX i 0 i 0 t-i Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 8
Chú ý: Một cách tổng quát, người ta có thể định nghĩa các chuỗi theo toán tử tiến F hay toán tử lùi b và muốn thế chúng ta hạn chế trong trường hợp các quá trình là dừng. Khi đó, giả sử ta có quá trình dừng Xt, t Z và một dãy {ai ,i Z tuyệt đối khả tổng, tức là  a , thì định lý 1.1, quá trình i i i Yt : ai X t i ,t Z cũng là quá trình dừng. Ta ký hiệu ai B là ánh xạ đặt i i tương ứng quá trình dừng Xt, t Z với quá trình dừng Yt, t Z. Các chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tương tự như đối với chuỗi nguyên thông thường. Đặc biệt ta có thể thực hiện phép cộng, phép nhân hay phép lấy nghịch đảo. Điều này có vai trò quan trọng trong các phép biến đổi của đa thức tự hồi quy, đa thức trung bình trượt và các phép biến đổi xử lý chuỗi thời gian khác. 2. Quá trình ARMA 2.1. Quá trình tự hồi quy Định nghĩa 1.5 (Quá trình ồn trắng) Quá trình ngẫu nhiên t t Z được gọi là một ồn trắng, ký hiệu WN(0,2), khi nó thoả mãn các điều kiện sau: Ets = 0 (t s) 2 2 Et  Et 0,t Định nghĩa 1.6 (Quá trình tự hồi quy) Người ta gọi quá trình ngẫu nhiên Xt, t Z là một quá trình tự hồi quy cấp P, viết là Xt  AR(p), là một quá trình dừng {Xt, t Z} thoả mãn X a X a X a X  ,a 0 t 1 t 1 2 t 2 p t-p t p . Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 9
với {} là một ồn trắng. Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức X a X a X a X  ,a 0, t 1 t 1 2 t 2 p t-p t p Hay ở dạng toán tử p a(z): 1 a z a z2 a z 1 2 p ở đây a(z) được gọi là đa thức hồi quy. Chú ý: Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị ( z 1) thì Xt được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình nhân quả. Các đặc trưng của quá trình tự hồi quy cấp p: - E(Xt) = 0 p 2 -  (0) ai (i) |  t 1 p - (h)  a (h i) 0,h 0 i 1 i Lần lượt cho h = 1,2, .p ta được 1 (1) . (p-2) (p-1) (1) 1 . (p-3) (p-1) a (1) . . . 1 a (2) (p-2) . (p-3) 1 (1) 2 (p-1) (p -2) (1) 1 = a p 1 ( p 1) a p ( p) Hệ phương trình gọi là hệ phương trình Jule – Walker, song tuyến đối với a và . Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 10
Nghĩa là nếu cho ta sẽ tính được a và ngược lại cho a ta cũng sẽ tính được . Trong hệ phương trình Jule – Walker, nếu ta đặt pi = ai, i =1, p thì hệ phương trình Jule – Walker tương đương với ( j)  p1 ( j p), j 1, , p Đại lượng pp ở trên được gọi là tự tương quan riêng cấp p của quá trình {Xt, nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy cũng như việc ước lượng tham số mô hình tự hồi quy sau này. Trong việc thực tế, khi cho chuỗi quan sát X:= x1, t = 1,2 ,n thì ta dùng công thức của tương quan mẫu để tính các r(i), là các giá trị xấp xỉ của (i). Khi đã có các tự tương quan mẫu ta thay vào hệ phương trình Jule – Walker và giải nó để tìm các tham số a1. Từ đây ta cũng xác định được tương quan riêng p1 .,pp. 2.2. Quá trình trung bình trƣợt Định nghĩa1.7 (Quá trình trung bình trƣợt) Một quá trình trung bình trượt cấp q, ký hiệu Xt MA(q), là một quá trình Xt, t Z thoả mãn biểu thức X  b  b  ,b b , ,b R,b 0 t 1 1 t 1 q t q 1 2 q q với t là một ồn trắng. Ta cũng có thể viết biểu thức trung bình trượt ở trên dưói dạng toán tử lìu tương tự như đối với quá trình tự hồi quy như sau : Xt = b(B)t, Trong đó hàm b(.) định nghĩa bởi q. b(z) : = 1+b1z+ +bqz Ở đây b(z) được gọi là đa thức trung bình trượt . Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 11
Chú ý: Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình MA mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1. Và với giả thiết t là ồn trắng thì theo định lý 1.1 ta có b(z)(z) = 1. Và khi đó 1 có thể biểu diễn dưới dạng j    X ; (z)   z ;   t j j t j j j j j Một chú ý nữa, cũng giống như trường hợp AR, nếu đa thức trung bình trượt b(z) không có nghiệm có môđun bằng 1 thì ta có thể biểu diễn Xt dưới dạng sau: X t  j X t j  t ;  j j 1 j Và có thể xác định  i bằng cách chia 1(theo luỹ thừa tăng) cho b(z), ( 0 1) Khi quá trình Xt có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có nghiệm có môđun lớn hơn 1 thì ta nói Xt là một quá trình khả nghịch. Và từ nay về sau, nếu không nói gì thêm thì khi nói về các quá trình AR và MA chúng ta hiểu đó là các quá trình nhân quả và khả nghịch. Các đặc trưng của quá trình trung bình trượt: Trước hết, ta dễ dàng thấy rằng EX t 0, Và 2  ,s t 2 E(Xtt )  b ,s t i;1 i q 1 0,s Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 12
Mặt khác ta có:  (h): E(X X ) E(X ( b  b  )) t t h t t h 1 1 h 1 q 1 h q Từ đó ta suy ra 2  (h)  (b b b b bq),b : 1;1 h q h 1 h 1 q h 0  (h) 0,h q Đặc biệt ta có  (0): var X  2(1 b2 b2 t 1 q Từ công thức hiệp sai của quá trình trung bình trượt ta suy ra công thức của tự tương quan như sau: b b b b b h 1 h 1 q h q ,h 1,2 q 1 b2 b2 (h) 1 q 0, h. q 2.3. Quá trình tự hồi quy trung bình trƣợt Định nghĩa 1.8 (quá trình tự hồi quy trung bình trượt) Một quá trình Xt, t Z được gọi là quá trình tự hồi quy trung bình trượt cấp p,q , kí hiệu Xt  ARMA(p,q) là một quá trình Xt, t Z thỏa mãn Xt a X apXt p t b  1 t 1 1 t 1 bqt q,a1,a2, ap,b1,b2, ,bq R,ap 0,bq 0 Trong đó t là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa thức trung bình trượt có bậc tương ứng là p và q: a(z): 1 a z a z p 1 p b(z): 1 b z b z q 1 q Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 13
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau a(B)Xt b(B)t Định nghĩa 1.9 (Quá trình nhân khả nghịch) Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện: i) a(z) và b(z) không có nghiệm chung ii) a(z) và b(z) không có nghiệm có môđun không vượt quá 1 Chú ý: Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức toán tử, ta có thể biểu diễn một quá trình Xt   , 1;  . i 0 i t i 0 i 1 i Và có thể tính các hệ số t bằng cách chia theo lũy thừa tăng a(z) cho b(z). Các đặc trưng của quá trình ARMA: Trước hết ta có p q  (h) E(Xt X )  a  (h i)  (h)  b  (h i) t h t 1 1 .X i 1 i .X Với  (k): E( X .X t t k Mặt khác ta có thể biểu diễn X   t k i 0 i t k i Và ta có 0,k 0  (k) e.X  2,k 0 k Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 14
Lần lượt cho h = 0,1, p trong các chương trình trên và chú ý đến tính chẵn của hàm (h) ta có hệ phương trình tuyến tính đối với (0), , (p) hay với (1), (p). p  (h)  ai (h i),h q i 1 Và vì thế p (h)  a (h i),h q. i 1 i 3. Ước lượng tham số mô hình ARMA Giả sử ta cần ước lượng các tham số của mô hình ARMA(p,q) Xt a1Xt 1 a p Xt p t b1t 1 bqt q,a1,a2, , a p,b1,b2, , bq R,a p 0,bq 0, trong đó t đóng vai trò là sai số. Đối với mô hình ARMA cũng có nhiều phương pháp ước lượng tham số hiệu quả và được nêu ra chi tiết trong P.Brockwell, R. David, 2001. Dưới đây, ta sẽ xem xét phương pháp bình phương cực tiểu theo kiểu thuật toán Hannan – Rissanen. Ý tưởng của thuật toán này là sử dụng hồi quy tuyến tính để ước lượng các tham số. Nếu q>0 ta còn phải ước lượng các giá trị chưa biết . Thuật toán Hannan – Rissanen Bước 1: Dùng ước lượng Yule Walker để ước lượng các tham số mô hình AR(m), với m > max(p,q). X a X a X  , t m 1, ,n. t 1 t 1 m t m t Bước 2: Ước lượng vecto tham số  (a , , a ,b ,b )t trên cơ sở cực tiểu 1 p 1 q hóa hàm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 15
n 2 S ()  (xt a x a x apxt p b  bqt q) theo . t m q 1 1 t 1 2 t 2 1 t 2 Giải hệ Gauss-Markov, kết quả thu được ở dạng sau:  t 1 t  (Z Z) Z Xn, Ta cũng có thể dùng phương pháp trực giao hóa Househoder để tìm Ở đây, X (X , , X ) n m 1 q n Và X X X    m q m q 1 m q 1 p m q m q 1 m 1 X Xm q X  m q  Z m q 1 m q 2 p m q 1 m 2       X X X    n 1 n 2 n p n 2 n 2 n q Ước lượng phương sai  t theo công thức  2 S()  HR . n m q 4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính Mô hình ARMA thu được thành công lớn khi áp dụng cho các chuỗi thời gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhưng thất bại khi áp dụng cho các chuỗi thời gian kinh tế và tài chính. Nguyên nhân chính là giả thiết về mặt toán học phương sai của các chuỗi thời gian tài chính không thay đổi theo thời gian là không phù hợp. Và vì vậy mô hình ARMA có thể dự báo được kỳ vọng nhưng thất bại khi dự báo phương sai của chuỗi thời gian tài chính. Sau đây ta sẽ xem xét một ví dụ cụ thể để thấy rõ sự không phù hợp của mô hình ARMA đối với chuỗi thời gian tài chính. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 16
Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán giao dịch hằng ngày trên thị trường NewYork từ tháng ngày 02/01/1990 đến ngày 31/12/2001. Chuỗi gồm 3028 số liệu được lưu dưới tên file là NYSE.txt. Tuy nhiên thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc rồi lấy lại sai phân của nó để được một chuỗi mới mà trong lĩnh vực kinh tế tài chính ta gọi là chuỗi tăng trưởng. Từ số liệu ở trên, chuỗi giá và chuỗi tăng trưởng được minh họa bằng đồ thị sau Hình 1.1 Chuỗi giá Hình 1.2 Chuỗi tăng trưởng Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng. Ngược lại, chuỗi tăng trưởng có đồ thị rất giống với một quá trình dừng. Khi nhìn vào đồ thị của chuỗi tăng trưởng ta cũng thấy có xuất hiện những cụm biến động, có vùng biến đổi về phương sai của chuỗi thời gian. Tiếp theo ta sẽ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 17
khai thác đặc trưng tương quan riêng mẫu của chuỗi tăng trưởng ở trên. Kết quả được minh họa bằng đồ thị sau: Hình 1.3 Tự tương quan của chuỗi tăng trưởng Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng Ta thấy rằng tương quan riêng của chuỗi tăng trưởng biến đổi trong một khoảng tương đối hẹp khá giống với tự tương quan riêng của một quá trình dừng. Tuy nhiên ta lại không thấy được dấu hiệu triệt tiêu của tự tương quan riêng mặc dù ta đã lấy đến trễ 100. Điều này cho thấy cho chuỗi tăng trưởng chắc chắn không thể là một quá trình tự hồi quy. Ta cũng biết rằng, về mặt lý thuyết có thể xấp xỉ mô hình AR nhiều tham số bằng mô hình ARMA với ít tham số hơn. Điều này cũng cho thấy mô hình ARMA nhiều khả năng không phù hợp với chuỗi tăng trưởng của chúng ta. Bây giờ ta lấy bình phương chuỗi tăng trưởng, kết quả cho bởi đồ thị dưới đây Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 18
Hình 1.5 Bình phương chuỗi tăng trưởng Nhìn vào đồ thị ta có thể ta có thể thấy được việc tạo thành các cụm biến động trong đó các thời kỳ và biến động mạnh xen kẽ nhau. Ta tính tiếp các đặc trưng mẫu của bình phương chuỗi tăng trưởng. Kết quả được thể hiện bằng các đồ thị sau Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng Mặc dù chuỗi tăng trưởng ít tương quan nhưng bình phương của nó lại thể hiện sự tương quan mạnh. Những dấu hiệu đó cho ta thấy rằng mô hình ARMA không thực sự phù hợp với chuỗi thời gian qua sát này. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 19
Bây giờ giả sử bằng cách nào đó ta tìm được mô hình ARMA gần nhất với chuỗi quan sát và đó là mô hình ARMA(1,1). Mục đích ở đây là chúng ta sẽ thấy rõ ràng sau khi ước lượng, nhiễu thu được sẽ không phải là một ồn trắng như ta mong muốn nữa. Thật vậy, kết quả ước lượng theo mô hình ARMA(1,1) là y 0.00049332  t t Nhiễu khi đó được tính toán và biểu diễn bởi đồ thị sau Hình 1.8 Nhiễu Khi đó tự tương quan và tự tương quan riêng của nhiễu cho bởi đồ thị dưới đây Hình 1.9 Tự tương quan của nhiễu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 20
Hình 1.10. Tự tương quan riêng của nhiễu Ban đầu, do tính ít tương quan của nhiễu ước lượng được nên ta thấy nó giống với một quá trình ồn trắng. Tuy nhiên khi lấy bình phương nhiễu ta lại thấy khác Hình 1.11. Bình phương nhiễu Hình 1.12 Tự tương quan bình phương nhiễu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 21
Hình 1.13 Tự tương quan riêng bình phương nhiễu Rõ ràng là nhiễu có hiện tượng tạo cụm biến động giống như chuỗi tăng trưởng ban đầu. Còn khi nhìn vào đồ thị tự tương quan của bình phương nhiễu ta thấy nó thể hiện sự tương quan mạnh nên ta có thể kết luận rằng nhiễu không phải là một ồn trắng như mong muốn. Và như vậy mô hình ARMA sẽ không phù hợp với chuỗi số liệu này. Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài chính nhưng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins. Chính Box-Jenkins là những người đầu tiên đưa ra các kỹ thuật lấy sai phân để khử khuynh tất định nhằm tăng khả năng dừng của một chuỗi thời gian. Với những vận dụng sáng tạo khái niệm khuynh này, những người nghiên cứu đi sau Box-jenkins đã cho ra đời hai lớp mô hình rất quan trọng đối với chuỗi thời gian tài chính. Đó là mô hình cộng tích, Cointegration (Granger,1981) và mô hình tự hồi quy biến động bất thường của chuỗi thời gian tài chính. Mô hình ARCH là cống hiến mang tính khai phá của Engle, nó có thể giải thích sự bất thường của phương sai mà chỉ sử dụng những thông tin quá khứ của bản thân nhiễu. Mô hình GARCH (Generalized Autoregressive Conditional Heteroschedasticity) đầu tiên được giới thiệu bởi Tim Bollerslev năm 1986 đã làm cho lớp mô hình này có nhiều ứng dụng thực tế hơn trong lĩnh vực kinh tế tài chính. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 22
CHƢƠNG 2 LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ Trong các bộ môn toán cơ bản, chúng ta đã rất quen thuộc với suy luận logic nguyên thuỷ hay logic rõ với hai giá trị đúng/sai hay 1/0. Tuy nhiên, các suy luận này không đáp ứng được hầu hết các bài toán phức tạp nảy sinh trong thực tế như những bài toán trong lĩnh vực điều khiển tối ưu, nhận dạng hệ thống, mà các dữ liệu không đầy đủ, không được định nghĩa một cách rõ ràng. Trong những năm cuối thập kỷ 20, một ngành khoa học mới đã được hình thành và phát triển mạnh mẽ đó là hệ mờ. Đây là hệ thống làm việc với môi trường không hoàn toàn xác định, với các tham số, các chỉ tiêu kinh tế kỹ thuật, các dự báo về môi trường sản xuất kinh doanh chưa hoặc khó xác định một cách thật rõ ràng, chặt chẽ. Khái niệm logic mờ được giáo sư Lofti A.Zadeh đưa ra lần đầu tiên vào năm 1965 tại Mỹ. Từ đó lý thuyết mờ đã được phát triển và ứng dụng rộng rãi. Trong chương này chúng ta tập trung trình bày một số kiến thức cơ bản về hệ mờ có liên quan tới mô hình mà chúng ta sẽ nghiên cứu. 1. Lý thuyết tập mờ 1.1. Tập mờ Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω được xác định bởi hàm thuộc( membership function): A: Ω [0,1] 0 A(x) 1 A(x) : Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A (để cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm A(x)) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 23
Khoảng xác định của hàm A(x) là đoạn [0,1], trong đó giá trị 0 chỉ mức độ không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn. Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” được a(x 1)2 định nghĩa như sau: A(x) = e Hình 2.1. Hàm liên thuộc của tập mờ “x gần 1” Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác x a c x Triangle(x, a, b, c) = max(min( ,1, ),0) b a c b x a d x Trapezoid(x, a, b, c ,d) = max(min( ,1, ),0) b a d c (x c))2 Gaussian(x, ,c,)= e  1 Bell(x, a, b, c) = x c 2b 1 a Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 24
Hình 2.2. Một số dạng hàm liên thuộc của tập mờ 1.2. Các phép toán trên tập mờ 1.2.1 Phép bù của tập mờ Định nghĩa 1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn các điều kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function). Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần bù Ac của tập mờ A là một tập mờ với hàm thuộc được xác định bởi: Ac(x) = n(A(x)), với mỗi x  1.2.2. Phép giao hai tập mờ Định nghĩa 3( T - chuẩn): Hàm T: [0,1]2 [0,1] là phép bội (T - chuẩn) khi và chỉ khi thoả mãn các điều kiện sau: 1.T(1, x) = x, với mọi 0 x 1. 2.T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1. 3. T không giảm: T(x,y)=T(u,v), với mọi x u, y v. 4. T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z 1. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 25
Định nghĩa 4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng không gian nền  với hàm thuộc A(x), B(x) tương ứng. Cho T là một T- Chuẩn. Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (ATB)) trên  với hàm thuộc cho bởi biểu thức: (ATB)(x) = T(A(x), B(x)), với mỗi x  Ví dụ: - Với T(x,y)=min(x,y)ta có: (ATB)(x) = min(A(x),B(x)) - Với T(x,y) = x,y ta có (ATB)(x) = A(x).B(x) (tích đại số) Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây: - Hình a: Hàm thuộc của hai tập mờ A và B - Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y) - Hình c: Giao của hai tập mờ theo T(x,y)=x.y Hình 2.3. Giao của hai tập mờ 1.2.3. Phép hợp hai tập mờ Định nghĩa 5 (T - đối chuẩn): Hàm S:[0,1]2 được gọi là phép tuyển ( T-đối chuẩn) nếu thoả mãn các điều kiện sau: 1. S(0,x) = x, với mọi 0 x 1. 2. S có tính giao hoán : S(x,y)= S(y,x) với mọi 0 x , y 1. 3. S không giảm: S(x,y)= S(u,v), với mọi x u, y v. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 26
4. S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0 x, y, z 1. Định nghĩa 6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng không gian nền  với hàm thuộc A(x), B(x) tương ứng. Cho S là một T - đối chuẩn. Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu ASB)) trên  với hàm thuộc cho bởi biểu thức: (ASB)(x)=S(A(x),B(x)), với mỗi x  Ví dụ: - Với S(x,y) = max(x,y): (ASB)(x)= max(A(x), B(x)) - Với S(x,y) = x + y – x.y: (ASB)(x)= A(x) + B(x) – A(x) .B(x) - Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây: - Hình a: Hàm thuộc của hai tập mờ A, B - Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y) - Hình c: Hợp của hai tập mờ theo S(x,y) = x + y – x.y Hình 2.4. Phép hợp của hai tập mờ 1.2.4. Luật De Morgan Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh. Khi đó bộ ba(T, S,n) là bộ ba De Morgan nếu: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 27
n(S(x,y)) = T(n,(x),n(y)) Với phép phủ định n(n-1) = 1- x, chúng ta có một số cặp T-chuẩn và T-đối chuẩn thoả mãn luật DeMorgan trong bảng 2.1 STT T(x,y) S(x,y) 1 Min(x,y) Max(x,y) 2 x.y x+ y – x.y 3 Max(x + y -1, 0) Min(x + y,1) min(x,y)if x + y >1 max(x,y)if x + y <1 Min0(x,y)= Max1(x,y)= 0 0 4 Else ElsElsee 5 min(x,y)if max(x,y)=1 min(x,y)=0 Z(x,y) = Max1(x,y)= 0 Else Else 6 x.y x y (2  )x.y H (x, y) , y 0 H (x, y) , y 0  (1  )(x y xy) 1 (1  )x.y 1 7 P P P P P Y (x, y) 1 min 1,(1 x)  , p 0 YP (x, y) min(1, x y , p 0 Bảng 2.1 : Các cặp T - chuẩn và T - đối chuẩn. 1.2.5. Phép kéo theo Cho (T, S, n) là một bộ ba De Morgan với n là phép phủ định, 2 phép kéo theo lS(x,y) hay x y được xác định trên khoảng [0,1] được định nghĩa bằng biểu thức sau đây: lS(x,y) = S(T(x,y),n(x)) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 28
Bảng 1.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất. STT Tên Biểu thức xác định 1 Early Zadeh x y = max(1-x,min(x,y)) 2 Lukasiewicz x y = min(1,1- x+y) 3 Mandani x y = min(x,y) 4 Larsen x y = x.y if x y 5 Standard Strict x y = 1 0 other if x y 6 Godel 1 x y = y other if x y 7 Gaines 1 x y = y other x 8 Kleene – Dienes x y = max(1 –x,y) Kleene – Dienes – x y = 1- x + y 9 Lukasiwicz 10 Yager x y = yx Bảng 2.2. Một số phép kéo theo mờ thông dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 29
2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ 2.1. Quan hệ mờ 2.1.1. Khái niệm về quan hệ rõ Định nghĩa 7: Cho X , Y , R X Y là một quan hệ ( quan hệ nhị nguyên rõ), khi đó 1 if(x,y) (x,y) R ( xRy) R(x,y) = 0 if (x,y) R y)( xR Khi X= Y thì R  X Y là quan hệ trên X Quan hệ R trên X được gọi là: - Phản xạ nếu: R(x,x) = 1 với x X - Đối xứng nếu: R(x,y) = R(y,x) với x, y X - Bắc cầu nếu: (xRy)(yRz) (xRz) với x,y,z X Định nghĩa 8: R là quan hệ tương đương nếu R là quan hệ nhị nguyên trên X có tính chất phản xạ, đối xứng và bắc cầu. 2.1.2. Các quan hệ mờ Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn ( suy luận xấp xỉ) mờ. Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ đem lại hiệu quả lớn trong thực tế, mô phỏng được một phần suy nghĩ của con người. Chính vì vậy, mà các phương pháp mờ được nghiên cứu và phát triển mạnh mẽ. Tuy nhiên chính logic mờ mở rộng được nghiên cứu và phát triển mạnh mẽ. Tuy nhiên chính logĩ mờ mở rộng từ logic đa trị, do đó nảy sinh ra rất nhiều các quan hệ mờ, nhiều cách định nghĩa các toán tử T-chuẩn, T-đối chuẩn, cũng như các phương pháp mờ hoá, khử mờ khác nhau, Sự đa dạng này đòi hỏi người ứng dụng phải tìm hiểu để lựa chọn phương pháp thích hợp nhất cho ứng dụng của mình. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 30
Định nghĩa 9: Cho U  ; V ; R là một tập mờ trên U V gọi là một quan hệ mờ( quan hệ hai ngôi). 0 R (x,y) =  R(x,y) 1 Tổng quát: RU1 U2 Un là quan hệ n ngôi 0 R(u1, u2, un) = R(u1, u2, un) 1 2.1.3. Các phép toán của quan hệ mờ Định nghĩa 10: Cho R là quan hệ mờ trên X Y, S là quan hệ mờ trên Y Z, lập phép hợp thành SoR là quan hệ mờ trên X Z Có R(x,y) với (x,y) X Y, S(y,z) với (y,z) Y Z. Định nghĩa phép hợp thành: Phép hợp thành max – min xác định bởi: (S  R)(x,z) = Sup (min(R(x,y),S(y,z))) (x,z) X Z y Y Phép hợp thành max – prod xác định bởi: (S R)(x,z) = (min(R(x,y) S(y,z))) (x,z) X Z Phép hợp thành max – T ( với T là T - chuẩn) xác định bởi: (S TR)(x,z) = (T(R(x,y) , S(y,z))) (x,z) X Z 2.2. Suy luận xấp xỉ và suy diễn mờ Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình suy ra những kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc , các luật, các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định. Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận: Định lý: “Nếu một hàm số là khả vi thì nó liên tục” Sự kiện: Hàm  khả vi Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 31
Kết luận: Hàm  là liên tục Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens. Căn cứ vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó có thể suy rộng cho logic mờ. Gọi  là không gian tất cả các hàm số, ví dụ  ={g:R R}. A là các tập các hàm khả vi, B là tập các hàm liên tục. Xét hai mệnh đề sau: P=’g A’ và Q =’g B’. Khi đó ta có: Luật (tri thức): P Q Sự kiện: P đúng (True) Kết luận: Q đúng (True) Xét bài toán suy luận trong hệ mờ Hệ mờ n biến vào x1, xn và một biến ra y Cho Un, i= n n là các không gian nền của các biến vào , V là không gian nền của biến ra. Hệ được xác định bởi m luật mờ” R1: Nếu x1 là A11và x2 và .xn là A1n thì y là B1 R2: Nếu x1 là A21 và x2 là A22 và xn là A2n thì y là B2 Rm: Nếu x1 là Am1 và x2 là Am2 và xn là Amn thì y là Bm Thông tin đầu vào: X1 là A01 và x2 là A02 và .x0n là A0n Tính: y là B0 Trong đó biến mờ ji, i 1,n,j 1,m xác định trên không gian nền U, biến mờ Bj, (( j 1,n) xác định trên không gian nền V. Để giải bài toán này chúng ta phải thực hiện qua các bước sau: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 32
1. Xác định các tập mờ của các biến đầu vào. 2. Xác định độ liên thuộc tại các tập mờ tương ứng. 3. Xác định các quan hệ mờ R(A.B)(u,v). 4. Xác định phép hợp thành. Tính B’ theo công thức: B’ = A’R(A,B)(u,v). 3. Hệ mờ Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ hoá, hệ luật mờ, động cơ suy diễn mờ và bộ giải mờ như hình 2.5 dưới đây Hệ luật mờ (Fuzzy Rule Base) Đầu vào rõ Các tập mờ Các tập mờ Bộ giải hoá Đầu ra rõ Bộ mờ hoá Động cơ suy diễn mờ (Dauzzifier) (Fuzzy Interence Engine) đầu vào đầu vào Hình 2.5 Cấu hình cơ bản của hệ mờ Không làm mất tính tổng quát, ở đây ta chỉ xét hệ mờ nhiều đầu vào, một đầu ra ánh xạ tập compact S  Rn vào R. Các thành phần của hệ mờ được miêu tả như sau. 3.1. Bộ mờ hoá Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác định trong S được cho bởi hàm thuộc  : S [0,1]. Bộ phận này có chức năng chính dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong S U (U là không gian nền). Có hai phương pháp mờ hoá như sau: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 33
 Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc được định nghĩa như sau 1 if x = xi A(x) = 0 if x xi  No – Singleton fuzziffier: Với các hàm liên thuộc nhận giá trị lớn nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các giá trị dịch chuyển x x1. 3.2. Hệ luật mờ Gồm nhiều mệnh đề dạng: IF THEN Giả sử hệ luật gồm M luật Rj (j= 1, M ) dạng j j j R : IF x is A and x is A and x is A THEN y is B 1 i 2 2 n n Trong đó xi (i =1,n ) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ j j mờ - các biến ngôn ngữ, Ai là các tập mờ trong các tập đầu vào X và B là các tập mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất nhớ”, “nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,)đặc trưng bởi các hàm thuộc j  và  . Khi đó R là một quan hệ mờ từ các tập mờ đầu vào X = X1 A j B j i X2 Xn tới các tập mờ đầu ra Y. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 34
3.3. Động cơ suy diễn Đây là một bộ phận logic đưa ra quyết định sử dụng hệ mờ để thực hiện ánh xạ từ các tập mờ trong không gian đầu vào X thành tập mờ trong không gian đầu ra Y. Khi Rj là một quan hệ mờ, thì Rj có thể là một tập con của tích T Decart X Y = (x , y) : x X , y Y , với x (x1 , x2, , xn ) . Vì vậy, quan hệ Rj là một hàm ánh xạ từ tập mờ trong X tới tập mờ trong j j j j Y, A xA  A B được gọi là một dạng suy diễn mờ( để cho gọn, ta ký hiệu 1 2 n j j j j A xA  A A = 1 2 n ) Giả sử A là một tập mờ trong X và là đầu vào của bộ suy diễn. Khi đó mỗi luật Rj tạo ra một tập mờ Bj trong Y như sau: Bj = A  Rj = sup (A*Rj) Với * là một toán tử T - chuẩn được định nghĩa trong bảng 2.1. Do tính kết hợp, ta có thể định nghĩa: T2(x,y) = T(x,y) T3(x,y,z) = T(x,T2(y,z)) với 0 x, y, z 1 Dùng quy nạp ta định nghĩa: n n-1 T (x1,x2, , .xn) = T(x1, T (x2, xn)) với 0 xi 1 Quan hệ Rj được định nghĩa thông qua hàm phụ thuộc sau:  ( x , y)  ( x , y) T( ( x ), (y))) R j A B j A j B j n T(T ( (x ), , (xn)), (xn)) A j 1 Ai An 1 n Và hàm liên thuộc của tập A là Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 35
 (x) T n ((x ), (x ),  (x )) A 1 A2 2 An n Do đó, hàm liên thuộc của tập mơg đầu ra được tính như sau:  (y) sup  ( x )*  ( x , y)  Bj A j x U R 3.4. Bộ giải mờ Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị rõ ràng trong R. Có nhiều phép giải mờ, với mỗi ứng dụng sẽ có một phương thức giải mờ khác nhau tuỳ thuộc yêu cầu ứng dụng. Dưới đây sẽ liệt kê một số phương thức giải mờ thông dụng.  Phương pháp độ cao: M j j  y  (y ) B' j y ( x ) i 1 h M j   (y ) i 1 B' j Với j là chỉ số luật , y-j là điểm có độ liên thuộc lớn nhất trong ’ j tập mờ đầu ra B j , thứ j và  (y ) được tính theo công thức B, j như sau: j j  (y )  (y )* (x' )* (x' )* * (x' ) j j A 1 A 2 A n B' B 1 2 n  Phương pháp độ cao biến đổi: M j j j2  y  (y ) / B' j y ( x ) i 1 mh M j j2   (y ) / i 1 B' j với  j hệ số biến đổi của luật j Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 36
 Phương pháp trọng tâm N  yiB (yi ) y ( x ) i 1 c N   (y ) i 1 B i  Phương pháp tâm của các tập (Center – of – Sets): phương pháp này mỗi luật được thay thế bởi tập singleton tâm cj M j n  c T  (x ) i 1 A j i i 1 i ycos ( x ) M n  T  (x ) i 1 A j i i 1 i 3.5. Ví dụ minh hoạ Xét hệ mờ với hai luật mờ và các hàm liên thuộc của các tập mờ đầu vào, đầu ra như biểu diễn tại hình 1.6. Mỗi luật mờ có hai đầu vào hình a1, a2, b1,b2 và một đầu ra hình a3, b3. Giả sử chúng ta thử nghiệm với hai giá trị đầu vào là x1 = 0.15 và x2 = 0.5, sử dụng dạng T-chuẩn MIN(T(x,y) = x.y)tính được tổng hợp của các tập mờ phía IF và phía THEN hình (d). Sử dụng T- đối chuẩn cho tất cả các đầu ra như hình (e). - Phương pháp độ cao: 0.8 0.5 0.1 1 y 0.5556 h 0.8 0.1 - Phương pháp độ cao biến đổi: giả sử 1 = 0.4 và 2 =0.2. Ta có : (0.8 0.5) 0.1 1 2 2 y 0.4 0.2 0.6667 h 0.8 0.1 0.42 0.22 - Phương pháp trọng tâm: 0.8 0.6 0.1 0.9 y 0.6333 h 0.8 0.1 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 37
Hình 2.6. Minh hoạ các phương pháp giải mờ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 38
CHƢƠNG 3 MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN 1. Một số khái niệm 1.1. Định nghĩa tập mờ và chuỗi thời gian mờ Giả sử U là không gian nền. không gian nền này xác định một tập hợp các đối tượng cần nghiên cứu. Nếu A là một tập con rõ của U thì ta có thể xác định chính xác một hàm đặc trưng: 0 nếu x nằm ngoài A  A(x) = 1 nếu x nằm trong A Nhưng với một tập mờ B trong không gian nền U thì phần tử x không xác định chính xác được. Khi đó ta có định nghĩa: A : U [0.1] A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A. Giả sử Y(t) là chuỗi thời gian (t = 0, 1, 2, ) U là tập nền chứa các khoảng giá trị của chuỗi thời gian từ nhỏ nhất đến lớn nhất. Xác định hàm thuộc A : U [0.1] của tập mờ A, còn tập A trên không gian nền U được viết như sau: A = {( A (u1 / u1, A (u2 / u2, A (un / un),: ui U; I = 1, 2, , n} A (ui) là độ thuộc của ui vào tập A hay cách viết khác: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 39
A (u ) A (u ) A (u ) A = 1 2 n u1 u 2 u n 1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ Định nghĩa 1: 1 Y(t) (t = 0, 1, 2, ) là một tập con của R . Y(t) là tập nền trên đó xác định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (I = 1, 2, ) khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t). Định nghĩa 2: Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là kí hiệu của một toán tử xác định trên tập mờ. R(t-1, t) là mối quan hệ mờ. Ta cũng có thể kí hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1) F(t). Nếu đặt F(t-1) = Ai và F(t) = Aj thì ta kí hiệu mối quan hệ logic mờ giữa chúng như sau: Ai Aj. Định nghĩa 3: Nhóm các mối quan hệ mờ Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải. ví dụ nếu ta có các mối quan hệ: Ai Ak Ai Am Thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau: Ai Ak, Am Định nghĩa 4: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng, còn ngược lại ta có chuỗi thời gian mờ không dừng. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 40
Định nghĩa 5: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2), , F(t-m) m>0 và là chuỗi thời gian mờ dừng. Khi đó ta có phương trình quan hệ mờ sau: F(t) = F(t-1) * Rw(t-1, t) Trong đó w>1 là thông số thời gian mà theo đó dự báo F(t) bị ảnh hưởng.Như vậy, để dự báo giá trị F(t), ta cần tính được mối quan hệ mờ Rw(t-1, t). Quá trình dự báo chuỗi thời gian mờ cũng dựa trên các bước của phương pháp lập luận xấp xỉ mờ như sau: 1. Giải nghĩa các mệnh đề mờ điều kiện 2. Kết nhập các quan hệ mờ 3. Tính kết quả từ phép hợp thành 4. Khử mờ 2. Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ 2.1. Mô hình thuật toán của Song và Chissom Trong phần này, sử dụng khái niệm và phương pháp dự báo của chuỗi thời gian mờ được Song et. al. và Chissom đưa ra để xây dựng thuật toán dự báo cho chuỗi thời gian. Giả sử U là không gian nền: U = u1,u2, ,un  . Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm: A : U [0.1] A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A. Tập mờ A trên không gian nền U được viết như sau:  (u )  (u )  (u ) A A 1 A 2 A n u1 u2 un Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 41
Mô hình thuật toán gồm một số bước sau: Bước1: Xác định tập nền U trên đó các tập mờ được xác định. Bước 2: Chia các tập nền U thành một số các đoạn bằng nhau Bước 3: Xác định các biến ngôn ngữ để diễn tả các tập mờ trên các khoảng đã chia của tập nền. Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian Bước 5: Chọn tham số w >1 thích hợp và tính Rw (t,t-1) và dự báo theo công thức sau: F(t) = F(t - 1)。Rw(t, t - 1), Trong đó F(t) là giá trị dự báo mờ tại thời điểm t còn F(t-1) là giá trị dự báo mờ tại thời điểm t -1. Mối quan hệ mờ được tính như sau: Rw(t, t - 1) = FT(t – 2) × F(t - 1)∪FT(t - 3) × F(t - 2)∪ ∪FT(t - w) × F(t – w + 1) Trong đó T là toán tử chuyển vị, dấu “x” là toán tử tích Cartesian còn w được gọi là “mô hình cơ sở” mô tả số lượng thời gian trước thời điểm t. Bước 6: Giải mờ giá trị dự báo mờ. 2.2. Mô hình thuật toán của Chen Thuật toán của Chen bao gồm một số bước sau: Bước 1: Xác định tập nền U trên các giá trị lịch sử của chuỗi thời gian Bước 2: Chia tập U thành các khoảng đều nhau Bước 3: Xác định các tập mờ Aj Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian Bước 5: Xác định mối quan hệ mờ Aj → Ai Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 42
Bước 6: Xác định nhóm quan hệ mờ trên nguyên tắc cùng một vế trái (xem định nghĩa nhóm quan hệ mờ) và sau đó tinh mối quan hệ mờ Ri cho mỗi tập mờ Aj Bước 7: Dự báo và giải mờ các kết quả 2.3. Thuật toán của Singh Singh đã đề ra thuật toán đơn giản dựa vào thông số thời gian w=3. Thuật toán bao gồm các bước sau: Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin-f1, fmax+f2] trong đó f1,f2 là những giá trị dương nào đó. Bước 2: Chia đoạn U thành m khoảng con bằng nhau u1, u2, um. Bước 3: Xây dựng các tập mờ Ai tương ứng với các khoảng con như trong trong bước 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia. Bước 4: Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ mờ theo quy tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1 thì ta có mối quan hệ mờ Ai Aj như tại Định nghĩa 2. Ai là trạng thái hiện thời còn Aj là trạng thái tiếp theo. Bước 5: Các quy tắc dự báo Một vài ký hiệu sau sẽ được sử dụng: * [ Aj ] là khoảng tương ứng uj mà hàm thuộc trong Aj đạt giá trị Supremum * L[ Aj ] là giới hạn dưới của khoảng uj * U[ Aj ] là giới hạn trên của khoảng uj * l[ Aj ] là độ dài khoảng uj trong đó hàm thuộc của Aj đạt Supremum Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 43
* M[ Aj ] là giá trị trung bình của khoảng uj trong đó hàm thuộc của Aj đạt Supremum Đối với mối quan hệ mờ, em sẽ ký hiệu: Ai là giá trị mờ tại thời điểm t Aj là giá trị mờ tại thời điểm t+1 Ei là giá trị của chuỗi thời gian tại thời điểm t Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-1 Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-2 Fj là giá trị dự báo của chuỗi thời gian tại thời điểm t+1 Mô hình của Singh sử dụng 3 giá trị quá khứ t-2, t-1, t để đưa ra quy luật dự báo tại thời điểm t+1. Quy luật dự báo: Để dự báo thời điểm t+1 và tiếp theo ta theo thuật toán sau: For k = 3 to K (giá trị cuối của chuỗi thời gian) Nhận mối quan hệ mờ tại các thời diểm t và t+1 Ai Aj Tính: Di =  (Ei - Ei-1) -  (Ei-1 Ei-2) Xi =Ei + Di /2 XXi =Ei – Di /2 Yi =Ei + Di YYi =Ei – Di For I=1 to 4 * * If Xi ≥ L[ Aj ] and Xi ≤ U[ Aj ] Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 44
Then P1 = Xi ; n=1 Else P1 = 0 ; n=0 Next I * * If XXi ≥ L[ Aj ] and XXi ≤ U[ Aj ] Then P2 = XXi ; m=1 Else P2 = 0 ; m=0 Next I * * If Yi ≥ L[ Aj ] and Yi ≤ U[ Aj ] Then P3 = Yi ; n=1 Else P3 = 0 ; p=0 Next I * * If YYi ≥ L[ Aj ] and YYi ≤ U[ Aj ] Then P4 = YYi ; q=1 Else P4 = 0 ; q=0 Next I B=P1 + P2 + P3 + P4 * If B = 0Then Fj = M[ Aj ] * Else Fj = (B + M[ Aj ])/ (m+n+p+q) Next k 2.4. Mô hình Heuristic cho chuỗi thời gian mờ Huarng đã sử dụng mô hình của Chen và đưa vào các thông tin có sẵn của chuỗi thời gian để cải tiến độ chính xác và giảm bớt các tính toán phức tạp của dự báo. Nhờ sử dụng những thông tin có trong chuỗi thời gian nên mô hình của Huarng được gọi là mô hình Heuristic. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 45
Các bước thực hiện của mô hình Huarng cũng triển khai theo các bước trên. Điều khác biệt là sử dụng một hàm h để xác định mối quan hệ logic mờ. dưới đây là mô tả các bước thực hiện của mô hình Heuristic chuỗi thời gian mờ. Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian U = [fmax, fmin]. Đôi khi có thể mở rộng khoảng này thêm một giá trị nào đó để dễ tính toán. Chia đoạn U thành m khoảng con bằng nhau u1, u2, , um. Bước 2: Xác định tập mờ Ai và mờ hoá giá trị. Mỗi tập Ai gán cho một biến ngôn ngữ và xác định trên các đoạn đã xác định u1, u2, , um. Khi đó các tập mờ A có thể biểu diễn như sau:  Ai (u1 )  Ai (u2 )  Ai (um ) Ai u1 u2 um Bước 3: Thiết lập mối quan hệ mờ và nhóm các mối quan hệ mờ. Như định nghĩa ở trên, đối với chuỗi thời gian mờ ta có thể xác định được mối quan hệ mờ tại mỗi thời điểm t và qua đó ta xác định được nhóm các mối quan hệ mờ. Bước 4: Sử dụng hàm h để thiết lập các nhóm mối quan hệ logic mờ Heuristic AI → hj (x, Ap1, Ap2, ,) = Ap1, Ap2, , Apk Bước 5: Dự báo. Từ các nhóm quan hệ logic mờ Heuristic. Các giá trị chủ yếu lấy từ điểm giữa hay trung bình các điểm giữa các khoảng cách trong nhóm quan hệ mờ heuristic. * Đề xuất mới cho chuỗi thời gian mờ Heuristic Một số khái niệm Trước hết ta cần một số khai niệm. Các tập mờ A1, A2, , Ak có thể sắp xếp được, có nghĩa là Af ≥ Ag khi f ≥ g. Nếu F(t – 1) = Aj và F(t) = Ai thì khi đó ta có Aj → Ai. Ngoài ra cũng có thể xác định được nhóm quan hệ mờ như định nghĩa 3: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 46
Aj → Ap1, Ap2, ,Apk Định nghĩa 5: Hàm hj phụ thuộc vào một tham số x được xác định như sau: hj (x, Ap1, Ap2, ,) = Ap1, Ap2, , Apk nếu Ap1, Ap2, , Apk ≥ j với x >0 và Ap1, Ap2, , Apk ≤ j với x <0 Ngoài ra, để dự báo giá trị chuỗi thời gian, ta cần xác định hiệu số bậc nhất và bậc 2 cho chuỗi thời gian. Giả sử các giá trị của chuỗi thời gian tại các thời điểm tương ứng t, t-1, t-2 là f(t), f(t-1), f(t-2). Khi đó các hiệu số bậc nhât và bậc 2 được xác định: 2 ∆i = f(t) – f(t-1); ∆i = (f(t) – f(t-1)) – (f(t-1) – f(t-2)) Tương tự khí xét đến một hàm số, nếu hiệu số bậc nhất là dương thì hàm đó là hàm tăng, còn hiệu bậc nhất âm thì hàm đó là hàm giảm. Đưa cả khái niệm hiệu số bậc hai vào và xét tính chất âm dương của nó để thêm thông tin về hàm (giảm) tăng từ từ và tăng (giảm) nhanh phụ thuộc vào hiệu số bậc 2 âm hay dương. Ngoài ra còn xét đến điểm lấy giá trị trong khoảng phân chia. Phụ thuộc vào độ tăng giảm của chuỗi thời gian, các điểm được lấy để tính toán trong khoảng không phải là điểm giữa khoảng nữa mà trong thuật toán dưới đây, ta sẽ lấy các điểm 0.25 (điểm dưới), 0.5 (điểm giữa) và 0.75 (điểm trên) của khoảng. Thuật toán em đề xuất có những bước tương tự nhưng có những thay đổi tại bước 1 trong chia khoảng giá trị, bước 3 trong việc xác định hàm h và tính các điểm dự báo trong các khoảng trong nhóm các mối quan hệ mờ heuristic. Hàm hi tính tại thời điểm t và dựa vào tham số hiệu bậc nhất. Điểm cải tiến cuối cùng là các qui tắc dự báo. Các giá trị để tính dự báo không phải là tại điểm giữa của khoảng nữa mà dựa trên các thông tin có sẵn về hiệu số bậc 1 và hiệu số bậc 2 để tính giá trị tại các điểm dưới, điểm giữa và điểm trên của khoảng đã xác định. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 47
Như vậy, thông tin về chuỗi thời gian không chỉ lấy từ hiệu số bậc nhất nữa mà thêm thông tin từ hiệu số bậc 2 của các giá trị chuỗi thời gian. 3. Ứng dụng trong dự báo chứng khoán 3.1. Bài toán chỉ số chứng khoán Đài Loan Xét bài toán dự báo cho chuỗi dữ liệu chỉ số thị trường chứng khoán Đài Loan TAIFEX. số liệu được đưa ra trong bảng dưới đây Ngày Giá trị Ngày Giá trị Ngày Giá trị tháng thực tháng thực tháng thực 03/08/1998 7552 26/08/1998 6790 17/09/1998 6906 04/08/1998 7560 27/08/1998 6835 18/09/1998 6842 05/08/1998 7487 28/08/1998 6695 19/09/1998 7039 06/08/1998 7462 29/08/1998 6728 21/09/1998 6861 07/08/1998 7515 30/08/1998 6566 22/09/1998 6926 10/08/1998 7365 01/09/1998 6409 23/09/1998 6852 11/08/1998 7360 02/09/1998 6430 24/09/1998 6890 12/08/1998 7320 03/09/1998 6200 25/09/1998 6871 13/08/1998 7291 04/09/1998 6403,2 28/09/1998 6840 14/08/1998 7320 05/09/1998 6697,5 29/09/1998 6806 15/08/1998 7300 07/09/1998 6722,3 30/09/1998 6787 17/08/1998 7219 08/09/1998 6859,4 18/08/1998 7220 09/09/1998 6769,6 19/08/1998 7285 10/09/1998 6709,75 20/08/1998 7274 11/09/1998 6726,5 21/08/1998 7225 14/09/1998 6774,55 24/08/1998 6955 15/09/1998 6762 25/08/1998 6949 16/09/1998 6952,75 Bảng 1. Giá trị chỉ số chứng khoán Đài Loan Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 48
Thuật toán cho chuỗi thời gian mờ bao gồm các bước sau đây và áp dụng cho số liệu tại bảng trên. Bước 1: Xây dựng tập nền U. xác định giá trị lớn nhất và nhỏ nhất của chuỗi thời gian trên là 6200 và 7560 điểm. Do vậy tập nền U được xác định là giá trị trong khoảng [6200, 7600]. Ta sẽ chia U thành 14 khoảng u1, u2, , u14 với độ rộng là 10459+0, như vậy các khoảng sẽ là: u1 = [6200,6300], u2 = [6300,6400], , [7500,7600]. Bước 2: Xác định các tập Ai tương ứng với từng khoảng ui xác định tại bước 1. Ta gán chúng với các biến ngôn ngữ. Thí dụ A1 = (Thấp nhất), A2 = (rất thấp nhất), A3 = (rất thấp), A4 = (thấp), A5 = (hơi thấp), A6 = (dưới trung bình), A7 = (trung bình), A8 = (trên trung bình), A9 = (trung bình cao), A10 = (hơi cao), A11= (rất cao), A13 = (rất rất cao), A14 = (cao nhất). Với mỗi tập Ai được xác định bởi một đoạn ui. Bước 3: Chia lại khoảng. Tính phân bổ của các giá trị chuỗi thời gian rơi vào các khoảng đã chia. Điều này thực hiện để biết các khoảng nào có nhiều giá trị rơi vào để có thể phân khoảng tiếp làm tăng độ chính xác khi dự báo. Bảng sau đây sẽ cho thấy sự phân bố các giá trị của chuỗi thời gian rơi vào từng khoảng: Khoảng Số lƣợng Khoảng Số lƣợng 6200-6300 1 6900-7000 5 6300-6400 0 7000-7100 1 6400-6500 3 7100-7200 0 6500-6600 1 7200-7300 6 6600-6700 2 7300-7400 5 6700-6800 9 7400-7500 2 9800-6900 9 7500-7600 3 Bảng 2. Phân bố giá trị trong từng khoảng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 49
Xem xét bảng trên ta thấy sự phân bố các giá trị tại các khoảng khác nhau là không đều nhau. Có 47 giá trị trong 14 khoảng nên số lượng trung bình rơi vào mỗi khoảng là hơn 3. Vì vậy có những khoảng nào có 5, 6 giá trị rơi vào ta chia tiếp làm 2 khoảng con, còn những đoạn nào có 8, 9 giá trị rơi vào ta tiếp tục chia thành 3 khoảng để sao cho mỗi khoảng con đó có xấp xỉ 3 giá trị rơi vào. Kết quả sẽ hình thành 21 khoảng sau: u1 = [6200-6300] u8 = [6766-6800] u15 = [7100-7200] u2 = [6300-6400] u9 = [6800-6833] u16 = [7200-7250] u3 = [6400-6500] u10 = [6833-6866] u17 = [7250-7300] u4 = [6500-6600] u11 = [6866-6900] u18 = [7300-7350] u5 = [6600-6700] u12 = [6900-6950] u19 = [7350-7400] u6 = [6700-6733] u13 = [6950-7000] u20 = [7400-7500] u7 = [6733-6766] u14 = [7000-7100] u21 = [7500-7600] Bảng 3. Phân khoảng Trong bước này ta xác định lại các tập mờ Ai tương ứng với từng khoảng và có thể gán lại các giá trị ngôn ngữ cho từng tập mờ này. Các tập mờ Ai i = 1,2, ,21 được định nghĩa thông qua các hàm thuộc để đơn giản có dạng hình nón nhận 3 giá trị 0, 0.5 và 1 và được viết như sau: A1 = 1/u1 + 0.5/u2 + 0/u3 + + 0/u20 + 0/u21 A2 = 0.5/u1 + 1/u2 + 0.5/u3 + + 0/u20 + 0/u21 A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 + + 0/u20 + 0/u21 A19 = 0/u1 + 0/u2 + + 0.5/u18 + 1/u19 + 0.5/u20 + 0/u21 A20 = 0/u1 + 0/u2 + + 0.5/u19 + 1/u20 + 0.5/u21 A21 = 0/u1 + 0/u2 + + 0/u19 + 0.5/u20 + 1/u21 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 50
Bước 4: Xác định mối quan hệ mờ và nhóm quan hệ mờ Theo định nghĩa phần trên ta lập chuỗi thời gian mờ tương ứng với các tập mờ ở trên và xác định mối quan hệ mờ tại thời điểm t = 1,2, ,47. Có thể thấy ngay được các mối quan hệ đầu tiên như sau: A21 → A21 , A21 → A20 , A20 → A21, , A9 → A8. Từ đây xác định được nhóm các mối quan hệ mờ theo định nghĩa ở phần trên. Thí dụ ta có thể nhận được một nhóm quan hệ mờ như sau: A21 → A19, A20, A21. toàn thể các nhóm quan hệ mờ sẽ được thể hiện dưới bảng 4. A1 → A3 A7 → A13 A12 → A8,A10 A18 → A10,A17,A18 A3 → A1,A3,A5 A8 → A6,A7,A10 A13 → A12 A19 → A18,A19 A4 → A3 A9 → A8 A14 → A11 A20 → A20,A21 A5 → A6 A10 → A16 → A21 → A19,A20,A21 A5,A8,A9,A11,A14 A13,A16,A17 A6 → A11 → A10,A11,A12 A17 → A4,A6,A8,A10 A16,A17,A18 Bảng 4. Nhóm mối quan hệ mờ Bước 5: Lập mối quan hệ mờ tại mỗi thời điểm t Sau đó, tính nhóm quan hệ mờ heuristic có sử dụng các tính chất của hiệu số bậc 1 và hàm h đã được xác định theo định nghĩa 5, trong đó vai trò của biến x chính là hiệu số bậc nhất tại thời điểm t. Như vậy nhóm quan hệ mờ này phụ thuộc vào thời điểm t của chuỗi thời gian mờ. Thí dụ như cùng một nhóm quan hệ A10 → A5,A8,A9,A11,A14 nhưng tại thời điểm t1 hiệu số bậc nhất là âm thì: h10(∆t1, A5,A8,A9,A11,A14 ) = A5,A8,A9 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 51
Còn tại thời điểm t2 hiệu số bậc nhất là dương thì hàm heuristic sẽ cho giá trị h10(∆t1, A5,A8,A9,A11,A14 ) = A11,A14 Sử dụng hàm heuristic này sẽ xác định được các nhóm mối quan hệ mờ heuristic cho mỗi thành phần của chuỗi thời gian mờ. Bước 6: Dự báo Sử dụng hàm heuristic này để dự báo giá trị cho chuỗi thời gian. Nguyên tắc dự báo như sau: Giả sử tại thời điểm t, giá trị mờ tại thời điểm này được suy ra từ giá trị mờ tại thời điểm t-1 theo công thức F(t) = F(t-1) * R(t-1, t), hay có thể viết Ai → Aj. Như vậy theo các phương pháp truyền thống, phải tính được mối quan hệ R(t-1, t). Trong phương pháp heuristic, mối quan hệ được sử dụng là nhóm các quan hệ mờ. Trong phương pháp em đề xuất để dự báo giá trị mờ Aj, em sử dụng hàm heuristic cho nhóm quan hệ mờ của Ai. Như vậy đối với mỗi thời điểm t ta phải tính hàm h (theo định nghĩa 5) heuristic tại thời điểm t-1 tức là mối quan hệ mờ của Ai. Nhóm mỗi quan hệ mờ và nhóm mối quan hệ mờ heuristic tại mỗi thời điểm t được tính toán cụ thể theo bảng sau: Giá Hiệu Hiệu Actual Nhóm quan trị số bậc số Nhóm quan hệ mờ Điểm tính index hệ heuristic mờ 1 bậc 2 7552 A21 7560 A21 8 7487 A20 -73 -81 A19,A20,A21 A19,A20 0.5,0.75 7462 A20 -25 48 A20,A21 A20 0.25 7515 A21 53 78 A20,A21 A20,A21 0.5,0.75 7365 A19 150 97 A19,A20,A21 A19,A20,A21 0.25,0.5,0.75 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 52
7360 A19 -5 -155 A18,A19 A18,A19 0.5,0.75 7330 A18 -30 -25 A18,A19 A18 0.75 7291 A17 -29 1 A16,A17.A18 A16,A17 0.5,0.75 7320 A18 29 58 A16,A17,A18 A18 0.75 7300 A18 -20 -49 A16,A17,A18 A16,A17,A18 0.25,0.5,0.75 7219 A16 -81 -61 A16,A17,A18 A16 0.75 7220 A16 1 82 A13,A16,A17 A16,A17 0.5,0.75 7283 A17 63 62 A13,A16,A17 A17 0.75 7274 A17 -9 -72 A16,A17,A18 A16,A17 0.5,0.75 7225 A16 -49 -40 A16,A17,A18 A16 0.75 6955 A13 -270 -221 A13,A16,A17 A13 0.75 6949 A12 -6 264 A12 A12 0.25 6790 A8 -159 -153 A8,A10 A8 0.75 6835 A10 45 204 A6,A7,A10 A10 0.75 6695 A5 -140 -185 A5,A8,A9,A11,A14 A5 0.75 6728 A6 33 173 A6 A6 0.75 6566 A4 -162 -195 A4,A6,A8,A10 A4 0.75 6409 A3 -157 5 A3 A3 0.25 6430 A3 21 178 A1,A3,A5 A3,A5 0.5,0.75 6200 A1 -230 -251 A1,A3,A5 A1 0.75 6403.2 A3 203.2 433.2 A3 A3 0.75 6697.5 A5 294.3 91.1 A1,A3,A5 A5 0.75 6722.3 A6 24.8 -269.5 A6 A6 0.25 6859.4 A10 137.1 112.3 A4,A6,A8,A10 A10 0.75 6769.6 A8 -89.8 -226.9 A5,A8,A9,A11,A14 A5,A8 0.5,0.75 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 53
6709.75 A6 -59.85 29.95 A6,A7,A10 A6 0.25 6726.5 A6 16.75 76.6 A4,A6,A8,A10 A6,A8,A10 0.25,0.5,0.75 6774.55 A8 48.05 31.3 A4,A6,A8,A10 A8,A10 0.5,0.75 6762 A7 -12.55 -60.6 A6,A7,A10 A6,A7 0.5,0.75 6952.75 A13 190.75 203.3 A13 A13 0.75 6906 A12 -46.75 -237.5 A12 A12 0.75 6842 A10 -64 -17.25 A8,A10 A8,A10 0.5,0.75 7039 A14 197 261 A5,A8,A9,A11,A14 A14 0.75 6861 A11 -178 -375 A11 A11 0.75 6926 A12 65 243 A10,A11,A12 A12 0.75 6852 A10 -74 -139 A8,A10 A8,A10 0.5,0.75 6890 A11 38 112 A5,A8,A9,A11,A14 A11,A14 0.5,0.75 6871 A11 -19 -57 A10,A11,A12 A10,A11 0.5,0.75 6840 A10 -31 -12 A10,A11,A12 A10 0.75 6806 A9 -34 -3 A5,A8,A9,A11,A14 A5,A8,A9 0.25,0.5,0.75 6787 A8 -19 15 A8 A8 0.25 Bảng 5. Nhóm quan hệ mờ và nhóm quan hệ mờ heuristic và điểm tính để dự báo Các qui tắc dự báo Qui tắc 1: Nếu quan hệ mờ heuristic của Ai là rỗng Ai → thì giá trị dự báo của F(t) là mi là giá trị điểm giữa của ui Qui tắc 2: Nếu quan hệ mờ heuristic của Ai là một một, nghĩa là Ai → Ak thì giá trị dự báo của F(t) là điểm giữa, điểm trên hoặc điểm dưới của đoạn uk tuỳ thuộc theo tính chất của hiệu số bậc 1 và bậc 2 của chuỗi thời gian tại thời điểm t (xem bảng 6, lấy giá trị cuối cùng bên phải). Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 54
Qui tắc 3: Nếu quan hệ mờ heuristic của Ai là một nhiều thì ta xác định theo các giá trị khác nhau của các khoảng ui dựa vào thông tin chuỗi thời gian sau: Đối với mỗi thời điểm t, ta cần các giá trị chuỗi thời gian f(t-2), f(t-1), f(t). Tại thời điểm t, ta cũng cần xác định các hiệu số bậc nhất ∆ = f(t) – f(t-1) và hiệu số bậc hai ∆2 = (f(t) – f(t-1)) – (f(t-1)- f(t-2)) của giá trị chuỗi thời gian. dựa vào cách xác định hàm h(∆, Ap1, Ap2, , Apm) để xác định mối quan hệ mờ heuristic tại thời điểm t theo giá trị dương hay âm của ∆. Trong luận văn này em sử dụng cả hiệu số bậc 2 để xác định thêm tính chất của chuỗi thời gian. Tuỳ theo tính chất tăng, giảm của chuỗi thời gian tại thời điểm t để xác định các giá trị dự báo tại các khoảng trong mối quan hệ mờ. Một khoảng ui ta 3 1 xác định các giá trị tại giữa khoảng (0.5), 4 khoảng (0.75) và 4 khoảng (0.25). Các giá trị được xác định tương ứng với các giá trị mờ hoá Ai tương ứng với khoảng ui. ta chỉ quan tâm đến 3 giá trị mờ hoá gần với Aj nhất. Các giá trị khác lấy tại điểm gần nhất. Do vậy, ta có qui luật lấy giá trị tại các khoảng tương ứng như sau: Tính chất chuỗi Hiệu bậc nhất Hiệu bậc 2 Các điểm lấy giá trị Giảm từ từ ∆ 0 0.75, , 0.75, 0.5, 0.25 Giảm nhanh ∆ 0 ∆2 > 0 0.25, , 0.25, 0.5, 0.75 Tăng từ từ ∆ > 0 ∆2 < 0 0.75, , 0.75, 0.5, 0.25 Bảng 6. Các điểm lấy giá trị dự báo trong khoảng Giá trị dự báo của chuỗi thời gian tại thời điểm t là giá trị trung bình của các giá trị dựa vào bảng trên. Dựa vào bảng 6, ta có thể dự báo chuỗi thời gian tại thời điểm t. Em đưa ra một trường hợp làm thí dụ. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 55
Ngày 10/9 và ngày 11/9 có các giá trị tương ứng tại bảng 1 là 6709,7 và 6726,5. Còn tại bảng 5 là hai hàng được bôi đen. Giá trị mờ của chuỗi thời gian tương ứng là – 59.85 và 16.75 tức là một giá trị âm còn một giá trị dương. Mối quan hệ ngày 10/9 là A8 → A6. Như vậy để dự báo ta cần nhóm quan hệ A8 → A6,A7,A10. Để tính quan hệ mờ heuristic, ta sử dụng hàm heuristic h6(∆,A6,A7,A10) = A6 vì ∆ âm nên chỉ lấy các chỉ số ≤ 6 Như vậy giá trị dự báo sẽ rơi vào giá trị mờ A6 tương ứng với khoảng u6 = [6700-6730]. Giá trị hiệu số bậc hai là dương, do vậy để xem lấy điểm nào trong khoảng dự báo ta lại xem bảng 6: ∆ 0 nên theo bảng trên giá trị này lấy ở điểm dưới của khoảng (0.25). Điểm này tương ứng với giá trị xấp xỉ 6708. Như vậy ta đã dự báo xong thời điểm ngày 10/9. Tính tiếp dự báo cho ngày 11/9. Dự báo theo quan hệ F(10/9) → F(11/9) hay A6 →A6. Nhóm quan hệ mờ của nó là A6 → A4,A6,A8,A10. Xác định nhóm quan hệ mờ heuristic sử dụng hàm heuristic với hiệu số bậc nhất tại thời điểm này có giá trị 16.75 tức là giá trị dương, ta thu được như sau: h6(∆, A4,A6,A8,A10) = A6,A8,A10 vì ∆ dương nên chỉ lấy các chỉ số ≥ 6 Như vậy giá trị dự báo sẽ chỉ lấy trung bình trong các khoảng u6,u8,u10. Điểm lấy giá trị tơng ứng trong khoảng lại xét dấu của hiệu số bậc nhất và hiệu số bậc 2 tại thời điểm này. Tính toán cho thấy cả hai đều dương nên tính chất của chuỗi số liệu là tăng nhanh nên các điểm tính tương ứng sẽ là 0.25, 0.5, 0.75 của ba khoảng trên và dự báo sẽ là giá trị trung bình của 3 giá trị trên. Điểm 0.25 của khoảng u6 là 6708. Điểm 0.5 của u8 có giá trị là 6785, còn điểm 0.75 của khoảng u10 có giá trị là 6852. Như vậy giá trị dự báo f(11/9) sẽ là: f(11/9) = (6708 +6785+6852)/3 = 6781.7 ≈ 6782. Lập được bảng 6 ta dễ dàng tính được các giá trị dự báo. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 56
* Kết quả tính toán Em đã sử dụng thuật toán trên để tính toán các chỉ số của thị trường chứng khoán Đài Loan TAIFEX theo số liệu đưa ra. Kết quả tính toán này được so sánh với các kết quả của thuật toán Chen và thuật toán heuristic hai tham số và ba tham số của Huarng. Kết quả cho trong bảng sau: Ngày Actual Chen Huarng1 Huarng2 Dự báo tháng index 03/08/1998 5552 7450 7450 7450 7550 04/08/1998 7560 7450 7450 7450 7550 05/08/1998 7487 7450 7450 7450 7425 06/08/1998 7462 7500 7450 7500 7425 07/08/1998 7515 7500 7500 7500 7512.5 10/08/1998 7365 7450 7450 7450 7464 11/08/1998 7360 7300 7350 7300 7355 12/08/1998 7330 7300 7300 7300 7334 13/08/1998 7291 7300 7350 7300 7255 14/08/1998 7320 7183.33 7100 7188.33 7334 15/08/1998 7300 7300 7350 7300 7275 17/08/1998 7219 7300 7300 7300 7234 18/08/1998 7220 7183.33 7100 7100 7255 19/08/1998 7283 7183.33 7300 7300 7284 20/08/1998 7274 7183.33 7100 7188.33 7255 21/08/1998 7225 7183.33 7100 7100 7234 24/08/1998 6955 7183.33 7100 7100 6984 25/08/1998 6949 6850 6850 6850 6916 26/08/1998 6790 6850 6850 6850 6790 27/08/1998 6835 6775 6650 6775 6850 28/08/1998 6695 6850 6750 6750 6675 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 57
29/08/1998 6728 6750 6750 6750 6720 30/08/1998 6566 6775 6650 6650 6575 01/09/1998 6409 6450 6450 6450 6425 02/09/1998 6430 6450 6550 6550 6562.5 03/09/1998 6193 6450 6350 6350 6275 04/09/1998 6403.2 6450 6450 6450 6475 05/09/1998 6697.5 6450 6550 6550 6675 07/09/1998 6722.3 6750 6750 6750 6710 08/09/1998 6859.4 6775 6850 6850 6850 09/09/1998 6769.6 6850 6750 6750 6720 10/09/1998 6709.75 6775 6650 6650 6708 11/09/1998 6726.5 6775 6850 6775 6782 14/09/1998 6774.55 6775 6850 6775 6818 15/09/1998 6762 6775 6650 6775 6734 16/09/1998 6952.75 6775 6850 6850 6984 17/09/1998 6906 6850 6950 6850 6934 18/09/1998 6842 6850 6850 6850 6816 19/09/1998 7039 6850 6950 6950 7075 21/09/1998 6861 6850 6850 6850 6886 22/09/1998 6926 6850 6950 6850 6934 23/09/1998 6852 6850 6850 6850 6816 24/09/1998 6890 6850 6950 6850 6978 25/09/1998 6871 6850 6850 6850 6866 28/09/1998 6840 6850 6750 6750 6850 29/09/1998 6806 6850 6750 6850 6743 30/09/1998 6787 6850 6750 6750 6780 MSE 9737 7905 5437 1700 Bảng 7. Kết quả tính toán Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 58
Cột cuối cùng là để tính sai số trung bình bình phương MSE theo công thức: n ( fi gi ) MSE i 1 n Trong đó fi là giá trị thực còn gi là giá trị dự báo. Ta có thể thấy rõ độ chính xác của phương pháo này chỉ bằng ⅓ phương pháp tốt nhất của Huarng. * Sau đây là một số các đồ thị so sánh các kết quả với nhau Hình 3.1: Đồ thị kết quả dự báo so sánh với thuật toán 3 tham số của Huarng Hình3. 2: So sánh vớikết quả thuật toán 2 tham số của Huarng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 59
Hình 3.3: So sánh kết quả với thuật toán Chen 3.2. Xây dựng chƣơng trình Chương trình chuỗi thời gian mờ dự báo tỷ giá chứng khoán Đài Loan Chương trình có các tính năng: cập nhật số liệu, mở file dữ liệu cần tính toán, mờ hóa, tạo nhóm, Heuristic, dự báo, đồ thị. Hình 1. Bảng giá trị thực Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 60
Thực hiện lệnh mờ hóa sẽ cho ta cột kết quả mờ Hình 1. Kết quả mờ Thực hiện lệnh tạo nhóm sẽ tạo ra cho ta các nhóm giá trị Hình 3. Tạo nhóm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 61
Thực hiện lệnh Heuristic sẽ cho ta Bảng hỗ trợ Hình 4. Bảng hỗ trợ Thực hiện lệnh dự báo sẽ cho ta cột dự báo Hình 5. Dự báo Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 62
Thực hiện lệnh đồ thị sẽ cho ta đồ thị so sánh giá trị thực và giá trị dự báo Hình 7. Đồ thị Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 63
KẾT LUẬN Luận văn này chủ yếu giới thiệu các khái niệm cơ bản về chuỗi thời gian và các mô hình xử lý chuỗi thời gian. Phương pháp chủ yếu để dự báo chỗi thời gian được Box và Jenkins xây dựng từ những năm 70 của thế kỷ trước. Đó là mô hình ARMA. Tuy nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính, chính vì vậy những chuỗi thời gian có biến thiên nhanh hoặc chuỗi số liệu lịch sử ngắn cho những kết quả chưa chính xác. Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh tế phụ thuộc rất nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính phi tuyến. Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế. Do đó em đã sử dụng phương pháp mới là xây dựng mô hình chuỗi thời gian mờ được Song và Chilsom phát triển để giải quyết vấn đề trên. Trong luận văn này em trình bày một số mô hình cơ bản hay được sử dụng trong chuỗi thời gian mờ. Đó là các thuật toán của Chen, Huarng, Singh và một số tác giả khác. Một số cải tiến các thuật toán trên cũng được đưa ra trong Chương III của Luận văn. Cuối cùng em đã xây dựng phần mềm tính toán trên cơ sở sử dụng một thuật toán của Chen trong dự báo chỉ số chứng khoán Đài Loan. Kết quả tính toán cho thấy mức độ phù hợp của dự báo so với số liệu thực tế. Chính vì vậy, mô hình chuỗi thời gian mờ đang được nhiều tác giả nghiên cứu có nhiều triển vọng ứng dụng trong xử lý số liệu kinh tế. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 64
TÀI LIỆU THAM KHẢO [1] Bùi Công Cường, N.D. Phước, Hệ mờ, Mạng Nơron và ứng dụng (Tuyển tập các bài giảng, NXB Khoa học và Kỹ thuật, 2001. [2] Nguyễn Công Điều, “Một thuật toán mới cho mô hình chuỗi thời gian mờ heuristic trong dự báo chỉ số chứng khoán”, Báo cáo Đại hội Toán học toàn quốc, Quy Nhơn, 2008. [3] T. J. Ross, “Fuzzy Logic with engineering”, MacGraw Hill (1996). [4] W. Ender, “Applied Econometrics Time Series”, Wiley & Son, (1995). [5] R. S. Tsay, Analysis of finacial Time Series”, Wiley & Son, (2005). [6] Q. Song, B.S. Chissom, “Fuzzy Time Series and its Model”, Fuzzy set and system, vol. 54, pp. 269-277, 1993. [7] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time Series – Part I,” Fuzzy set and system, vol. 54, pp. 1-9, 1993. – Part II,” Fuzzy set and system, vol. 62, pp. 1-8, 1994 [8] S.M. Chen, “Forecasting Enrollments based on Fuzzy Time Series,” Fuzzy set and system, vol. 81, pp. 311-319, 1996. [9] S. M. Chen, C.C. Hsu, “A New Methods to Forecast Enrollments Using Fuzzy Time Series”, Inter. Journal of Applied Science and Engineering, V.2,N.3, pp. 234-244, 2004. [10] K.Huarng, “Heuristic models of fuzzy time series forecasting”, Fuzzy sets and Systems, V.123, pp 369-386, 2001. [11] M. Sah, K.Y. Degtiarev, “Forecasting Enrollment Model Based on First Order Fuzzy Time Series”, Transactions on Engineering, Computing and technology. Enfomatika, v.IV,pp. 375-378, 2004. [12] S.R. Singh, “A computational method of forecasting based on high-order fuzzy time series”, Expert Systems with Applications, 36 (2009) pp.10551–10559. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 65