Dự báo chuỗi thời gian mờ dựa trên đại số gia tử

pdf 17 trang hapham 2640
Bạn đang xem tài liệu "Dự báo chuỗi thời gian mờ dựa trên đại số gia tử", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfdu_bao_chuoi_thoi_gian_mo_dua_tren_dai_so_gia_tu.pdf

Nội dung text: Dự báo chuỗi thời gian mờ dựa trên đại số gia tử

  1. Kỷ yếu công trình khoa học 2015 - Phần I DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ Trần Quang Duy, Nguyễn Công Điều, Vũ Như Lân Khoa Toán-Tin, Đại học Thăng Long Email: Tr.qduy@gmail.com, ncdieu@yahoo.com, vnlan@ioit.ac.vn Tóm tắt: Chuỗi thời gian mờ do Song & Chissom đưa ra năm 1993 và hiện nay được nghiên cứu rộng rãi trên thế giới cho mục đích dự báo. Tuy nhiên, độ chính xác của dự báo chuỗi thời gian theo tiếp cận mờ của Song & Chissom còn chưa cao do phụ thuộc vào quá nhiều yếu tố. S.M Chen (1996) đã đề xuất mô hình dự báo chuỗi thời mờ rất hiệu quả chỉ sử dụng các tính toán số học đơn giản. Sau đó mô hình này được nghiên cứu cải tiến trong nhiều ứng dụng dự báo và đã có được nhiều kết quả chính xác hơn. Đại số gia tử (ĐSGT) là một tiếp cận mới được các tác giả N.C.Ho và W. Wechler xây dựng vào những năm 1990. Mô hình dự báo chuỗi thời gian mờ thể hiện qua ba giai đoạn như phép mờ hóa, xác định quan hệ mờ và phép giải mờ. Trong ĐSGT, phép mờ hóa và phép giải mờ được thay thế bằng phép ngữ nghĩa hóa và phép giải nghĩa tương ứng đơn giản hơn. Trong bài báo này, chúng tôi đưa ra một tiếp cận mới sử dụng ĐSGT với khả năng cung cấp một mô hình tính toán hoàn toàn khác biệt so với tiếp cận mờ cho mô hình dự báo chuỗi thời gian mờ. Các kết quả thử nghiệm dự báo số sinh viên nhập học tại Đại học Alabama chứng minh rằng mô hình chuỗi thời gian mờ dựa trên ĐSGT tốt hơn so với nhiều mô hình hiện có. Từ khóa: Tập mờ, nhóm quan hệ mờ, đại số gia tử, dự báo chuỗi thời gian mờ. 1. MỞ ĐẦU Dự báo chuỗi thời gian là vấn đề luôn được nhiều nhà khoa học trên thế giới quan tâm nghiên cứu. Q.Song và B.S. Chissom [1] lần đầu tiên đã đưa ra quan niệm mới xem các giá trị thực định lượng trong chuỗi thời gian từ góc độ định tính. Từ đó chuỗi thời gian có thể xem như một biến ngôn ngữ và bài toán dự báo trở thành vấn đề dự báo các giá trị ngôn ngữ của biến ngôn ngữ. Có thể coi đây là quan niệm mới về chuỗi thời gian có tính đột phá. Tuy nhiên mô hình tính toán nhóm quan hệ mờ [2, 3] quá phức tạp và do đó độ chính xác của dự báo không cao. Chen [4] đã thay đổi cách tính toán nhóm quan hệ mờ trong mô hình dự báo [2, 3] với các phép tính số học đơn giản hơn để thu được kết quả dự báo chính xác hơn. Nhiều nghiên cứu tiếp theo vẫn sử dụng phương pháp luận này và đã thu được nhiều kết quả quan trọng [4, 9, 10]. Ở Việt Nam, bài báo [11] là kết quả nghiên cứu đầu tiên về dự báo chuỗi thời gian mờ. Các nghiên cứu trên thế giới chủ yếu tập trung giải quyết vấn đề nâng cao độ chính xác dự báo. Có thể thấy một số vấn đề sau đây ảnh hưởng đến độ chính xác dự báo chuỗi thời gian mờ: a/ Mờ hóa các dữ liệu: Đây là vấn đề đòi hỏi phải có trực giác tốt để mô tả định tính chuỗi thời gian một cách hợp lý, từ đó xây dựng nhóm quan hệ mờ cung cấp thông tin có giá trị cho quá trình dự báo sau này. Đặc tính quan trọng của phép mờ hóa là số lượng khoảng chia, độ dài khoảng chia. Nếu số lượng khoảng chia quá ít, dự báo có thể có độ sai lệch lớn do chưa đủ thông tin. Nếu số lượng khoảng chia quá lớn, dự báo có thể mất hết ý nghĩa về tính mờ của giá trị ngôn ngữ do không còn nhóm quan hệ mờ. Trong các nghiên cứu [7, 8]: số lượng khoảng, độ dài khoảng và bậc của mô hình chuỗi thời gian mờ có ảnh hưởng đến độ Trường Đại học Thăng Long 30
  2. Kỷ yếu công trình khoa học 2015 - Phần I chính xác của mô hình dự báo. Một số nghiên cứu sâu hơn về số lượng khoảng, độ dài khoảng và bậc của mô hình chuỗi thời gian mờ tối ưu để có dự báo tốt nhất cho các dữ liệu trong nhóm quan hệ mờ [12, 13, 14]. b/ Giải mờ: Đây là quá trình dự báo với rất nhiều kỹ thuật khác nhau trên cơ sở phép mờ hóa trên đây. Cách giải mờ phổ biến dựa trên 3 luật cơ bản [4], tuy nhiên trong [10, 11] đã tìm ra một số tham số định hướng cho quá trình giải mờ và đã thu được một số kết quả khá tốt Tiếp cận đại số gia tử (ĐSGT) [15] là tiếp cận khác biệt so với tiếp cận mờ và đã có một số ứng dụng thể hiện rõ hiệu quả của tiếp cận này so với tiếp cận mờ truyền thống trong một số lĩnh vực như điều khiển [16, 18, 19], công nghệ thông tin [17]. Tiếp tục những nghiên cứu ứng dụng trên đây, tiếp cận ĐSGT cũng cần được nghiên cứu thử nghiệm cho một lĩnh vực ứng dụng mới, đó là bài toán xây dựng mô hình dự báo chuỗi thời gian mờ đã được nhiều tác giả khác trên thế giới quan tâm hiện nay. Bài báo được trình bày theo thứ tự sau đây: Sau mục MỞ ĐẦU là Mục II giới thiệu về mô hình dự báo chuỗi thời gian mờ và ứng dụng cho dự báo số sinh viên nhập học tại trường đại học Alabama của Song & Chissom [2,3] và Chen [4]. Mục III trên cơ sở bài toán dự báo số sinh viên nhập học của trường đại học Alabama, nêu một số nội dung quan trọng của ĐSGT cần thiết cho bài toán dự báo chuỗi thời gian mờ với bộ tham số hợp lý và so sánh với các phương pháp của Chen và các phương pháp cải tiến khác sử dụng chuỗi thời gian mờ bậc nhất với 7 khoảng chia. Mục IV tiếp tục trình bày phương pháp dự báo số sinh viên nhập học của trường đại học Alabama trên cơ sở tiếp cận ĐSGT trong điều kiện phép ngữ nghĩa hóa phi tuyến, phép giải nghĩa phi tuyến với các tham số tối ưu dựa trên đoạn giải nghĩa tối ưu. Từ đó so sánh với một số phương pháp dự báo cải tiến theo tiếp cận mờ sử dụng bậc cao, số khoảng chia lớn hơn 7 và một số mô hình dự báo chuỗi thời gian mờ tối ưu hiện nay. Độ chính xác dự báo của các phương pháp trên được đánh giá qua sai số trung bình bình phương MSE (Mean Square Error), qua đó có thể thấy rõ tính ưu việt của tiếp cận ĐSGT so với tiếp cận mờ. 2. MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ 2.1 Một số khái niệm cơ bản của mô hình dự báo chuỗi thời gian mờ Mô hình chuỗi thời gian mờ lần đầu tiên được Song và Chissom đưa ra [1, 2, 3 ] và được Chen cải tiến [4,5, 6] để có thể xử lý bằng các phép tính số học đơn giản hơn nhưng chính xác hơn phù hợp với các ứng dụng dự báo chuỗi thời gian mờ. Có thể tóm lược qua một số khái niệm cơ bản sau đây: Định nghĩa 2.1: Chuỗi thời gian mờ Giả sử Y(t), (t= , 0,1,2,. .), là tập các số thực và cũng là tập nền trên đó xác định các tập mờ f i (t), (i=1,2 , ). Biến t là thời gian. Nếu F(t) là một chuỗi các tập mờ của f i (t), (i=1,2, ), thì F(t) được gọi là chuỗi thời gian mờ trên Y(t), (t= , 0,1,2,. ). Định nghĩa 2.2: Quan hệ mờ Nếu tồn tại quan hệ mờ R(t−1, t), sao cho F(t)=F(t−1)*R(t−1, t), trong đó dấu * ký hiệu toán tử nào đó, thì F(t) được suy ra từ F(t−1). Quan hệ giữa F(t) và F(t−1) được xác định bằng ký hiệu: F(t−1)→F(t) (2.1) Trường Đại học Thăng Long 31
  3. Kỷ yếu công trình khoa học 2015 - Phần I Ví dụ về toán tử * có thể là phép kết hợp MaxMin [2] hoặc MinMax [3] hay phép tính số học [ 4] . Nếu F (t−1)=Ai and F (t)=Aj , quan hệ logic giữa F (t) and F(t−1) được ký hiệu bằng Ai→Aj , trong đó Ai là vế trái và Aj là vế phải của quan hệ mờ mô tả tập mờ dự báo. Định nghĩa 2.3: Quan hệ mờ bậc n Giả sử F(t) là chuỗi thời gian mờ. Nếu F(t) được suy ra từ F(t−1), F(t−2), , F(t−n), thì quan hệ mờ này được biểu diễn bằng biểu thức: F(t−n), ,F(t−2), F(t−1) → F(t) (2.2) và được gọi là chuỗi thời gian mờ bậc n. . Định nghĩa 2.4: Nhóm quan hệ mờ ( NQM ) Các quan hệ mờ với cùng một tập mờ bên vế trái có thể đưa vào một nhóm gọi là nhóm quan hệ mờ hay nhóm quan hệ logic mờ. Giả sử có các quan hệ mờ sau, khi vế trái là giống nhau: Ai→ Aj1; Ai→ Aj2; ; Ai→ Ajn Các quan hệ mờ trên có thể đưa vào một nhóm được ký hiệu như sau: Ai→ Aj1, Aj2, , , Ajn . (2.3) 2.2 Mô hình dự báo Song và Chissom Mô hình dự báo chuỗi thời gian mờ lần đầu tiên được Song và Chissom đưa ra vào năm 1993 [1, 2, 3 ] và được ứng dụng để dự báo số sinh viên nhập học tại trường Đại học Alabama với dữ liệu lịch sử qua 22 năm kể từ năm 1971 đến 1992 như trong Bảng 2.1 sau đây: Bảng 2.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 Năm Số sinh viên nhập Năm Số sinh viển nhập học học 1971 13055 1982 15433 1972 13563 1983 15497 1973 13867 1084 15145 1974 14696 1985 15163 1975 15460 1986 15984 1976 15311 1987 16859 1977 15603 1988 18150 1978 15861 1989 18970 1979 16807 1990 19328 1980 16919 1991 19337 1981 16388 1992 18876 Trường Đại học Thăng Long 32
  4. Kỷ yếu công trình khoa học 2015 - Phần I Chuỗi thời gian lần đầu tiên được xem xét dưới góc độ biến ngôn ngữ và bài toán dự báo đã có được một cách nhìn hoàn toàn mới trên quan điểm lý thuyết tập mờ. Mô hình dự báo đầu tiên là mô hình dự báo chuỗi thời gian dừng [2, 3] và được triển khai qua các bước sau đây: Bước 1. Xác định tập nền Bước 2. Chia miền xác định của tập nền thành những khoảng bằng nhau. Bước 3. Xây dựng các tập mờ trên tập nền Bước 4. Mờ hóa chuỗi dữ liệu Bước 5. Xác định các quan hệ mờ Bước 6. Dự báo bằng phương trình Ai=Ai−1* R, ở đây ký hiệu * là toán tử max-min Bước 7. Giải mờ các kết quả dự báo. Trong bước 5, quan hệ mờ R được xác định bằng biểu thức Ri=As TxAq , với mọi quan hệ mờ k, As →Aq, R= ∪i=1,k Ri (2.4) Ở đây x là toán tử min, T là phép chuyển vị và ∪ là phép hợp. 2.3 Mô hình dự báo Chen Do mô hình dự báo chuỗi thời gian mờ của Song & Chissom khá phức tạp trong bước 5 và bước 6, vì vậy Chen [4] đã cải tiến cách tính toán sao cho chính xác hơn cho các mô hình dự báo chuỗi thời gian chỉ sử dụng các phép tính số học đơn giản trên cơ sở thông tin từ các nhóm quan hệ mờ theo các bước sau đây: Bước 1. Chia miền xác định của tập nền thành những khoảng bằng nhau. Bước 2. Xây dựng các tập mờ trên tập nền. Bước 3. Mờ hóa chuỗi dữ liệu. Bước 4. Xác định các quan hệ mờ. Bước 5. Tạo lập nhóm quan hệ mờ. Bước 6. Xây dựng các luật dự báo trên các nhóm quan hệ Bước 7. Giải mờ đầu theo luật và đưa ra dự báo. 3. MÔ HÌNH DỰ BÁO THEO TIẾP CẬN ĐẠI SỐ GIA TỬ Đại số gia tử cung cấp một mô hình xử lý các đại lượng không chắc chắn khá hiệu quả cho nhiều bài toán ứng dụng. Có thể thấy rõ rằng các giá trị ngôn ngữ với ngữ nghĩa vốn có thứ tự chặt chẽ trong biến ngôn ngữ đã được mô tả bằng một cấu trúc đại số gia tử [15, 16], từ đó tạo ra môi trường tính toán, suy luận tốt cho nhiều ứng dụng. Gọi AX = ( X, G, C, H, ≤ ) là một cấu trúc đại số, với X là tập nền của AX; G = {c-, c+} là tập các phần tử sinh; C = {0, W, 1}, trong đó 0, W và 1 tương ứng là những phần tử đặc trưng cận trái (tuyệt đối nhỏ), trung hòa và cận phải (tuyệt đối lớn); H là tập các toán tử Trường Đại học Thăng Long 33
  5. Kỷ yếu công trình khoa học 2015 - Phần I một ngôi được gọi là các gia tử; ≤ là biểu thị quan hệ thứ tự trên các giá trị ngôn ngữ. Gọi H- là tập hợp các gia tử âm và H+ là tập hợp các gia tử dương của AX. Ký hiệu H- = {h-1, h-2, h-q}, trong đó h-1 0 và α+β = 1 (3.7) i=−1 i=1 Định nghĩa 3.2: Hàm dấu Hàm Sign: X→{-1, 0, 1} là một ánh xạ được gọi là hàm dấu với h, h'∈H và c ∈{c-, c+} trong đó: Sign(c-) = -1, Sign(c+) = +1; (3.8) Sign(hc) = - Sign(c), nếu h là âm đối với c; (3.9) Sign(hc) = + Sign(c), nếu h là dương đối với c; (3.10) Sign(h'hx) = -Sign(hx), nếu h’hx ≠ hx và h' là âm đối với h; (3.11) Sign(h'hx) = + Sign(hx), nếu h’hx ≠ hx và h' là dương đối với h; (3.12) Sign(h'hx) = 0 nếu h’hx = hx. (3.13) Gọi fm là một độ đo tính mờ trên X, ánh xạ ngữ nghĩa định lượng ν: X → [0,1], được sinh ra bởi fm trên X, được xác định như sau: v(W)=θ = fm ( c− ), (3.14) v()()() c−=θ −α fm c − = β fm c − , (3.15) v( c+ )=θ +α fm ( c + ) = 1 − β fm ( c + ) (3.16) Trường Đại học Thăng Long 34
  6. Kỷ yếu công trình khoa học 2015 - Phần I j vhx()()= vx + signhx (){ fmhx ()()()} −ω hxfmhx (3.17) j j∑i= sign() j i j j 1 với ω()hx= [1 + Signhxsignhhx () ( )(β −α )]{,} ∈ α β , (3.18) j2 j p j j ∈ [-q^p], j ≠ 0. Để thuận tiện cho việc biểu diễn ngữ nghĩa của các giá trị ngôn ngữ [16], giả sử rằng miền tham chiếu thông thường của các biến ngôn ngữ X là đoạn [a, b] còn miền tham chiếu ngữ nghĩa Xs là đoạn [as,bs] ( 0 ≤. as < bs ≤ 1 ). Việc chuyển đổi tuyến tính từ [a, b] sang [as,bs] được gọi là phép ngữ nghĩa hóa tuyến tính (linear semantization) còn việc chuyển ngược lại từ đoạn [as,bs] sang [a, b] được gọi là phép giải nghĩa tuyến tính (linear desemantization). Đoạn [a, b ] được gọi là đoạn giải nghĩa. Trong nhiều ứng dụng của ĐSGT đã sử dụng miền ngữ nghĩa là đoạn [as=0, bs=1], khi đó phép ngữ nghĩa hóa tuyến tính được gọi là phép chuẩn hóa (linear Semantization = Normalization) và phép giải nghĩa tuyến tính được gọi là phép giải chuẩn (Linear Desemantization = Denormalization ). Nhiều ứng dụng của ĐSGT trong nhiều lĩnh vực khoa học đòi hỏi mở rộng không gian tham số trong các phép ngữ nghĩa hóa và phép giải nghĩa để có nhiều tham số lựa chọn mềm dẻo hơn nữa. Điều này chỉ có thể có được khi mở rộng phép ngữ nghĩa hóa và phép giải nghĩa từ tuyến tính sang phi tuyến. Như vậy có thể biểu diễn phép ngữ nghĩa hóa và phép giải nghĩa như sau: Linear Semantization (x) = xs = as + ( bs – as ) ( x – a ) / ( b – a) (3.19a) Normalization (x) = xs = ( x – a ) / (b – a ) (3.19b) Nonlinear Semantization (x) = f(xs,sp) (3.19c) Với điều kiện: 0 ≤ f(xs,sp) ≤ 1 và f(xs=0,sp) = 0 và f(xs=1,sp) = 1 Hàm f(.) được chọn tùy theo từng ứng dụng và là hàm liên tục, đồng biến để đảm bảo thứ tự ngữ nghĩa. Ví dụ có thể chọn f(xs,sp) dựa trên Normalization(x) như sau: Nolinear Normalization (x) = sp.xs(1-xs) + xs (3.19d) Tương tự: Linear Desemantization (xs) = x = a + (b – a) (xs – as) / (bs – as) (3.20a) Denormalization (xs) = x = a + ( b – a )xs (3.20b) Nonlinear Desemantization (xs) = g(x,dp) (3.20c) Với điều kiện: a ≤ g(x,dp) ≤ b và g(x = a,dp) = a và g(x = b,dp) = b Hàm g(.) được chọn tùy theo từng ứng dụng và là các hàm liên tục, đồng biến tương ứng với thứ tự ngữ nghĩa. Ví dụ sau khi chọn f(xs,sp ), có thể tiếp tục chọn g(x,dp) dựa trên Denormalization (f(xs,sp) ) như sau: Nonlinear Denormalization (f(xs,sp)) = dp(( Denormalization (f(xs,sp))–a ). (b – Denormalization (f(xs,sp))) / (b-a) + Denormalization (f(xs,sp)) ( 3.20d ) Trong đó Denormalization (f(xs,sp)) = (sp.x.(1-x)+x ).(b-a) + a ( 3.20d1) Trường Đại học Thăng Long 35
  7. Kỷ yếu công trình khoa học 2015 - Phần I Hàm f(xs,sp) là hàm biểu diễn phép ngữ nghĩa hóa phi tuyến, g(x.dp) là hàm biểu diễn phép giải nghĩa phi tuyến chưa được sử dụng trong các ứng dụng của ĐSGT, trong đó sp∈[-1 1] là tham số ngữ nghĩa hóa, dp ∈[-1 1] là tham số giải nghĩa.Khi sp=dp=0; tính phi tuyến bị loại bỏ và biểu thức (3.19d) trở thành (3.19b) và (3.20d) trở thành (3.20b). Cho trước độ đo tính mờ của các gia tử µ(h) và các giá trị độ đo tính mờ của các phần tử sinh fm(c-), fm(c+) và θ là phần tử trung hoà (neutral). Khi đó mô hình tính toán của ĐSGT được xây dựng trên cơ sở các biểu thức từ (3.1) đến (3.20) được kích hoạt và thực tế đã được sử dụng hiệu quả trong rất nhiều ứng dụng. Phép mờ hóa và phép giải mờ trong tiếp cận mờ được thay thế tương ứng bằng phép ngữ nghĩa hóa và phép giải nghĩa trong tiếp cận ĐSGT. Hệ luật được thể hiện bằng siêu mặt làm cơ sở cho quá trình suy luận xấp xỉ. Một lưu ý quan trọng của quá trình tính toán trong tiếp cận ĐSGT là cần xác định các tham số ban đầu như độ đo tính mờ của các phần tử sinh và độ đo tính mờ của các gia tử trong biến ngôn ngữ một cách thích hợp dựa trên cơ sở phân tích ngữ nghĩa của miền ngôn ngữ trong từng bài toán ứng dụng cụ thể. Khi đó mô hình tính toán của tiếp cận ĐSGT sẽ cho các kết quả hợp lý trong các ứng dụng. Đối với mô hình dự báo chuỗi thời gian mờ của Song & Chissom và Chen, có thể thấy rõ ba giai đoạn: mờ hóa, xác định quan hệ mờ và giải mờ. Như vậy, hoàn toàn có thể thay thế tiếp cận mờ với ba giai đoạn trên đây bằng tiếp cận ĐSGT cũng với ba giai đoạn tương tự: ngữ nghĩa hóa , xác định nhóm quan hệ ngữ nghĩa và giải nghĩa. Mô hình dự báo chuỗi thời gian mờ dựa trên ĐSGT có các bước cơ bản sau đây: Bước 1. Xác định tập nền, chia miền xác định của tập nền thành những khoảng bằng nhau. Bước 2. Xây dựng các nhãn ngữ nghĩa (giá trị ngôn ngữ theo tiếp cận ĐSGT) trên tập nền. Bước 3. Ngữ nghĩa hóa chuỗi dữ liệu. Bước 4. Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Bước 6. Giải nghĩa đầu ra dự báo. Các bước trên đây tương tự với các bước dự báo trong mô hình Chen nhưng trong tiếp cận ĐSGT không sử dụng tập mờ mà dùng ngữ nghĩa định lượng mô tả trực tiếp ngữ nghĩa của giá trị ngôn ngữ. Bài toán được chọn để so sánh và làm rõ hiệu quả dự báo của mô hình trên là bài toán dự báo số sinh viên nhập học tại trường Alabama do Song & Chissom [2 3] và Chen [4] đặt ra đầu tiên để nghiên cứu mô hình chuỗi thời gian mờ. Đây cũng là bài toán cho đến nay vẫn được Chen [5,6,7,8] và nhiều tác giả trên thế giới quan tâm nghiên cứu cải tiến [9,10, 11, 12, 13, 14, 20, 21, 22, 23]. Chúng tôi cũng sử dụng số liệu này để xây dựng quá trình dự báo dựa trên ĐSGT. Các bước tính toán dựa trên ĐSGT cụ thể như sau: Trường Đại học Thăng Long 36
  8. Kỷ yếu công trình khoa học 2015 - Phần I Bước 1: Xác định tập nền, chia miền xác định của tập nền thành những khoảng bằng nhau. Tập nền U được chọn tương tự mô hình Chen [4] có khoảng xác định: [Dmin−D1, Dmax+D2] với Dmin và Dmax là số sinh viên nhập học thấp nhất và cao nhất theo dữ liệu lịch sử nhập học của trường. Cụ thể Dmin=13055 và Dmax=19337, D1 = 55 và D2 = 663, như vậy U= [13000, 20000]. Chia tập nền U thành 7 khoảng bằng nhau u1, u2, u3, u4, u5, u6 và u7. Trong đó u1 = [13000, 14000], u2 = [14000, 15000], u3 = [15000, 16000], u4 = [16000, 17000], u5 = [17000, 18000], u6 = [18000, 19000] và u7 = [19000, 20000]. Bước 2. Xây dựng các nhãn ngữ nghĩa trên tập nền. Để tiện theo rõi và so sánh với các bước dự báo trong mô hình Chen, ở đây sử dụng một số ký hiệu tương tự những ký hiệu Chen đã sử dụng. Giả sử A1, A2 , , Ak là các nhãn ngữ nghĩa được gán cho các khoảng u1, u2, uk, k là số khoảng trên tập nền. Khác với tập mờ trong nghiên cứu của Chen, các nhãn ngữ nghĩa ở đây được xây dựng từ các phần tử sinh c-, c+ với các gia tử h ϵ H tạo thành các giá trị ngôn ngữ của biến ngôn ngữ “số sinh viên nhập học ”. Khi đó các nhãn ngữ nghĩa A1, A2 , , Ak có dạng sau đây: A1= hA1c; A2= hA2c; .; Ak= hAkc, trong đó hAi, (i=1,2, k) là chuỗi gia tử tác động lên c với c ∈{c-, c+}. Trong [4], Chen sử dụng các giá trị ngôn ngữ A1 = (not many), A2 = (not too many), A3 = (many), A4 = (many many), A5 = (very many), A6 = (too many) và A7 = (too many many). Theo tiếp cận ĐSGT, 2 gia tử “very”và “little” tác động lên 2 phần tử sinh “small”và “large” được sử dụng để tạo ra 7 nhãn ngữ nghĩa tương ứng với 7 giá trị ngôn ngữ của Chen như sau: A1 = (very small), A2 = (small), A3 = (little small), A4 = (midle), A5 = (little large), A6 = (large) và A7 = (very large). Bước 3. Ngữ nghĩa hóa chuỗi dữ liệu. Để xác định ngữ nghĩa định lượng cho các nhãn ngữ nghĩa A1, A2, ,A7 ở bước 2, cần chọn trước độ đo tính mờ của các gia tử µ(very), µ(little) và giá trị độ đo tính mờ của phần tử sinh fm(c-) = θ với θ là phần tử trung hoà được cho trước. Nếu gia tử dương “very” và gia tử âm “little ” tác động lên các phần tử sinh “large” hoặc “small” như trên, thì µ(little) = α và µ(very) = 1- α = β theo(3.7). Như vậy ngữ nghĩa định lượng của các nhãn ngữ nghĩa sẽ chỉ phụ thuộc vào các tham số của ĐSGT α, θ và hoàn toàn được xác định sau khi thay các giá trị α, θ vào các phương trình tính toán ngữ nghĩa định lượng từ (3.14) đến (3.18). Cụ thể là 7 giá trị ngữ nghĩa định lượng của 7 nhãn ngữ nghĩa A1,A2, A7 được gán tương ứng cho 7 khoảng u1, u2, , u7 có dạng tham số hóa sau đây: ν(very small) = θ(1-α)(1-α) (3.21) ν(small) = θ(1-α) (3.22) ν(little small) = θ(1-α+α2) (3.23) ν(midle) = θ (3.24) ν(little large) = θ+α(1-θ)(1-α) (3.25) ν(large) = θ+(1-θ)α (3.26) ν(very large) = θ+α(1-θ)(2-α) (3.27) Trường Đại học Thăng Long 37
  9. Kỷ yếu công trình khoa học 2015 - Phần I Nếu chọn trước α = 0.5 và θ = 0.5, thì các phương trình từ (3.21) đến (3.27) trở thành: ν(very small) = 0.125 (3.28) ν(small) = 0.25 (3.29) ν(little small) = 0.375 (3.30) ν(midle) = 0.5 (3.31) ν(little large) = 0.625 (3.32) ν(large) = 0.75 (3.33) ν(very large) = 0.875 (3.34) Ký hiệu: SA = Semantization (A) là giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa A, khi đó: SA1 = ν(very small); SA2 = ν(small); SA3 = ν(little small); SA4 = ν(midle); SA5 = ν(little large); SA6 = ν(large) và SA7 = ν(very large) là các giá trị ngữ nghĩa định lượng theo các tham số được chọn trước α, θ. Khi đó dễ dàng thấy rằng: SA1 < SA2 < SA3 < SA4 < SA5 < SA6 < SA7 (3.35) Tương tự như trên, có thể xây dựng các công thức tính toán các giá trị ngữ nghĩa định lượng theo các nhãn ngữ nghĩa khi có nhiều gia tử tác động lên phần tử sinh. Biểu thức (3.35) thể hiện rõ những tính chất quan trọng sau đây: Thứ tự ngữ nghĩa luôn được đảm bảo. Các nhãn ngữ nghĩa Ai có giá trị ngữ nghĩa định lượng SAi và luôn có quan hệ ngữ nghĩa với nhau thông qua bộ tham số của ĐSGT α, θ, µ(hAi), i= 1, 2, Như vậy, trong các ứng dụng cụ thể của tiếp cận ĐSGT, ảnh hưởng của bộ tham số mang tính hệ thống. Có nghĩa là tất cả các giá trị ngôn ngữ trong biến ngôn ngữ đều chịu ảnh hưởng bởi bộ tham sô của ĐSGT. Những tính chất trên đây tạo ra sự khác biệt giữa tiếp cận ĐSGT và tiếp cận mờ. Trong tiếp cận mờ, các giá trị ngôn ngữ sử dụng tập mờ hoàn toàn không có ràng buộc với nhau. Bước 4: Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Các quan hệ ngữ nghĩa được xác định trên cơ sở các dữ liệu lịch sử. Nếu đặt chuỗi thời gian mờ F(t-1) là Ak có ngữ nghĩa định lượng SAk và F(t) là Am có ngữ nghĩa định lượng SAm, thì Ak có quan hệ với Am và dẫn đến SAk có quan hệ với SAm. Quan hệ này được gọi là quan hệ ngữ nghĩa theo nhãn ngữ nghĩa và được ký hiệu là: SAk → SAm hoặc Semantization (Aj) → Semantization (Ak) (3.36) Trong bài toán dự báo số sinh nhập học tại trường Alabama, ở đây Ak là nhãn ngữ nghĩa mô tả số sinh viên nhập học của năm hiện tại với ngữ nghĩa định lượng SAk, Am là nhãn ngữ nghĩa mô tả số sinh viên nhập học của năm tiếp theo với ngữ nghĩa định lượng SAm. Như vậy, trên cơ sở số liệu của Chen [4], có thể xác định được các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa ( kể cả số lần trùng nhau ) sau đây: SA1 → SA1 (trùng nhau 2 lần); SA1 → SA2; Trường Đại học Thăng Long 38
  10. Kỷ yếu công trình khoa học 2015 - Phần I SA2 → SA3; SA3 → SA3 (trùng nhau 7 lần); SA3 → SA4 (trùng nhau 2 lần); SA4 → SA4 (trùng nhau 2 lần); SA4 → SA3; SA4 → SA6; SA6 → SA6; SA6 → SA7; SA7 → SA7 và SA7 → SA6 (3.37) Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Nếu một ngữ nghĩa định lượng (vế trái (3.37)) có quan hệ với nhiều ngữ nghĩa định lượng (vế phải (3.37)), thì vế phải được chập lại thành một nhóm. Quan hệ được lập theo nhóm như vậy được gọi là nhóm quan hệ ngữ nghĩa (NQHNN). Như vậy từ (3.37) nhận được các NQHNN sau đây: Nhóm 1: SA1 → (SA1, SA1, SA2) Nhóm 2: SA2 → (SA3) Nhóm 3: SA3 → (SA3, SA3, SA3, SA3, SA3, SA3, SA3, SA4, SA4) Nhóm 4: SA4 → (SA4, SA4, SA3, SA6) Nhóm 5: SA6 → (SA6, SA7) Nhóm 6: SA7 → (SA7, SA6) Bước 6. Giải nghĩa đầu ra dự báo. Giả sử số sinh viên nhập học tại năm (t-1) của chuỗi thời gian mờ F(t-1) được ngữ nghĩa hóa theo (3.19) là SAj, khi đó đầu ra dự báo của F(t) hay số sinh viên nhập học dự báo tại năm t được xác định theo các nguyên tắc (luật) sau đây: 1. Nếu tồn tại quan hệ 1-1 trong nhóm quan hệ ngữ nghĩa theo nhãn ngôn ngữ Aj như sau: SAj → SAk, theo (3.19d): Nonlinear Semantization (Aj) → Nonlinear Semantization (Ak) , thì đầu ra dự báo được tính theo (3.20d): DSAj → Nonlinear Desemantization (SAk) trên đoạn giải nghĩa uk được chọn sao cho bao được uk và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin−D1, Dmax+D2]. 2. Nếu SAk là trống, SAj → ∅, thì đầu ra dự báo được tính theo (3.20d): DSAj → Nonlinear Desemantization (∅) trên đoạn giải nghĩa được chọn sao cho bao được uj và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin−D1, Dmax+D2]. 3. Nếu tồn tại quan hệ 1-nhiều trong nhóm quan hệ ngữ nghĩa (kể cả quan hệ trùng) theo nhãn ngôn ngữ Aj: SAj → (SAi,SAk, , SAr), theo (3.19d): NonlinearSemantization (Aj) → (NonlinearSemantization (Ai), NonlinearSemantization (Ak), , NonlinearSemantization (Ar)), thì đầu ra dự báo được xác định theo (3.20d) cho từng dữ liệu lịch sử của nhóm quan hệ ngữ nghĩa: DSAj → NonlinearDesemantization (WSAiAj * SAi+ WSAkAj * SAk+ + WSArAj * SAr) trên một đoạn giải nghĩa được chọn sao cho bao được ui, uk ur và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin−D1, Dmax+D2]. Trong đó WSAiAj, WSAkAj , WSArAj là trọng số ngữ nghĩa của từng thành phần trong NQHNN theo nhãn ngữ nghĩa Aj và được tính bằng tỷ số giữa số dữ liệu thuộc khoảng ui và tổng số dữ liệu thuộc các khoảng ui, uk, , ur của NQHNN. Trường Đại học Thăng Long 39
  11. Kỷ yếu công trình khoa học 2015 - Phần I Lưu ý rằng cách chọn đoạn giải nghĩa như trên luôn đảm bảo không phá vỡ nhóm quan hệ mờ nhưng đồng thời có thể cho phép tính toán dự báo cho từng điểm dự báo trong cùng nhóm quan hệ mờ. Trong bài toán dự báo số sinh viên nhập học tại trường đại học Alabama, có thể chọn các đoạn giải nghĩa hợp lý theo phép thử – sai với các giá trị đầu, giá trị cuối như trong Bảng 3.1 sau đây: Bảng 3.1 Giá trị đầu và giá trị cuối của các đoạn giải nghĩa được chọn Các điểm dự Giá trị Giá trị Các điểm dự Giá trị Giá trị báo đầu cuối báo đầu cuối 1 ( 1972 ) 13000 17000 12 ( 1983 ) 14000 18000 2 ( 1973 ) 13000 18000 13 ( 1984 ) 14000 17000 3 ( 1974 ) 13000 20000 14 ( 1985 ) 14000 17000 4 ( 1975 ) 15000 16000 15 ( 1986 ) 15000 18000 5 ( 1976 ) 14000 17000 16 ( 1987 ) 15000 19000 6 ( 1977 ) 14000 18000 17 ( 1988 ) 15000 20000 7 (1978 ) 15000 18000 18 ( 1989 ) 16000 20000 8 ( 1979 ) 15000 19000 19 ( 1990 ) 17000 20000 9 ( 1980 ) 15000 19000 20 ( 1991 ) 17000 20000 10 ( 1981 ) 14000 19000 21 ( 1992 ) 15000 20000 11 ( 1982 ) 13000 18000 Ví dụ tính toán dự báo cho năm 1972 với θ = 0.5, α = 0.5, sp = 0.3 và dp = - 0.2: Thực hiện các bước 1, 2, 3 và 4 bước như ở trên, sau đó tính toán ngữ nghĩa cho nhóm 1 tại bước 5 với NQHNN SA1 → (SA1, SA1, SA2) như sau: Theo Bảng 3.2: Nhóm 1 có NQHNN thuộc các khoảng u1 và u2. Số dữ liệu thuộc khoảng u1 gồm 3 giá trị: 13055, 13563 và 13867 nhưng trùng nhau 2 lần. Do đó số dữ liệu thuộc khoảng u1 là (3*2 = 6). Số dữ liệu thuộc khoảng u2 gồm 1 giá trị: 14696. Như vậy tổng số dữ liệu thuộc các khoảng u1, u2 của nhóm 1 là (3*2+1) = 7 và trọng số ngữ nghĩa của SA1 theo nhãn ngữ nghĩa A1 là WSA1A1 = 3 / (3*2+1) = 3/7. Tương tự tính được trọng số ngữ nghĩa của SA2 theo nhãn ngữ nghĩa A1 là WSA2A1 = 1/7. Với SA1 = 0.125, SA2 = 0.25, ngữ nghĩa của nhóm 1 là: (SA1, SA1, SA2) = WSA1A1*SA1 + WSA1A1*SA1 + WSA2A1*SA2 = (3/7)*0.125 + (3/7)*0.125 + (1/7)*0.25 = 0.143. Đoạn giải nghĩa dự báo được chọn cho năm 1972 theo Bảng 3.1 là [13000 – 17000]. Trước hết tinh toán giá trị giải nghĩa tuyến tính cho phép ngữ nghĩa hóa phi tuyến theo (3.20d1) với sp=0.3: Trường Đại học Thăng Long 40
  12. Kỷ yếu công trình khoa học 2015 - Phần I Denormalization (f(xs,sp))=f(0.143,0.3)=(0.3*0.143*(1-0.143)+0.143)*(17000-13000) + 13000 = 13719. Tiếp tục tính giá trị giải nghĩa phi tuyến cho phép ngữ nghĩa hóa phi tuyến theo (3.20d) với dp = -0.2: Nonlinear Denormalization (f(xs,sp )) = g(13719,-0.2) = (-0.2)*(13719- 13000)*(17000-13719) / (17000-13000) + 13719 = 13600. Như vậy, giá trị dự báo cho năm 1972 theo (3.20d) là: DSA1 → Nonlinear DeNormalization (f(xs,sp )) = g(13719,-0.2) = 13600 Bằng cách tương tự có thể tính toán dự báo cho các năm 1973, 1974 để nhận được các giá trị dự báo cụ thể cho năm 1973, 1974, , 1992. Như vậy với số sinh viên nhập học từ 1971 đến 1992, trên cơ sở 6 bước theo tiếp cận ĐSGT, xây dựng được mô hình dự báo cho năm 1971 → 1972 , 1972 → 1973, , 1991 → 1992. Chương trình tính toán trên cơ sở sử dụng MATLAB R2013a. Kết quả của mô hình dự báo sử dụng ĐSGT được mô tả trong Bảng 3.2. để so sánh với các kết quả của một số mô hình dự báo khác hiện có với cùng 7 khoảng chia. Trong trường hợp phép ngữ nghĩa hóa phi tuyến và phép giải nghĩa phi tuyến với sp = 0.3 và dp = - 0.2, kết quả tính toán nhận được MSE = 65020. Bảng 3.2: So sánh các phương pháp dự báo với 7 khoảng chia Phương Phương Phương Số sinh viên Năm pháp Chen pháp Lee pháp nhập học [4] [9] ĐSGT 1971 13055 1972 13563 14000 13833 13600 1973 13867 14000 13833 13750 1974 14696 14000 13833 14050 1975 15460 15500 15500 15396 1976 15311 16000 15722 15232 1977 15603 16000 15722 15642 1978 15861 16000 15722 16232 1979 16807 16000 15722 16643 1980 16919 16833 16750 17027 1981 16388 16833 16750 16533 1982 15433 16833 16750 15533 1983 15497 16000 15722 15642 Trường Đại học Thăng Long 41
  13. Kỷ yếu công trình khoa học 2015 - Phần I 1984 15145 16000 15722 15232 1985 15163 16000 15722 15232 1986 15984 16000 15722 16232 1987 16859 16000 15722 16643 1988 18150 16833 16750 17534 1989 18970 19000 19000 19288 1990 19328 19000 19000 19466 1991 19337 19000 19000 19466 1992 18876 19000 19000 19111 MSE 407507 397537 65020 4. MÔ HÌNH DỰ BÁO TỐI ƯU THEO TIẾP CẬN ĐSGT Vấn đề dự báo tối ưu chuỗi thời gian mờ theo nghĩa cực tiểu sai số trung bình bình phương MSE có thể được thực hiện trên cơ sở 46 tham số như sau: tham số sp của phép ngữ nghĩa hóa (3.19d), tham số dp của phép giải nghĩa (3.20d) , 21 tham số giá trị đầu, 21 giá trị cuối của đoạn giải nghĩa tương ứng với 21 điểm dự báo và 2 tham số θ, α của ĐSGT. Chương trình tính toán trên cơ sở sử dụng phần mềm tối ưu hóa GA của MATLAB R2013a. Kết quả của mô hình dự báo dựa trên ĐSGT với các tham số θ, α, sp, dp và 42 các giá trị đầu, giá trị cuối của đoạn giải nghĩa được tìm tối ưu theo nghĩa cực tiểu hàm MSE và kết quả được mô tả trong Bảng 4.1, trong đó MSE có dạng: 21 MSE = (∑ (SSVNHTTi− SSVNHDBi )) / 21 ( 4.1 ) i=1 Ở đây: MSE (Mean Square Error) là sai số trung bình bình phương; SSVNHTTi là số sinh viên nhập học thực tế năm i; SSVNHDBi là số sinh viên nhập học dự báo năm i. Bảng 4.1 Kết quả tính toán dự báo tối ưu số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 theo tiếp cận ĐSGT Bộ tham số tối ưu nhận được: θ* = 0.317; α* =0.382; sp* = 0.375 và dp* = 0.418 với MSE= 35718 Năm Số sinh viên Số sinh Năm Số sinh viển Số sinh nhập học viên nhập nhập học viên nhập thực tế học dự thực tế học dự báo báo 1971 13055 1982 15433 16031 1972 13563 13574 1983 15497 15498 Trường Đại học Thăng Long 42
  14. Kỷ yếu công trình khoa học 2015 - Phần I 1973 13867 13866 1084 15145 15146 1974 14696 14644 1985 15163 15164 1975 15460 15461 1986 15984 15983 1976 15311 15310 1987 16859 16858 1977 15603 15602 1988 18150 17526 1978 15861 15860 1989 18970 18971 1979 16807 16806 1990 19328 19329 1980 16919 16918 1991 19337 19338 1981 16388 16389 1992 18876 18877 Mô hình dự báo chuỗi thời gian mờ tối ưu theo tiếp cận ĐSGT ứng dụng cho bài toán dự báo số sinh viên nhập học tại trường đại học Alabama được so sánh với các mô hình dự báo khác theo tiếp cận mờ sử dụng bậc cao, số khoảng lớn hơn 7, được tổng hợp trong Bảng 4.2. Bảng 4.2 So sánh các kết quả mô hình dự báo tối ưu theo tiếp cận ĐSGT và các kết quả mô hình dự báo cải tiến khác . Phương Pháp MSE Phương Pháp MSE Witold Pedryczc 198203 (7 khoảng ) Ozdemir [12] Tối ưu 78073 [23] độ dài khoảng kết 66689 (17 khoảng) hợp mạng nơron Tối ưu PSO (2015) 14544 (22 khoảng) (2012) Bai [14] bậc 2 140676 Singh[21] bậc 87025 (2011) 3(2007) Uslu [20] tối ưu 106276 Egrioglu [13] (2010) 60714 DEA (2013) Huarng [10] độ dài 78792 Tiếp cận ĐSGT 35718 khoảng khác nhau sp* = 0.375 hiệu quả (2001) dp* = 0.418 θ* = 0.317; α* =0.382 5. KẾT LUẬN Vấn đề dự báo chuỗi thời gian mờ trong những năm gần đây được rất nhiều chuyên gia trên thế giới quan tâm nghiên cứu. Nhiều nghiên cứu sử dụng mô hình chuỗi thời gian mờ bậc cao với độ dài khoảng và số lượng khoảng hợp lý đã cho kết quả dự báo số sinh viên nhập học tại trường Đại học Alabama khá chính xác [7, 12, 13, 21] . Mô hình dự báo dựa trên ĐSGT là Trường Đại học Thăng Long 43
  15. Kỷ yếu công trình khoa học 2015 - Phần I một mô hình mới, hoàn toàn khác biệt, có khả năng dự báo chuỗi thời gian mờ với độ chính xác cao hơn so với một số mô hình dự báo hiện có. Sự khác biệt thể hiện ở phương pháp luận khi lần đầu tiên sử dụng phép ngữ nghĩa hóa phi tuyến thay cho phép mờ hóa, nhóm quan hệ ngữ nghĩa thay cho nhóm quan hệ mờ và phép giải nghĩa phi tuyến thay cho phép giải mờ. Mặc dù chỉ sử dụng mô hình chuỗi thời gian mờ bậc nhất với 7 khoảng chia dữ liệu lịch sử như mô hình dự báo đầu tiên của Chen [4], nhưng kết quả ứng dụng mô hình dự báo dựa trên ĐSGT với sự tham số hóa các nhãn ngữ nghĩa từ (3.21) đến (3.27) của biến ngôn ngữ ( thể hiện trong Bảng 3.3 ) đã cho thấy rõ hiệu quả dự báo tốt hơn so với một số phương pháp dự báo cùng sử dụng 7 khoảng hiện có [4, 9]. Hơn nữa, mô hình dự báo với bộ tham số tối ưu của ĐSGT (Bảng 4.2) cũng tốt hơn so với một số mô hình sử dụng nhiều kỹ thuật phức tạp khác nhau như mô hình dự báo chuỗi thời gian mờ bậc cao, số khoảng chia lớn hơn 7 [13, 14, 21], hoặc một số mô hình dự báo tối ưu khác trong [10, 12, 20, 23]. Rõ ràng rằng: tính chính xác hơn của mô hình dự báo tối ưu sai số trung bình bình phương MSE sử dụng ĐSGT so với một số mô hình dự báo tối ưu khác được đảm bảo ở khả năng tối ưu bộ tham số của ĐSGT θ*, α* trong sự kết hợp với các tham số mở rộng của phép ngữ nghĩa hóa phi tuyến sp* và phép giải nghĩa phi tuyến dp* với 42 tham số của đoạn giải nghĩa trên cơ sơ sở khai thác toàn diện và có tính hệ thống những thông tin ẩn chứa trong nhóm quan hệ ngữ nghĩa. Những kết quả của bài báo này đã mở ra hướng nghiên cứu mới cho lĩnh vực dự báo chuỗi thời gian mờ. 6. TÀI LIỆU THAM KHẢO [1]. Song Q, Chissom B.S. Fuzzy time series and its models. Fuzzy Sets and Syst. 54 269–277, 1993 [2]. Song Q, Chissom B.S, Forecasting enrollments with fuzzy time series – part 1. Fuzzy Sets and Syst. 54, 1–9, 1993 [3]. Song Q, Chissom, B S, Forecasting enrollments with fuzzy time series – part 2. Fuzzy Sets and Syst. 62, 1–8, 1994. [4]. Chen, S.M, Forecasting Enrollments Based on Fuzzy Time Series. Fuzzy Sets and Syst. 81, 311–319, 1996 [5]. Chen S M and Wang N Y, Fuzzy Forecasting Based on Fuzzy-Trend Logical Relationship Groups. IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART B: CYBERNETICS, VOL. 40, NO. 5, 1343-1358, 2010 [6]. Chen S.M, Chen C D, Handling forecasting problems based on high-order fuzzy logical relationships. Expert Systems with Applications 38, 3857–3864, 2011 [7]. Chen S M, Forecasting Enrollments based on High Order Fuzzy Time Series. Cybernetics and Systems: An International Journal. 33,1-16, 2002. [8]. Chen S.M and Chung N.Y, Forecasting enrollments using high-order fuzzy time series and genetic algorithms, Int. Journal of Intelligent Systems 21, 485-501. 2006 [9]. Lee M H, Efendi R, Ismad Z, Modified Weighted for Enrollments Forecasting Based on Fuzzy Time Series. MATEMATIKA, 25(1), 67-78, 2009. [10]. Huarng K, Effective lengths of intervals to improve forecasting in fuzzy time series. Fuzzy Sets and Systems 123 387–394, 2001. Trường Đại học Thăng Long 44
  16. Kỷ yếu công trình khoa học 2015 - Phần I [11]. Nguyễn Công Điều: Một thuật toán mới cho mô hình chuỗi thời gian mờ. Tạp chí KHOA HỌC VÀ CÔNG NGHỆ, Tâp 49, Số 4, 11-25, 2011. [12]. Ozdemir O, Memmedli M, Optimization of Interval Length for Neural Network Based Fuzzy Time Series. IV International Conference “Problems of Cybernetics and Informatics”, September 12-14, 104-105, 2012 [13]. Egrioglu E, Aladag C H, Yolcu U,. Uslu V R, Basaran M A, Finding an optimal interval length in high order fuzzy time series. Expert Systems with Applications 37 5052– 5055, 2010. [14]. Bai E, Wong W K, Chu W C, Xia M and Pan F, A heuristic time invariant model for fuzzy time series forecasting. Expert Systems with Applications, 38, 2701-2707, 2011. [15]. Ho N. C. and Wechler W, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, Vol. 35,3, 281- 293, 1990 [16]. Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge-algebras-based controller: Design and Application, Fuzzy Sets and Systems 159, 968– 989, 2008 [17]. Nguyen C.H, Huynh V.N, Pedrycz W, A Construction of Sound Semantic Linguistic Scales Using 4-Tuple Representation of Term Semantics, Int. J. Approx. Reason 55 763–786, 2014 [18]. Dinko Vukadinović, Mateo Bašić, Cat Ho Nguyen, Nhu Lan Vu, Tien Duy Nguyen, Hedge-Algebra-Based Voltage Controller for a Self-Excited Induction Generator, Control Engineering Practice, 30, 78–90, 2014. [ 19]. Hai-Le Bui , Cat-Ho Nguyen, Nhu-Lan Vu, Cong-Hung Nguyen, General design method of hedge-algebras-based fuzzy controllers and an application for structural active control. Applied Intelligence, Vol 43, N 2, 251-275, 2015 [20]. Uslu V R, Bas, E Yolcu U, Egrioglu E, A New Fuzzy Time Series Analysis Approach by using Differential Evolution Algorithm and Chronologically-Determined Weights. Vol. 2, No.1, 18-30, 2013. [21]. Singh S R, A robust method of forecasting based on fuzzy time series.Applied Mathematics and Computation 188, 427-484, 2007. [22]. Hwang, J.-R., Chen, S.-M., Lee, C.-H. : Handling Forecasting problems using fuzzy time series. Fuzzy Sets and Systems 100, 217-228, 1998. [23]. Lua W, Chen X, Pedryczc W, Liu X, Yang J, Using interval information granules to improve forecasting in fuzzy time series. International Journal of Approximate Reasoning, 57, 1–18, 2015. FUZZY TIME SERIES FORECASTING BASED ON HEDGE ALGEBRAS Tran Quang Duy, Nguyen Cong Dieu, Vu Nhu Lan Abstract: Fuzzy time series has been firstly proposed by Song & Chissom (1993) and widely studied for forecasting purposes now. However, the accuracy of forecasts based on the concept of fuzzy approach of Song & Chissom is not high because of such depends on very Trường Đại học Thăng Long 45
  17. Kỷ yếu công trình khoa học 2015 - Phần I many factors. Chen (1996) proposed an efficient fuzzy time series model which consists of simple arithmetic calculations only. After that, this has been widely studied for improving accuracy of forecasting in many applications to get better results. The hedge algebras developed by Nguyen and Wechler (1990) was completely different from the fuzzy approach. Fuzzy time series method generally embodies three stages such as fuzzification, determination of fuzzy relations and defuzzification stages. In hedge algebras, instead of performing fuzzification and defuzzification, more simple methods are adopted, termed as semantization and desemantization, respectively. In this paper, we present a new approach using hedge algebras to provide a computational model, which is completely different from the fuzzy approach for fuzzy time series forecasting. The experimental results of forecasting enrollments of students of the University of Alabama show that the model of fuzzy time series based on hedge algebras is better than many existing models. . Keywords: Fuzzy Sets, Fuzzy Logical Relationship Groups, Hedge Algebras, Fuzzy Time Series Forecasting. Trường Đại học Thăng Long 46