Khai phá luật kết hợp mờ giải quyết bài toán: Ảnh hưởng của quá trình học tập ở phổ thông trung học đến kết quả kỳ thi Đại học - Cao đẳng

pdf 9 trang hapham 2440
Bạn đang xem tài liệu "Khai phá luật kết hợp mờ giải quyết bài toán: Ảnh hưởng của quá trình học tập ở phổ thông trung học đến kết quả kỳ thi Đại học - Cao đẳng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkhai_pha_luat_ket_hop_mo_giai_quyet_bai_toan_anh_huong_cua_q.pdf

Nội dung text: Khai phá luật kết hợp mờ giải quyết bài toán: Ảnh hưởng của quá trình học tập ở phổ thông trung học đến kết quả kỳ thi Đại học - Cao đẳng

  1. Kỷ yếu cơng trình khoa học 2015 – Phần I KHAI PHÁ LUẬT KẾT HỢP MỜ GIẢI QUYẾT BÀI TỐN: ẢNH HƯỞNG CỦA QUÁ TRÌNH HỌC TẬP Ở PHỔ THƠNG TRUNG HỌC ĐẾN KẾT QUẢ KỲ THI ĐẠI HỌC - CAO ĐẲNG ThS. Trần Tuấn Tồn1; PGS. TS. Nguyễn Thiện Luận2; ThS. Lê Minh Tuấn3; ThS. Nguyễn Văn Cơn4; ThS. Vũ Lệ Hằng5; KTs. Phan Huy Bình6; Tĩm tắt: Trên c s d liu hc tp ca 15000 hc sinh PTTH ca mt s trưng trên các a bàn Hà Ni, Tp. H Chí Minh, Hịa Bình, Thanh Hĩa, và kt qu ca 3,6 triu lưt thí sinh thi i hc, cao ng, chúng tơi ã áp dng và ci tin mơ hình, thut tốn khai phá d liu trích rút các lut kt hp m. Các lut này cho phép ánh giá nh hưng ca quá trình hc tp, ging dy cp PTTH n kt qu tuyn chn vào i hc, Cao ng trong nhng nm qua. Từ khĩa: t vn, tuyn sinh, tt nghip ph thơng trung hc, lut kt hp m. 1. Mở đầu Trong th k 21 vn la chn ngành, bc hc và quá trình ào to tr thành mt trong nhng vn quan trng bc nht khơng nhng cp quc gia mà mang tính tồn cu, khơng ch các nc chm phát trin, ang phát trin mà ngay c nhng nc phát trin. Vic nh hình ngh nghip, vic làm trong tơng lai cho mi thanh niên liên quan mt thit n s phát trin ca xã hi, n nn giáo dc quc gia và ph thuc vào kh nng và phm cht ca tng thành viên. Các nghiên cu c trình bày ây là nhng kt qu bc u trong quá trình chúng tơi thc hin d án khoa hc a ng dng lý thuyt M vào thc tin “Lp trang web: Tư vn, h tr la chn ngành ngh ào to và vic làm”. Bài báo chia làm 6 phn, phn m u nêu tình hình nghiên cu trong và ngồi nc, tính cp thit ca bài tốn cn gii quyt. Trong 2 phn tip theo chúng tơi a ra nh hng và mc tiêu nghiên cu. Phn 4 xây dng thut tốn t vn d báo kt qu thi tt nghip ph thơng và thi i hc, cao ng. Kt qu trin khai thc t và kt lun c trình bày trong 2 phn cui. 1.1. Tình hình nghiên cu ngồi nưc xác nh nng lc, k nng và trình cn cĩ ca mt thanh niên trong th k 21, nm 2012 Canada ã xut chin lc mang tm quc gia “Tm nhìn trong th k 21 ca nn giáo dc quc gia Canada” ([7]), tháng 11 nm 2006 ti Jamaica t chc hi ngh báo cáo tng kt d án v “ánh giá nng lc da trên giáo dc ào to” ([5]). M nhiu nhà qun lý giáo dc cng a ra các nghiên cu mang tm chin lc nh Stephen R. Porter ([6]), V sn phm mang tính t vn, h tr, hin nay cng rt a dng phong phú vi các hình thc ch yu là cung cp thơng tin, ánh giá nng lc và t vn trc tuyn. Phơng thc ánh giá, t vn dng này thng da rt ít vào các thơng tin v quá trình hc tp (im s) 1Phịng CNTT, i hc Thng Long, toan.trantuan@gmail.com; 2Khoa Tốn-Tin, i hc Thng Long, nthienluan@yahoo.com 3Khoa CNTT, i hc Ni v;letuan104@gmail.com 4Khoa CNTT, i hc Thành ơ,nguyenvancon2@gmail.com 5Khoa Kinh t Qun lý, i hc Thng Long, hangvl@gmail.com; 6 bhphan88@gmail.com Trường Đại học Thăng Long 132
  2. Kỷ yếu cơng trình khoa học 2015 – Phần I cng nh k nng mm ca các i tng cn t vn. Trang www.SelectRightDegree.com cung cp rt nhiu thơng tin v các cơ s ào to i hc và cao ng các nc ang phát trin M, Canada, Úc, cùng vi danh mc các ngành ngh ào to, vic làm và các iu kin nhp hc và hc bng. Trang ngồi vic cung cp các thơng tin v ào to ti các trng i hc ca M cng a ra nhng thơng tin t vn vic chn trng da vào kt qu trc nghim và k thi SAT. Phn ln các trang web u mang tính cung cp thơng tin v mt cơ s ào to c th, a ra nhng phân tích và lý do xin nhp hc vào cơ s ĩ, nhng thơng tin này ít nhiu mang tính qung cáo mi chào ngi hc. 1.2. Tình hình nghiên cu trong nưc trong nc, vic nghiên cu v vn v nng lc ca hc sinh trc, trong và sau quá trình ào to ca hc sinh cha nhiu, nghiên cu mà chúng tơi cĩ trong tay là ca tác gi Lê Th Hng ([2]) nhng các s liu cha mang tính c trng. Mt s cơng trình mang tính cá nhân v ánh giá k nng mm cng c cơng b, nhng cha nhiu ([1]). Gn ây Vin Khoa hc giáo dc Vit Nam phi hp vi b Lao ng Thơng binh và Xã hi và t chc Lao ng quc t ILO (International Labour Organization) cơng b B tài liu hng nghip, sáng to. B GD vàT thm nh vào tháng 8/2014 thí im m rng. B tài liu bao gm sách bài tp hc sinh, sách hng dn giáo viên, b sách tra cu thơng tin ngh nghip và b dùng dy hc c k vng giúp hc sinh hiu rõ hơn v la chn ngh nghip tơng lai, trin vng vic làm, u nhc im bn thân, t ĩ a ra quyt nh vi y thơng tin. Ti Vit Nam, hin nay cĩ các trang a ra cơng c h tr bng vic chn các câu hi trc nghim v ý thích, nng lc ca thí sinh, t ĩ cn c vào nghiên cu John Holland và các chuyên gia a ra các nh hng chn ngh. im qua mt s kt qu nghiên cu và sn phm v nh hng mà kt qu nghiên cu hng ti, chúng tơi cĩ mt s nhn nh sau: - Vn ánh giá quá trình hc tp và k nng mm ca hc sinh trong nhng nm hc THPT là mt vn thi s khơng ch trong nc mà mang tm quc t; - Quá trình t vn, h tr cho hc sinh cn c vào kt qu hc tp THPT kt hp vi mt s k nng mm a ra nh hng trong vic la chn ngành hc, cp hc cha c t ra và nghiên cu; - Hin nay, phơng án i mi thi c vào các trng i hc và cao ng ca b Giáo dc và ào to ang c trin khai, trong ĩ các kt qu hc tp trong nhng nm THPT ĩng vai trị ngày càng quan trng hơn. Vi s lng ln các d liu c thu thp và ánh giá s mang li hiu qu cao. Tình hình ào to và vic làm mi nc cĩ nhng c thù riêng, vì vy mt sn phm cung cp thơng tin, t vn, h tr cho vic la chn, ngành hc, bc hc và vic làm cn c vào quá trình hc tp và k nng mm phù hp vi c im ca xã hi Vit Nam theo chúng tơi là rt cp thit. 2. Định hướng nghiên cứu Trong nhng nm gn ây do nhu cu ca xã hi, cuc sng và gia ình, a s các hc sinh sau khi tt nghip ph thơng trung hc u ng ký d các k thi vào i hc, cao ng và ch sau ĩ mi tìm mt cơ hi hc tp và nh hng ngh nghip bc trung cp hay các Trường Đại học Thăng Long 133
  3. Kỷ yếu cơng trình khoa học 2015 – Phần I trng ngh. iu này gây lãng phí rt ln cho nhiu gia ình, cng ng và xã hi vì nhng k thi khơng úng i tng, khơng úng kh nng gây tn kém khơng hiu qu. B Giáo dc và ào to, các cơ quan chc nng và các phơng tin truyn thơng i chúng ã cĩ nhiu cnh báo, tuyên truyn, thâm chí a ra nhng bin pháp sàng lc, nh hng nhiu khi cng rn, thm chí cc oan phân lung, nhng kt qu t c cịn rt hn ch. Nhng bt cp ĩ s c hn ch nu i kèm vi nhng bin pháp ã cĩ, chúng ta a ra nhng kt qu nghiên cu khoa hc nghiêm túc, c th thuyt phc cng ng, gia ình và n tng cá nhân cĩ phơng thc la chn, nh hng cp hc, ngành hc phù hp vi kh nng ca mình. Kt qu nghiên cu ây cng a ra các ánh giá phân loi, t l ngành ngh trong nhu cu s dng lao ng trong mt thi gian nht nh, giúp cho các i tng cĩ mt cách nhìn tng quan rõ ràng hơn trong quá trình nh hng ngh nghip trong tơng lai. ng thicung cp các thơng tin v các cơ s ào to ngun nhân lc trong và ngồi nc, nhu cu tuyn dng và các phơng thc s dng ngun lao ng qua ào to, các thơng tin phn hi t các cơ s sn xut, kinh doanh và cá nhân ngi lao ng v quá trình ào to. Cao hơn na to mơi trng liên kt gia quá trình ào to và s dng ngun nhân lc 3. Mục tiêu nghiên cứu 3.1. Mc tiêu chung - Nghiên cu, xut mt mơ hình ng dng CNTT mt cách khoa hc, cĩ tin cy cao và cĩ kh nng hồn thin sau mt thi gian áp dng. Tr giúp hc sinh, thí sinh, ph huynh cĩ c cơng c ánh giá khách quan trong vic la chn ngành ngh ào to, tham gia k thi quc gia vào các trng i hc và cao ng; - Cung cp tng quan và chi tit các thơng tin v ngành ngh ào to ca các cơ s ào to và vic làm trong xã hi; - Gĩp phn t vn, h tr vic la chn úng ngành hc, cp hc và vic làm phù hp vi kh nng ca tng i tng. 3.2. Mc tiêu c th - Thit k, xây dng phn mm máy tính cĩ kh nng tích ly d liu quá kh và t vn cho hc sinh các nm cui ph thơng la chn bc hc và ngành hc; - Hng ti cá nhân tng i tng la chn nh hng ngành ngh trên cơ s các d liu ã cĩ trc ĩ; - S dng các d liu thu nhp c xây dng phn mm test tuyn sinh cho các thí sinh thi vào các cơ s ào to i hc, cao ng, ngh, - Cung cp các thơng tin tra cu v các cơ s ào to trong c nc và quc t; - Cung cp các thơng tin, dch v liên quan n ào to, chn ngành ngh và tuyn dng trên th trng lao ng; - Tip nhn thơng tin iu tra, phn hi ca ngi lao ng v quá trình ào to, phân tích ánh giá và a ra kt qu phân loi các cơ s ào to. 4. Thuật tốn tư vấn tuyển sinh 4.1. T chc d liu m kt qu hc tp Áp dng các thut tốn khai phá d liu và lut kt hp m (Fuzzy Association Rules Algorithm-FARA) [3] tìm ph bin và tin cy ca kt qu thi tt nghip ph thơng, Trường Đại học Thăng Long 134
  4. Kỷ yếu cơng trình khoa học 2015 – Phần I thi i hc và cao ng. T chc cơ s d liuim s hc tp ca hc sinh thành các tp mc. Ví d: Lp 10: Ngoin TID Tốn Lý Hĩa Tin a Sinh Vn S CN GDCD TD g Ký j j j j j j j j j j j j hiu 1 2 3 4 5 6 7 8 9 10 11 12 1 8.5 6.5 5.6 9 6.0 6.5 7.0 6.5 7.0 7.0 7.5 6.5 Lp 11: Ngoi GDC TID Tốn Lý Hĩa Tin a Sinh Vn S CN TD ng D Ký k k k k k k k k k k k k hiu 1 2 3 4 5 6 7 8 9 10 11 12 1 8.0 7.0 6.5 10 5.5 6.0 6.5 6.0 7.5 7.5 7.0 5.5 Lp 12: Ngoi GD Kt TID Tốn Lý Hĩa Tin a Sinh Vn S CN TD ng CD qu Ký p p p p p p p p p p p p p13 hiu 1 2 3 4 5 6 7 8 9 1 11 12 1 8.0 7.0 6.0 9 5.0 6.0 7.5 5.5 8.0 7.5 7.0 6.0 22,5 Tính im trung cĩ nhân h s: j+ 2× k+ 3× p q = i i i (1) i 6 Phân loi theo im s cho im trung ca 3 nm lp 10, 11, 12, ây ta dùng s m tam giác biu din: TB = [5.0, 7.0]; Khá = [6.5, 8.0]; G = [>7.5]. Sau ĩ tính giá tr hàm liên thuc theo dng s m tam giác [3], [4] Trường Đại học Thăng Long 135
  5. Kỷ yếu cơng trình khoa học 2015 – Phần I Trung bình (TB) Khá (K) Gii (G) 1 5.0 6.0 7.0 7.2 7.5 8.0 9.0 10.0 Cơng thc tính hàm liên thuc vi x là im tng kt trung bình ca các nm hc. ánh giá mc trung bình (TB): x−5 khi 5.0 ≤ x ≤ 6.0  (2) µTB ()x = 7−x khi 6.0 ≤ x ≤ 7.0   0 khi x 7.0 ánh giá mc khá (K):  x - 6.5  khi 6.5≤x ≤ 7.25  0.75  0.8 − x (3) µ K ()x =  khi 7.25≤x ≤ 8.0  0.75  0 khi x 8.0   ánh giá mc gii (G): 2 x−5 khi 7.5 ≤ x ≤ 9.0 3  (4) µG ()x = 1 khi 9.0≤x ≤ 10  0 khi x < 7.5  Chuyn i CSDL v dng m, ví d: µ (.) µ (.) µ (.) µ (.) q1 q2 q3 q8 p13 TID TB K G TB K G K G TB K G TB 1 0 0 0.94 0 0.7 0 0.7 0 0.6 0 0 0.5 1 2 N Trường Đại học Thăng Long 136
  6. Kỷ yếu cơng trình khoa học 2015 – Phần I Trng s theo khi thi: Mơn i1 i2 i3 i4 i5 i6 i7 i8 i9 i10 i11 i12 Ký hiu 1 2 3 4 5 6 7 8 9 10 11 12 A 1 1 1 0.5 0.5 0.5 0.5 0.25 0.25 0.25 0.25 0.25 B C Gi N là tng s phiu iu tra, P là tp các kt qu các mơn thi, ví d: P = {Tốn (K), Lý (TB), Hĩa (G), , Vn (K)} = {i1.K, i2.TB, i3.G, , i8.K, i13},khi ĩ, ta tính h tr ca lut Đạt mức điểm itheo cơng thc: ∑ min {µ I (t i )} IPQ∈ ∪ j , t∈ D j supp = i % (5) N ∑ min {ωI × µ I (t i )} jj , IPQj∈ ∪ ti∈ D (6) conf(PQ⇒ ) = % ∑ min{µ I (t i )} j , IPj∈ ti∈ D 4.2. T chc d liu k nng mm Qua tham kho các mơ hình, chúng tơi xây dng bng hi phân loi k nng mm ca mi hc sinh theo các ni dung: tính c lp, sáng to, kh nng gii bài tp, tình thn hp tác, phơng thc gii quyt xung t, hot ng tp th, cách thc gii quyt vn , tính mc tiêu ca mi hot ng. T cu trúc d liu thu thp c, áp dng Thut tốn Nạve Bayes (NBayes) tính xác sut t mc im,xây dng CSDL nh sau: Bài tp GQX HTT GQV t MT c lp Sáng to Hp tác Mc Thí V1 V2 V3 V4 V5 V6 V7 V8 im sinh 1 2 1 2 3 1 2 v1 , v2 1 2 1 2 1 2 1 2 {v1 , v1 } {v2, v2 , v2 } {v3 , v3 } { 4 4 } {v5 , v5 } {v6 , v6 } {v7 , v7 } {v8 , v8 } 1 Ng TB Ít TB Tt Phn Ko Ko Ít TB Y Ko Thp BB Phn Ko BQ 1 2 TB Ng Na Yu TB Na Nhiu Cĩ Nhiu Cao RR Cĩ Cao TM Ht Ko 2 3 Dài Lâu Ht Tt Yu Ht Ít Cĩ Ko Ko TT Ko TB PH Ht Cĩ LL 4 4 TB Ng Na Tt Yu Na Nhiu Ko Ko Cao RR Cĩ Thp TM Phn cĩ 2 5 Trường Đại học Thăng Long 137
  7. Kỷ yếu cơng trình khoa học 2015 – Phần I Bng d liu hun luyn cho thy các phn t c chia làm 4 lp A1={t mc 1} và A2 = {t mc 2}, . So sánh giá tr kh nng t Mức điểmi theo cơng thc sau: Nu:  n   n  ln []P() Ai+∑ ln [] P( y j A i ) = maxln [] P( Ak ) + ∑ ln [] P( y j A k )  (7) k  j=1   j =1  thì thí sinh cho kt qu là ngc li s t mc im i. TS at muc i Sơ thí sinh cĩ y (8) Trong ĩ: PA() = ; P ( y A ) = i ; iTơng sơ i k Sơ thí at muc k 4.3. Thut tốn tư vn qua d báo kt qu hc tp trong trưng ph thơng Input: D = {j1, j2, , j12,k1, k2, , k12, p1, p2, , p12}. // im các mơn hc; 1 2 1 2 Q= {v1 , v1 , v2 , v2 , } // Thơng tin v k nng mm; R ={q1, q2, , qN} // Kt qu thi i hc, cao ng; Output: T l phn trm các mc im kt qu thi. 1. Tính im trung bình theo cơng thc (1); 2. M hĩa theo các cơng thc (2), (3), (4); 3. T d liu im ưa vào kt hp vi d liu ưc thu thp trưc ĩ // D liu hc theo im s - Tính ph bin ca lut theo cơng thc (5) - Tính tin cy ca lut theo cơng thc (6) - ưa ra t l phn trm theo các mc im t ưc // ây chúng tơi chia thành các mc im kt qu thi; 4. T thơng tin ưa vào v k nng mm kt hp vi d liu ưc thu thp trưc ĩ // D liu hc theo k nng mm - Tính xác sut ca thí sinh thuc tng mc im theo cơng thc (7), (8) 5. Triển khai thực tế D án ca chúng tơi ã c trin khai trong thc t vi khi lng d liu gm 3,6 triu kt qu thi i hc, cao ng trong 3 nm gn nht cho 23 ngàn lt thí sinh vi kt qu hc tp 3 nm cui bc THPT ly i din ca mt s tnh thành trong c nc. Tuy nhiên vic áp dng thut tốn ã xây dng s gp rt nhiu khĩ khn do d liu ln dn n khi lng tính tốn và thi gian x lý khơng áp ng vi yêu cu t vn tơng tác trc tuyn. khc phc các im yu này, chúng tơi tin hành ci tin nh sau: - Phân mc im s hc tp ca hc sinh theo 5 mc m khác nhau theo ph im ánh giá; - Phân kt qu thi tt nghip ph thơng thành 11 mc và i hc thành 8 mc theo ph im; Trường Đại học Thăng Long 138
  8. Kỷ yếu cơng trình khoa học 2015 – Phần I - Xây dng thut tốn trích rút lut kt hp m, thit lp CSDL lut cho vic d báo im thi tt nghip ph thơng và CSDL lut m theo khi thi cho vic t vn kt qu thi i hc cao ng. Procedure Lập luật thi tốt nghiệp Input: CSDL kt qu hc ph thơng {D} CSDL kt qu thi i hc cao ng {R} Output: CSDL lut //T l phn trm các mc im kt qu thi. 1. Kt ni {D} và {R} theo các trưng khĩa hoten, ngaysinh, gioitinh, matruongpt; 2. M hĩa d liu kt ni theo các mc im la chn; 3. Trích rút các lut theo 3 mơn thi bt buc và 1 mơn la chn; 4. Xây dng CSDL {QTN}lut theo mơn thi chn; Procedure Lập luật thi đại học, cao đẳng Input: CSDL kt qu hc ph thơng {D} CSDL kt qu thi i hc cao ng {R} Output: CSDL lut //T l phn trm các mc im kt qu thi. 1. Kt ni {D} và {R} theo các trưng khĩa hoten, ngaysinh, gioitinh, matruongpt; 2. M hĩa d liu kt ni theo các mc im la chn; 3. Trích rút các lut theo các mơn thi ca các khi thi A, A1, B, C, ; 4. Xây dng CSDL {QH}lut theo khi thi; Thut tốn Dự báo kết quả Input: Kt qu hc ph thơng mơn thi chn hoc mơn thi theo khi ca i tưng // Tùy thuc vic d báo kt thi tt nghip hay thi i hc; Output: Mc im t ưc theo t l phn trm. 1. M hĩa các im s ưa vào; 2. Truy vn trong CSDL lut - Nu thi tt nghip ph thơng thì tìm kim trong {QTN} - Ngưc li tìm kim trong {QDH} 6. Kết luận Các kt qu t c ã áp ng mc tiêu mà d án ã xut. T các kt qu d báo im thi kt hp vi các CSDL im chun và ch tiêu các trng i hc và cao ng s a ra kt qu t vn cho vic chn trng và chn ngành hc. Trường Đại học Thăng Long 139
  9. Kỷ yếu cơng trình khoa học 2015 – Phần I Các CSDL v im s và kt qu thi s c cp nht hàng nm, cơng thc tính im sàn s c thay i cho phù hp vi các quy nh v thi tt nghip và quy ch tuyn sinh i hc cao ng ca b Giáo dc và ào to. Trong quá trình trin khai thc t vic phng vn thu thp d liu thơng tin v k nng mm gp rt nhiu khĩ khn, vì các i tng cha cĩ truyn thng và làm quen vi phơng pháp ánh giá theo nng lc ca hc sinh. Cơng vic này ch cĩ th thc hin và hồn thin trong tơng lai. 7. Tài liệu tham khảo [1]. “Làm sao bit bn hp vi ngành ngh gì?” 115:lam-sao bit-bn-hp-vi-nganh-ngh-gi&catid=18:chuyen-mc-hc-tp&Itemid=13 [2]. Lê Th Hng, “i mi kim tra ánh giá theo hng tip cn nng lc hc sinh” quangtri.edu.vn/default.asp?gid=9&mid=38&ctid=1209&ct=1 [3]. Nguyn Thin Lun, “Lý thuyt m ng dng trong tin hc”, Nhà xut bn Thng kê, 2015. [4]. V Th Thu Huyn, Nguyn Thin Lun, Lê Minh Tun. “Fuzzy Shortest Path Algorithm Based on Comparative Relation”, IJCSNS International Journal of Computer Science and Network Security, No 14(5), pp 20-25, 2014. [5]. “Assessment in Competency-Based Education”, Hemispheric project, ICTVET, Jamaica, November, 2006 [6]. Stephen R. Porter, “Competency-Based Education and Federal Student Aid”, March 2014 [7]. Shifting Minds, “A 21st Century Vision of Public Education for Canada”, www.c21.canada.org, 2012 Abstract:Based on the studying database of 15,000 high school pupils of some schools in the areas of Hanoi, Ho Chi Minh, Hoa Binh, Thanh Hoa, and the results of 3.6 million university and college exams, we have applied and improved model, data mining algorithm in order to extract fuzzy association rules. These rules allow to evaluate the effects of the process of studying and teaching at the high school to the selection results at university and college in recent years. Keywords: counseling, enrollment, high school graduation, fuzzy association rules. Trường Đại học Thăng Long 140