Bài giảng Tin học ứng dụng - Chương 2: Phân tích dữ liệu với SPSS - Phan Minh Trung

pdf 23 trang hapham 2260
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng - Chương 2: Phân tích dữ liệu với SPSS - Phan Minh Trung", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_tin_hoc_ung_dung_chuong_2_phan_tich_du_lieu_voi_sp.pdf

Nội dung text: Bài giảng Tin học ứng dụng - Chương 2: Phân tích dữ liệu với SPSS - Phan Minh Trung

  1. 12/30/2013 TIN HỌC ỨNG DỤNG Chương 2: Phõn tớch dữ liệu với SPSS Phan Minh Trung Trung tõm Tin học – Đại học An Giang Email: pmtrung@agu.edu.vn Website: Tin học ứng dụng quản lý 1 Nội dung 1 • Giới thiệu SPSS & Cài đặt 2 • Mó hoỏ dữ liệu, Khai bỏo biến, Nhập liệu, Xử lý,„ 3 • Kiểm đðnh thang đo 4 • Mụ hỡnh phõn tớch nhõn tố khỏm phỏ (EFA). 5 • Phõn tớch hồi qui. 6 • Thống kờ mụ tả (tạo bảng tần số, bảng thống kờ một số đại lượng, vẽ đồ thð) Tin học ứng dụng quản lý 2 1
  2. 12/30/2013 Giới thiệu SPSS  Viết tắt Statistical Package for the Social Sciences  Sử dụng rộng rói trong cụng tỏc thống kờ kinh tế - xó hội  SPSS cung cấp một hệ thống quản lý dữ liệu và phõn tớch thống kờ trong một mụi trường đồ họa  Dễ sử dụng, hỗ trợ thao tỏc thụng qua menu kộo thả và cõu lệnh, cỏc bảng biểu, bỏo cỏo được trỡnh bày đẹp, linh hoạt Tin học ứng dụng quản lý 3 Cài đặt SPSS Cài đặt SPSS V20 Tin học ứng dụng quản lý 4 2
  3. 12/30/2013 Mó húa dữ liệu & Nhập liệu VD: ta cú bảng dữ liệu như sau Cỏc biến Giới tớnh Tuổi Nghề nghiệp 1 Nữ 19 Sinh viờn lời trả 2 Nữ 32 Nhõn viờn Người 3 Nam 53 Về hưu . n Nam 42 Khỏc Tin học ứng dụng quản lý 5 Mó húa dữ liệu & Nhập liệu Ta qui ước như sau Giới tớnh Tuổi Nghề nghiệp 1. Sinh viờn 1. Từ 1 – 25 1. Nam 2. Nhõn viờn văn phũng 2. Từ 26 – 50 2. Nữ 3. Về hưu 3. Trờn 50 4. Khỏc Tin học ứng dụng quản lý 6 3
  4. 12/30/2013 Mó húa dữ liệu & Nhập liệu Giới tớnh Tuổi Nghề nghiệp 1 2 1 1 2 2 2 2 3 1 3 3 . n 1 2 4 Tin học ứng dụng quản lý 7 Vớ dụ: Mó húa bảng cõu hỏi!  Hóy mó húa và nhập liệu cho bảng phỏng về đề tài nghiờn cứu cứu “Cỏc yếu tố ảnh hưởng đến sự hài lũng của khỏch hàng: trường hơp nghiờn cứu ở Ngõn hàng Nụng nghiệp PTNT, chi nhỏnh TPHCM”. Trong đú bao gồm cỏc biến độc lập, phụ thuộc, nhõn khẩu học.  Xem phụ lục 2.1 Tin học ứng dụng quản lý 8 4
  5. 12/30/2013 Mó húa dữ liệu TAN REL RES ASS EMP SAT INFO TAN_1 REL_1 RES_1 ASS_1 EMP_1 SAT_1 INFO_1 TAN_2 REL_2 RES_2 ASS_2 EMP_2 SAT_2 INFO_2 TAN_3 REL_3 RES_5 ASS_3 EMP_3 SAT_3 INFO_3 TAN_4 REL_4 RES_4 ASS_4 EMP_4 INFO_4 REL_5 RES_5 ASS_5 EMP_5 REL_6 ASS_6 EMP_6 REL_7 ASS_7 EMP_7 REL_8 EMP_8 EMP_9 Mó húa theo từng nhúm thành phần Thụng tin cỏ nhõn theo 1 nhúm và qui ước cỏc con số khi nhập liệu: VD INFO_2 (Độ tuổi): 1. ≤ 20 2. Từ 20 – 30 tuổi 3. Từ 31 – 50 tuổi 4. Trờn 50 tuổi Tin học ứng dụng quản lý 9 Nhập liệu  Để nhập dữ liệu nhanh ta thực hiện như sau:  Nhập dữ liệu bằng Excel theo cột.  Chuyển dũng thành cột.  Kiểm tra dữ liệu.  Chuyển dữ liệu qua SPSS:  Khai bỏo biến đó mó húa.  Copy dữ liệu từ Excel qua SPSS. Tin học ứng dụng quản lý 10 5
  6. 12/30/2013 Nhập liệu Excel Tin học ứng dụng quản lý 11 Chuyển dũng thành cột Tin học ứng dụng quản lý 12 6
  7. 12/30/2013 Kiểm tra dữ liệu bằng Filter trong Excel Tin học ứng dụng quản lý 13 Khai bỏo biến bờn SPSS Tin học ứng dụng quản lý 14 7
  8. 12/30/2013 Giải thớch giao diện khai bỏo biến. Name Tờn biến, liờn tục khụng cú khoảng trắng Type Kiểu dữ liệu (Số, chuỗi, ) Width Độ rộng kiểu dữ liệu, nếu type là string thỡ width là số ký tự tối đa Decimals Llượng số thập phõn Label Nhón biến (chỳ thớch cho tờn biến) Values Định nghĩa giỏ trị cho cỏc biến. Missing Khai bỏo giỏ trị khuyết Columns Độ rộng cột tờn biến Align Canh lề dữ liệu nhập trong cột. Loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc), Nominal (thang đo danh Measure nghĩa), Scale (gồm cả Interval và Ratio). Role Vai trũ của biến Tin học ứng dụng quản lý 15 Xử lý biến„  Đðnh nghùa giỏ trð cho cỏc biến. Tin học ứng dụng quản lý 16 8
  9. 12/30/2013 Mụ hỡnh Phõn tớch nhõn tố khỏm phỏ (EFA)  Qui trỡnh phõn tớch nhõn tố khỏm phỏ (Exploratory Factor Analysis):  Bước 1: Kiểm đðnh chất lượng thang đo.  Bước 2: Phõn tớch nhõn tố khỏm phỏ (EFA). . Kiểm đðnh tớnh thớch hợp của EFA (chợ số 0,5 < KMO <1); Kaiser – Meyer - Olkin. . Kiểm đðnh tương quan giữa cỏc biến: kiểm đðnh Bartlett với Sig. < 0,05. . Kiểm đðnh mức độ giải thớch (% cumulative variance – phương sai trớch) lớn hơn 50% Tin học ứng dụng quản lý 17 Mụ hỡnh Phõn tớch nhõn tố khỏm phỏ (EFA)  Qui trỡnh (tt):  Bước 3: Phõn tớch hồi qui bội (Multi Regression Linear). . Tương quan từng phần, mức ý nghùa của HSHQ Sig.<0,05 2 2 . Mức độ phự hợp của mụ hỡnh R và R đều chợnh: sử dụng phõn tớch phương sai ANOVA Sig.<0,05 . Hiện tượng đa cộng tuyến VIF < 10. Tin học ứng dụng quản lý 18 9
  10. 12/30/2013 Kiểm đðnh thang đo  Analyze Scale Reliability Analysis  Xuất hiện hỡnh dưới vả đưa thang đo cần kiểm đðnh như hỡnh: Tin học ứng dụng quản lý 19 Kiểm đðnh thang đo (tt)  Hệ số Cronbach Alpha >= 0,6 và tương quan biến tổng ≥ 0,3  Nếu nhỏ hơn 0,6 ta loại bỏ biến ở bảng dưới và thực hiện lại kiểm đðnh như ban đầu. Tin học ứng dụng quản lý 20 10
  11. 12/30/2013 Phõn tớch nhõn tố khỏm phỏ  Analyze Dimension Reduction Factor Tin học ứng dụng quản lý 21 Phõn tớch nhõn tố khỏm phỏ (tt) Tin học ứng dụng quản lý 22 11
  12. 12/30/2013 Phõn tớch nhõn tố khỏm phỏ (tt) Tin học ứng dụng quản lý 23 Phõn tớch nhõn tố khỏm phỏ (tt) Tin học ứng dụng quản lý 24 12
  13. 12/30/2013 Phõn tớch nhõn tố khỏm phỏ (tt) Cỡ mẫu Giỏ trð chọn (Factor loading) > 350 0,3 100 ≤ Cỡ mẫu ≤ 350 0,55 < 100 0,75 Tin học ứng dụng quản lý 25 Phõn tớch nhõn tố khỏm phỏ (tt)  Dựa vào bảng Rotated Component Matrix để trớch nhõn tố.  Kiểm đðnh tớnh thớch hợp 0,5 < KMO < 1  Kiểm đðnh tương quan của cỏc biến quan sỏt trong thang đo (Bartlett với Sig. < 0,05).  Kiểm đðnh mức độ giải thớch cỏc biến đặc trưng đối với nhõn tố (% Cumulative ≥ 50% - Phương sai trớch). Tin học ứng dụng quản lý 26 13
  14. 12/30/2013 Phõn tớch nhõn tố khỏm phỏ (tt)  KMO = 0,891 thỏa món điều kiện: 0,5 < KMO < 1, phõn tớch nhõn tố khỏm phỏ là thớch hợp cho dữ liệu thực tế.  Kiểm đðnh Bartlett cú Sig. = 0,000 < 0,05, cỏc biến đặc trưng cú tương quan tuyến tớnh với nhõn tố đại diện. Tin học ứng dụng quản lý 27 Phõn tớch nhõn tố khỏm phỏ (tt)  Phương sai trớch 63,6%. Điều này cú nghùa 63,6% thay đổi của cỏc nhõn tố được giải thớch bởi cỏc biến quan sỏt. Tin học ứng dụng quản lý 28 14
  15. 12/30/2013 Phõn tớch nhõn tố khỏm phỏ (tt)  Trớch được 4 nhõn tố: mụ hỡnh 5 nhấn tố cũn lại 4 nhõn tố: 1. Cảm thụng (EMP) 2. Phương tiện hữu hỡnh (TAN) 3. Đỏp ứng (RES) 4. Tin cậy (REL)  Bước tiếp theo là Phõn tớch hồi qui bội. Tin học ứng dụng quản lý 29 Phõn tớch hồi qui bội  Mụ hỡnh tổng thể: SAT = f(EMP, TAN, RES, REL)  Để thực hiện hồi qui:  Lấy trung bỡnh hoặc tổng cỏc thành phần.  Chạy mụ hỡnh hồi qui.  Phương trỡnh hồi qui: SAT = B0 + B1EMP + B2TAN + B3RES + B4REL Tin học ứng dụng quản lý 30 15
  16. 12/30/2013 Kiểm đðnh hồi qui  Analyze Regression Linear„ Tin học ứng dụng quản lý 31 Phõn tớch kiểm đðnh hồi qui  Chọn Save. Tin học ứng dụng quản lý 32 16
  17. 12/30/2013 Phõn tớch kiểm đðnh hồi qui (tt)  Kiểm đðnh HSHQ: tất cả cỏc biến đều cú Sig. nhỏ hơn 0,05. Như vậy cỏc biến tương quan cú ý nghùa với SAT với độ tin cậy 95%. Tin học ứng dụng quản lý 33 Phõn tớch kiểm đðnh hồi qui (tt)  Kiểm đðnh mức độ phự hợp của mụ hỡnh: R2 điều chợnh là 0,594. Như vậy 59,4% thay đổi sự hài lũng củ KH được giải bởi cỏc biến độc lập của mụ hỡnh. Tin học ứng dụng quản lý 34 17
  18. 12/30/2013 Phõn tớch kiểm đðnh hồi qui (tt)  Mức độ phự hợp: Phõn tớch phương sai, với Sig. < 0,05 cú thể kết luận rằng mụ hỡnh đưa ra phự hợp với dữ liệu thực tế. Tin học ứng dụng quản lý 35 Phõn tớch kiểm đðnh hồi qui (tt)  Đa cộng tuyến: hệ số phương sai phúng đại VIF < 2, hiện tượng đa cộng tuyến khụng bð vi phạm. Tin học ứng dụng quản lý 36 18
  19. 12/30/2013 Thảo luận kết quả hồi qui  Kết luận giả thuyết đưa ra: quan hệ dương giữa cỏc thành phần đến sự hài lũng.  Hệ số hồi qui chưa chuẩn húa:  EMP: 0,135 (EMP tăng 1 thỡ hài lũng tăng 0,135)  TAN: 0,375 (TAN tăng 1 thỡ hài lũng tăng 0,375)  RES: 0,419 (RES tăng 1 thỡ hài lũng tăng 0,419)  REL: 0,199 (REL tăng 1 thỡ hài lũng tăng 0,199) Tin học ứng dụng quản lý 37 Thống kờ mụ tả  Thống kờ mụ tả cỏc biến: Analyze Descriptive Statistics Frequencies„ Hoặc Analyze Descriptive Statistics Descriptives„  Đổ bảng chộo: Analyze Descriptive Statistics Crosstabs Tin học ứng dụng quản lý 38 19
  20. 12/30/2013 Vẽ biểu đồ  Vẽ biểu đồ trong phần thống kờ.  Vẽ biểu đồ với Graphs Chart Builder„ Tin học ứng dụng quản lý 39 Kiểm đðnh tham số  Kiểm đðnh T-Test đối với tham số trung bỡnh của 2 nhúm độc lập:  H0: khụng cú sự khỏc biệt về sự hài lũng của khỏch hàng theo giới tớnh (nam – nữ).  Ha: Cú sự khỏc nhau Analyze Compare means Independent-Samples T Test Tin học ứng dụng quản lý 40 20
  21. 12/30/2013 Kiểm đðnh tham số (tt) Tin học ứng dụng quản lý 41 Kiểm đðnh tham số (tt)  Kết quả: nếu thống kờ Levence Sig. > 0,05 thỡ khẳng đðnh giả đðnh phương sai đồng nhất, khi đú cỏc giỏ trð thống kờ (T-Test) tham chiếu theo dũng Equal Variances Assumed và ngược lại.  Trong trường hợp này, kiểm đðnh Levence với F=0,84 và Sig.=0,36> α =0,05 nờn khẳng đðnh phương sai đồng nhất.  Sig. (2-tailed) = 0,928 > 0,05 nờn khẳng đðnh khụng cú sự khỏc nhau về sự hài lũng theo giới tớnh. Tin học ứng dụng quản lý 42 21
  22. 12/30/2013 Kiểm đðnh tham số (tt)  Kiểm đðnh ANOVA: kiểm đðnh sự khỏc nhau trung bỡnh cú hơn 2 nhúm trở lờn.  Giả thuyết H0: Khụng cú sự khỏc biệt về hài lũng theo Nghề nghiệp  Ha: Cú sự khỏc nhau Analyze Compare means One-Way Anova„ Tin học ứng dụng quản lý 43 Kiểm đðnh tham số (tt) Tin học ứng dụng quản lý 44 22
  23. 12/30/2013 Kiểm đðnh tham số (tt)  Bảng Test of Homogenetiny of Variances Sig.=0,554 khụng cú sự khỏc nhau phương sai đồng nhất.  Bảng ANOVA cú Sig.=0,487 > 0,05. Cú thể kết luận khụng cú sự khỏc biệt hay chấp nhập giả thuyết H0. Tin học ứng dụng quản lý 45 Thanks for Listening Cỏm ơn đó lắng nghe Tin học ứng dụng quản lý 46 23