Bài giảng Kiểm định thống kê phân tích dữ liệu với SPSS - Hồ Thanh Trí
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kiểm định thống kê phân tích dữ liệu với SPSS - Hồ Thanh Trí", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
bai_giang_kiem_dinh_thong_ke_phan_tich_du_lieu_voi_spss_ho_t.pdf
Nội dung text: Bài giảng Kiểm định thống kê phân tích dữ liệu với SPSS - Hồ Thanh Trí
- KIỂM ĐỊNH THỐNG KÊ PHÂN TÍCH DỮ LIỆU VỚI SPSS Hồ Thanh Trí
- THỐNG KÊ SUY DIỄN • Mục tiêu: Dùng tham số mẫu để ước lượng các tham số của đám đông. • Phương pháp: Dùng các phương pháp kiểm định thống kê để kiểm nghiệm các giả thuyết về tổng thể.
- Giả thuyết nghiên cứu • H0: Giả thuyết không (null hypothesis) – mô tả hiện tượng lúc bình thường, dạng cấu trúc mang dấu bằng (=, ≥, ≤). • HR: Giả thuyết thay thế (alternative hypothesis) - mô tả tình trạng ngược lại H0, dạng cấu trúc không có dấu bằng (≠,>, Nếu loại bỏ H0 có bằng chứng cho rằng HR đúng
- GIẢ THUYẾT NGHIÊN CỨU (Hypothesis) • Giả thuyết về mối quan hệ hay tương quan giữa hai hay nhiều biến H0: Hai (nhiều) biến khảo sát độc lập với nhau (không có) H1: Tồn tại mối quan hệ hoặc tương quan giữa 2 (nhiều) biến • Giả thuyết về các giá trị trung bình H0: Giá trị trung bình của 2 hoặc nhiều hơn 2 mẫu ngang bằng nhau (không có sự khác biệt) H1: Tồn tại sự khác biệt giữa các giá trị trung bình của 2 (nhiều) biến. • Giả thuyết về các phương sai H0: Phương sai giữa 2 (nhiều) mẫu là ngang bằng H1: Phương sai giữa 2 (nhiều) mẫu là không ngang bằng
- Giả thuyết nghiên cứu Nguyên tắc kiểm định trong SPSS: Dựa vào mức ý nghĩa kiểm định (xác xuất sai lầm loại 1) (Significance level), viết tắt Sig. • Nếu Sig. ≥ : từ chối giả thuyết HR (chấp nhận H0). • Nếu Sig. < : chấp nhận giả thuyết HR (từ chối H0). Chú ý: = 0.05 (trong khoa học kinh tế)
- THỐNG KÊ SUY DIỄN • Kiểm định mối quan hệ giữa hai biến định tính: kiểm định mối quan hệ giữa hai biến trong bản chéo. Sử dụng kiểm định Chi bình phương. • Kiểm định sự khác nhau giữa hai giá trị trung bình Kiểm định Student’s t cho hai mẫu độc lập (Independent samples t test) Kiểm định Student’s t cho cặp mẫu (Paired samples t- test) Phân tích phương sai một yếu tố (One-way ANOVA)
- THANG ĐO Phương pháp Ghi chú kiểm định Biến độc lập Biến phụ thuộc Định danh Định danh Chi bình phương Thứ bậc Thứ bậc Chi bình phương Giá trị số Định lượng One Sample T-Test Định tính (2 nhóm) Định lượng Independent Sample Hồi quy đơn dummy T-Test So sánh 2 biến Định lượng từng cặp Pair Sample T-Test tương ứng Định tính Định lượng One – way ANOVA (3 nhóm trở lên) 1 Định lượng 1 Định lượng Hồi quy đơn (SLR) Tương quan 2 Định lượng trở Định lượng Hồi quy bội (MLR) Dữ liệu thứ cấp (phi lên Tương quan tuyến)
- THANG ĐO Phương pháp Ghi chú kiểm định Biến độc lập Biến phụ thuộc Định lượng Định lượng Hồi quy bội (MLR) Định tính + Dummy ANCOVA Định tính (n biến) Định lượng ANOVA n chiều Hoặc MLR + Dumy (MANCOVA) Định tính (n biến) Định lượng MLR + Dumy + hỗ tương MANCOVA Định lượng (1 hay nhiều biến) Định lượng MLR + Dumy + hỗ ANCOVA Định tính tương Định lượng (1 hay nhiều biến) Định lượng (1 MVR + Dumy + hỗ Định tính (1 hay hay nhiều biến) tương nhiều biến) Định lượng (1 hay nhiều biến) Định tính (2 lựa Binary Logictic Hồi quy giá trị xác Định tính (1 hay chọn) suất nhiều biến)
- Các bước kiểm định giả thuyết nghiên cứu • Thiết lập giả thuyết cần kiểm định • Chọn mức ý nghĩa mong muốn • Chọn phép kiểm định thích hợp và tính giá trị thống kê kiểm định của nó (giá trị xác xuất p hay mức nghĩa Sig.). • So sánh giá trị p với mức . nghĩa a = 0.05 để ra quyết định • Diễn giải kết quả kiểm định giả thuyết nghiên cứu
- 1-KIỂM ĐỊNH MỐI QUAN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH •
- KIỂM ĐỊNH MỐI QUAN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH • Điều kiện (hai biến định tính) : Dùng kiểm định Χ² • Các giả thuyết: H0: Không có mối quan hệ giữa trình độ chuyên môn và nghề nghiệp (hai biến độc lập nhau) H1: Có mối quan hệ giữa trình độ chuyên môn và nghề nghiệp • Χ² được thiết lập để xác định có hay không một mối liên hệ giữa hai biến, nhưng nó không chỉ ra được cường độ của mối liên hệ đó.
- KIỂM ĐỊNH MỐI QUAN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH Các đại lượng thống kê trong kiểm định χ2 • Cramer (V) : độ mạnh của mối liên hệ 0 ≤ V ≤ 1 • Hệ số liên hợp (C) : 0 ≤ C ≤ 1 • Lamda (λ) : 0 ≤ λ ≤ 1 • Gamma (γ): -1 ≤ γ ≤ 1
- KIỂM ĐỊNH MỐI QUAN HỆ GIỮA 2 BIẾN ĐỊNH TÍNH (Analyze > Descriptive Statistics > Crosstabs)
- KIỂM ĐỊNH MỐI QUAN HỆ GIỮA 2 BIẾN ĐỊNH TÍNH
- 2-KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH TỔNG THỂ (1 biến định lượng) Các bước kiểm định giả thuyết nghiên cứu: • Thiết lập giả thuyết cần kiểm định • Chọn mức ý nghĩa mong muốn • Chọn phép kiểm định thích hợp và tính giá trị thống kê kiểm định của nó (giá trị xác xuất p hay mức nghĩa Sig.). • So sánh giá trị p với mức ý nghĩa = 0.05 để ra quyết định • Diễn giải kết quả kiểm định giả thuyết nghiên cứu
- KIỂM ĐỊNH THAM SỐ TRUNG BÌNH (Analyze > Compare Means > One - Sample T Test)
- KIỂM ĐỊNH THAM SỐ TRUNG BÌNH (Analyze > Compare Means > One - Sample T Test)
- 3-KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Trong nhiều trường hợp cần so sánh trị trung bình về một chỉ tiêu nghiên cứu nào đó giữa hai đối tượng bạn quan tâm. Bạn có 2 biến tham gia trong một phép kiểm định trung bình: 1 biến định lượng và 1 biến định tính dùng để chia nhóm ra để tính, bạn sử dụng kiểm định independent – samples T-test.
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Bước 1: Kiểm nghiệm phương sai ngang bằng (Levene’s test) Thiết lập giả thuyết . Ho: Phương sai giữa 2 mẫu ngang bằng nhau . H1: Phương sai giữa 2 mẫu không ngang bằng nhau Kiểm nghiệm F Công thức tính F: Nếu p-value (sig.) α Chấp nhận Ho Lựa chọn kiểm nghiệm t so sánh trung bình mẫu với điều kiện phương sai ngang bằng (Equal variances assumed)
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ •
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Ước lượng tham số trung bình: • Dữ liệu: định lượng (liên tục) • Độ tin cậy (1-mức ý nghĩa) So sánh trung bình hai mẫu độc lập (kích thước 2 mẫu không cần bằng nhau) : • H0: Không khác nhau giữa hóa đơn tiền điện thoại giữa người nữ và người nam trong tổng thể • H1: Có sự khác nhau giữa hóa đơn tiền điện thoại giữa người nữ và người nam trong tổng thể Điều kiện ứng dụng: Dữ liệu định lượng (liên tục) Dữ liệu của hai nhóm phải tuân theo quy luật phân phối chuẩn
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ (Analyze > Compare Means > Independent Sample T Test)
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Nếu Sig trong kiểm định phương sai < 0,05 thì phương sai của 2 mẫu không bằng nhau,ta dùng kết quả kiểm định t ở dòng thứ 2
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Ho: Không có sự khác biệt về tiền lương giữa người nam và nữ H1: Có sự khác biệt về tiền lương giữa người nam và nữ (ví dụ:euro0608)
- KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
- 4-SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP(Analyze => Compare Means => Pair Sample T-Test) • Đây là loại kiểm định dùng cho 2 nhóm tổng thể có liên hệ với nhau. Dữ liệu của mẫu thu thập ở dạng thang đo định lượng. • Quá trình kiểm định sẽ bắt đầu với việc tính toán chênh lệch giá trị trên từng cặp quan sát bằng phép trừ. Sau đó kiểm nghiệm xem chênh lệch trung bình của tổng thể có khác 0 không, nếu = 0 tức là không có khác biệt. • Lợi thế của phép kiểm định này là loại trừ được những yếu tố tác động bên ngoài vào nhóm thử. • Phương pháp kiểm định này rất thích hợp với dạng thử nghiệm trước và sau, một thử nghiệm rất hay gặp trong nghiên cứu,
- SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP • Ví dụ: khi công ty chế biến thực phẩm của bạn khảo sát người tiêu dùng về loại đậu phộng chế biến sẵn vừa cải tiến về thành phần lớp vỏ bên ngoài, bạn phải tổ chức cho dùng thử sản phẩm trên cùng một nhóm người mới có thể thu được những thông tin xác thực về sự đánh giá mùi vị, độ ngon. • Bạn sẽ tìm ra kết quả bằng cách yêu cầu người dùng đánh giá sản phẩm, càng ngon thì cho điểm càng cao. • Sau đó áp dụng phương pháp kiểm định trị trung bình của 2 mẫu phối hợp từng cặp và đưa ra kết luận. • Nếu khi cả 2 sản phẩm được đánh giá như nhau, tức là phương pháp cải tiến không thu được kết quả gì.
- SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP Điều kiện áp dụng: Kích cỡ 2 mẫu so sánh phải bằng nhau. Phân phối chuẩn
- SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP Ví dụ: STT Trước cải tiến Sau cải tiến STT Trước cải tiến Sau cải tiến 1 7 8 11 7 9 2 8 9 12 7 5 3 6 5 13 8 9 4 8 9 14 9 10 5 7 8 15 7 7 6 7 9 16 7 9 7 7 7 17 8 7 8 6 7 18 7 9 9 8 7 19 6 6 10 6 8 20 8 8
- SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP
- 5.PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG: PHÂN TÍCH PHƯƠNG SAI • Mục tiêu của phân tích phương sai ANOVA (Analysis of Variance) là so sánh trung bình của nhiều tổng thể dựa trên các giá trị trung bình của các mẫu quan sát từ các tổng thể này, và thông qua kiểm định giả thuyết để kết luận về sự bằng nhau giữa các trung bình tổng thể. • Trong thực tiễn, chúng ta dùng ANOVA như là một công cụ để phân tích ảnh hưởng của một yếu tố nguyên nhân đến một kết quả nào đó, gọi là phân tích phương sai một yếu tố (One-way ANOVA); việc xem xét ảnh hưởng của hai yếu tố nguyên nhân đến một yếu tố kết quả nào đó gọi là phân tích phương sai 2 yếu tố (Two-way ANOVA). • Phân tích phương sai là sự mở rộng của kiểm định independent- Samples T-Test (biến định tính có 3 sự lựa chọn trở lên) • Khi thực hiện ANOVA, yếu tố nguyên nhân phải là biến định tính, ký hiệu là biến xi, yếu tố kết quả (biến phụ thuộc) thường là biến định lượng, ký hiệu là biến y.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Một số giả định đối với phân tích phương sai một yếu tố: Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên. Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn. Các nhóm có cùng phương sai. Từ một biến phân loại X, chúng ta chia tổng thể thành k nhóm độc lập, nhóm 1 có n1 quan sát, nhóm 2 có n2 quan sát, nhóm k có nk quan sát. Chú ý, n = n1 + n2 + + nk. • Giả thuyết H0 là các nhóm (tổng thể) có trung bình bằng nhau: • H0: µ1 = µ2 = = µi = µk; trong đó, µi là trung bình của nhóm thứ i. Giả thuyết đối H1 : có ít nhất hai trung bình là khác nhau.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Các bước tiến hành kiểm định: Bước 1: Tổng các biến thiên giữa các nhóm SSG (between-group sums of squares) là: Bước 2: Tổng các biến thiên trong nội bộ nhóm SSW (within- group sums of squares) là: Bước 3: Tổng biến thiên trong nhóm và giữa các nhóm SST (total sum of squares):
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Loại biến Tổng biến Bậc tự Trung bình biến F thiên thiên do thiên Giữa các SSG k – 1 MSG = SSG/(k – MSG/MSW nhóm 1) Nội bộ nhóm SSW n – k MSW = SSW/(n – k) Tổng SST n – 1
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Quy tắc bác bỏ H0 là nếu giá trị thống kê F lớn hơn giá trị tới hạn Fk-1, n-k,α . Khi sử dụng SPSS, quy tắc bác bỏ H0 là giá trị p-value (sig.) nhỏ hơn mức ý nghĩa kiểm định α. Bây giờ, chúng ta kiểm định ảnh hưởng của 4 nhóm dân tộc khác nhau lên thu nhập. Trong SPSS, ta thao tát như sau: Analyze > Compares means > One – way ANOVA > đưa biến thunhap vào ô Dependent List và đưa biến dantoc vào ô Factor > nhấn Options > nhấp chọn Descriptive và Homogeneity of variance test (kiểm định phương sai đồng nhất, nghĩa là 4 nhóm có cùng phương sai theo giả thuyết của ANOVA).
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA)
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) • Bảng Descriptives trình bày thống kê mô tả của biến thunhap theo 4 nhóm dân tộc. • Bảng Test of Homogeneity of variances kiểm định phương sai bằng nhau của các nhóm. Vì giá trị sig. = .801 > .05 (α = 5%) nên chấp nhận giả thuyết H0: bốn phương sai bằng nhau. • Bảng ANOVA cho thấy sig. = .958 > 0.05 nên chấp nhận giả thuyết H0 : các giá trị trung bình là bằng nhau.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) • Một ví dụ khác, chúng ta phân tích “yếu tố nguyên nhân” tham gia đoàn/hội (biến doanhoi) có ảnh hưởng đến tửu lượng (biến tuuluong) của SV hay không? Để trả lời câu hỏi này, chúng ta cần so sánh giá trị trung bình của biến tuuluong theo hai nhóm: SV tham gia đoàn/hội và SV không tham gia đoàn/hội và kiểm định rằng có hay không có sự khác biệt một cách có ý nghĩa thống kê giữa hai nhóm.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Test of Homogeneity of Variances Từ bảng Test of Homogeneity of 33-point drinking scale Variance, ta thấy Sig. = .058 > 0.05 Levene chấp nhận H0: phương sai đồng nhất Statistic df1 df2 Sig. thỏa mãn giả thuyết về phân tích ANOVA. 3.629 1 241 .058 ANOVA So ly bia uong duoc Từ bảng ANOVA, ta thấy Sig. = .000 < 0.05 bác bỏ giả thuyết H0: Sum of Mean trung bình của hai tổng thể là bằng Squares df Square F Sig. Between nhau nghĩa là, có sự khác biệt có Groups 1838.084 1 1838.084 48.694 .000 ý nghĩa thống kê giữa nhóm SV có Within tham gia đoàn/hội với nhóm SV Groups 9097.134 241 37.747 không tham gia đoan/hội về tửu lượng. Total 10935.218 242
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Bây giờ, chúng ta phân tích “yếu tố nguyên nhân” sinh viên năm thứ nhất, thứ hai, thứ ba và năm cuối (biến namhoc) có ảnh hưởng đến tửu lượng hay không? Như vậy, chúng ta cần so sánh giá trị trung bình của biến tuuluong theo 4 nhóm SV và kiểm định rằng có hay không có sự khác biệt có ý nghĩa thống kê giữa các nhóm này.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Descriptives So ly bia uong duoc 95% Confidence Interval for Mean Std. Std. Lower Upper Minimu Maxim N Mean Deviation Error Bound Bound m um Nam thu nhat 40 18.98 6.923 1.095 16.76 21.19 4 31 Nam thu hai 65 21.17 6.544 .812 19.55 22.79 4 33 Nam thu ba 75 19.45 6.287 .726 18.01 20.90 5 32 Nam thu tu 63 16.65 6.641 .837 14.98 18.32 4 29 Total 243 19.11 6.722 .431 18.26 19.96 4 33
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Test of Homogeneity of Variances Chúng ta bác bỏ giả thuyết H0: trung So ly bia uong bình của các nhóm là bằng nhau vì sig. duoc = 0.002. Nghĩa là có sự khác biệt có ý nghĩa thống kê về tửu lượng giữa 4 Levene Statistic df1 df2 Sig. nhóm SV phân theo năm học. Giá trị .058 3 239 .981 Sig. = 0.981 > 0.05 (xem bảng Test of Homogeneity of Variances) có thể nói ANOVA phương sai về tửu lượng giữa 4 nhóm So ly bia uong duoc SV không khác biệt một cách có ý nghĩa thống kê. Kết quả phân tích Sum of Mean ANOVA như trên có thể sử dụng tốt. Squares df Square F Sig. Between Tuy nhiên, bảng trên chưa cho biết sự Groups 666.201 3 222.067 5.168 .002 khác biệt giữa các cặp trong 4 nhóm SV. Chúng ta cần thực hiện kiểm định Within Groups 10269.018 239 42.967 hậu ANOVA, với 2 phương pháp kiểm Total 10935.218 242 định bonferroni và scheffe.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) CÁC LOẠI KIỂM ĐỊNH
- Multiple Comparisons Dependent Variable:So ly bia uong duoc 95% Confidence Interval (I) Dang hoc (J) Dang hoc Mean nam thu nam thu Difference (I-J) Std. Error Sig. Lower Bound Upper Bound Scheffe Nam thu nhat Nam thu hai -2.194 1.317 .429 -5.90 1.51 Nam thu ba -.478 1.283 .987 -4.09 3.14 Nam thu tu 2.324 1.325 .382 -1.41 6.06 Nam thu hai Nam thu nhat 2.194 1.317 .429 -1.51 5.90 Nam thu ba 1.716 1.111 .498 -1.41 4.84 Nam thu tu 4.518* 1.159 .002 1.26 7.78 Nam thu ba Nam thu nhat .478 1.283 .987 -3.14 4.09 Nam thu hai -1.716 1.111 .498 -4.84 1.41 Nam thu tu 2.803 1.120 .103 -.35 5.96 Nam thu tu Nam thu nhat -2.324 1.325 .382 -6.06 1.41 Nam thu hai -4.518* 1.159 .002 -7.78 -1.26 Nam thu ba -2.803 1.120 .103 -5.96 .35 Bonferroni Nam thu nhat Nam thu hai -2.194 1.317 .582 -5.70 1.31 Nam thu ba -.478 1.283 1.000 -3.89 2.94 Nam thu tu 2.324 1.325 .484 -1.20 5.85 Nam thu hai Nam thu nhat 2.194 1.317 .582 -1.31 5.70 Nam thu ba 1.716 1.111 .742 -1.24 4.67 Nam thu tu 4.518* 1.159 .001 1.44 7.60 Nam thu ba Nam thu nhat .478 1.283 1.000 -2.94 3.89 Nam thu hai -1.716 1.111 .742 -4.67 1.24 Nam thu tu 2.803 1.120 .078 -.18 5.78 Nam thu tu Nam thu nhat -2.324 1.325 .484 -5.85 1.20 Nam thu hai -4.518* 1.159 .001 -7.60 -1.44 Nam thu ba -2.803 1.120 .078 -5.78 .18 *. The mean difference is significant at the 0.05 level.
- 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Cả 2 phương pháp bonferroni và scheffe đều cho thấy sự khác biệt có ý nghĩa trong trị trung bình giữa nhóm SV năm thứ hai và SV năm thứ tư, trong khi các nhóm khác thì không.



