One-way anova so sánh điểm trung bình năm 2024

  • 1. PHƯƠNG SAI MỘT YẾU TỐ (ONE WAY ANOVA) ThS HUỲNH TỐ UYÊN 1
  • 2. sai? 2 Ví dụ1: Để xét xem giới tính có ảnh hưởng đến kết quả học tập hay không, người ta so sánh điểm trung bình của nhóm sinh viên nam và sinh viên nữ Nam Nữ 6.5 5.7 7.0 6.8 6.7 8.2 8.0 7.7 5.6 6.4 6.5 Kiểm định xem giới tính có ảnh hưởng đến kết quả học tập? Kiểm định sự khác nhau giữa điểm trung bình của 2 nhóm sinh viên này
  • 3. sai? 3 Ví dụ2: Để xét xem thời gian làm thêm có ảnh hưởng đến kết quả học tập hay không, người ta điều tra mẫu sau: Nhóm 1: làm thêm ít <6 giờ /tuần Nhóm 2: làm thêm TB 6-12 giờ/tuần Nhóm 3: làm thêm nhiều >12 giờ/tuần 6.3 7.2 6,3 7.0 6.6 5.8 6.5 6.1 6.0 6.6 5.8 5.5 7.2 6.8 5.2 6.9 7.1 6.5 6.4 5.9 5.3 6.2 Kiểm định xem thời gian làm thêm có ảnh hưởng đến kết quả học tập không?
  • 4. sai? 4 Phân tích phương sai là phương pháp kiểm định sự bằng nhau của trung bình nhiều tổng thể Phân tích phương sai là phương pháp phân tích sự ảnh hưởng của 1 hay nhiều yếu tố nguyên nhân đến 1 yếu tố kết quả
  • 5. phương sai 1 yếu tố 5 Phân tích phương sai một yếu tố là phân tích ảnh hưởng của một yếu tố nguyên nhân (định tính) đến một yếu tố kết quả (định lượng) Ví dụ: Thời gian làm thêm (yếu tố nguyên nhân – định tính) ảnh hưởng đến kết quả học tập ( yếu tố kết quả - định lượng)
  • 6. phương sai 1 yếu tố 6 BÀI TOÁN: Giả sử ta có k nhóm gồm phần tử được chọn từ k tổng thể. là các trung bình của k tổng thể đó là giá trị (quan sát) thứ j của nhóm thứ i. Bảng giá trị quan sát của k nhóm: 1 2 , ,..., k n n n µ µ µ 1 2 , ,..., k ij x NHÓM 1 2 … k … … … … … … … 11 x 1 1n x 21 x 2 2n x 1 k x k kn x VD: slide 3 ij x Giả sử k tổng thể có phân phối chuẩn, có phương sai bằng nhau, các mẫu là độc lập
  • 7. phương sai 1 yếu tố 7 0 1 2 1 : ... :toàn taïi ít nhaát 1 caëp trung bình khaùc nhau k H H µ µ µ = = =    0 1 2 3 1 : :toàn taïi ít nhaát 1 caëp trung bình khaùc nhau H H µ µ µ = =    0 1 : toá kqkhoângbò aûnhhöôûngbôûi yeáutoá ñangxeùt : toá kqcoù bò aûnhhöôûng H yeáu H yeáu    Ví dụ 2.1 0 1 :thôøigianlaømtheâmkhoângaûnhhöôûngñeánkeátquaû hoïctaäp :thôøigianlaømtheâmcoù aûnhhöôûngñeánkeátquaû hoïctaäp H H   
  • 8. phương sai 1 yếu tố 8 Bước 1: Tính giá trị trung bình cho từng nhóm và chung cho tất cả các nhóm i x x = = = = = = ∑ ∑ ∑ 1 1 1 1 1 i n i ij i j k i i i k i i x x n x x n n n n Ví dụ 2.2 Bước 1. Tính trung bình của từng nhóm và trung bình chung của ba nhóm. = = 1 46,9 6,7 7 x = = 2 45,5 6,5 7 x = = 3 46,8 5,85 8 x + + = = + + 46,9 45,5 46,8 6,3273 7 7 8 x
  • 9. NHOM3 1 x 2 x 3 x x
  • 10. phương sai 1 yếu tố 10 Bước 2: - Tính sự biến thiên (tổng bình phương độ lệch)giữa nội bộ nhóm = = − ∑ 2 1 ( ) i n i ij i j SS x x Ví dụ 2.3 Bước 2. - Tính sự biến thiên giữa nội bộ nhóm: = = = = + + = + + = 1 2 3 1 2 3 0,68 1,96 1,62 0,68 1,96 1,62 4,26 SS SS SS SSW SS SS SS = = ∑ 1 k i i SSW SS Tổng biến thiên nội bộ của tất cả các nhóm
  • 11. phương sai 1 yếu tố Nhận xét: SSW= tổng biến thiên nội bộ của cả 3 nhóm = sự biến thiên gây ra bởi các yếu tố khác yếu tố mà ta đang nghiên cứu
  • 12. phương sai 1 yếu tố Bước 2:(tt) - Tính sự biến thiên giữa các nhóm = = − ∑ 2 1 ( ) k i i i SSG x x n Ví dụ 2.3(tt) - Tính sự biến thiên giữa các nhóm: = − + − + − = 2 2 2 (6,7 6,3273) .7 (6,5 6,3273) .7 (5,85 6,3273) .8 3,004 SSG
  • 13. phương sai 1 yếu tố Nhận xét: SSG = sự biến thiên gây ra bởi sự khác nhau giữa các nhóm = sự biến thiên gây ra bởi các yếu tố mà ta đang nghiên cứu x
  • 14. phương sai 1 yếu tố Gọi SST là tổng biến thiên của 1 quan sát bất kì so với giá trị trung bình SST= SSW + SSG Tổng biến thiên = biến thiên do các yếu tố khác(SSW) + biến thiên do yếu tố đang nghiên cứu(SSG) Nhận xét: Nếu phần biến thiên do các yếu tố nghiên cứu tạo ra (SSG) lớn hơn phần biến thiên do các yếu tố khác tạo ra (SSW) thì chứng tỏ yếu tố ta đang nghiên cứu thật sự ảnh hưởng đến yếu tố kết quả ⇒ tăng khả năng bác bỏ Ho
  • 15. phương sai 1 yếu tố Bước 3: - Tính các phương sai = − SSW MSW n k Ví dụ 2.4 - Tính các phương sai = − 1 SSG MSG k = phương sai do các yếu tố khác tạo ra = phương sai do các yếu tố nghiên cứu tạo ra = = − = = − 4,26 0,224 22 3 3,004 1,502 3 1 MSW MSG
  • 16. phương sai 1 yếu tố Bước 4: Kiểm định giả thuyết: Xét tỉ số 2 phương sai phöông sai do yeáu toá nghieân cöùu phöông sai do yeáu toá khaùc = = MSG F MSW Nhận xét: Nếu MSG lớn, MSW nhỏ ⇒ F lớn ⇒ bác bỏ Ho Fα α α α (k-1,n-k) α α α α 1 -α α α α 0 Nếu F> Fα α α α (k-1,n-k) ⇒ bác bỏ Ho
  • 17. dụ 2.5 - Tính tỉ số F = = = 1,502 6,7 0,224 MSG F MSW α − − = = 1, , 2 ;19 ; 0,05 3,52 k n k F F Vì nên ta bác bỏ Ho ⇒ Việc đi làm thêm có ảnh hưởng đến kết quả học tập của sinh viên α − − > 1, , k n k F F
  • 18. quả phân tích phương sai thường được trình bày dưới dạng bảng sau đây Nguồn biến thiên Tổng các độ lệch bình phương Bậc tự do Trung bình của các độ lệch bình phương (phương sai) Giá trị kiểm định F Giữa các nhóm SSG k-1 Trong nội bộ nhóm SSW n-k Tổng cộng SST n-1 1 SSG MSG k = − MSG F MSW = SSW MSW n k = −
  • 19. Sum Average Variance Nhóm 1 7 46.9 6.7 0.11333 Nhóm 2 7 45.5 6.5 0.32666 Nhóm 3 8 46.8 5.85 0.23142 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 3.00364 2 1.50181 6.69825 0.00628 3.5219 Within Groups 4.26 19 0.22421 Total 7.26364 21 F tra bảng
  • 20. dụng Ví dụ 3: Cho 1 phần bảng ANOVA a) Hãy hoàn tất bảng b) Với mức ý nghĩa 0,05 cho biết có sự khác biệt về trung bình các tổng thể hay không? Nguồn biến thiên Tổng các độ lệch bình phương Bậc tự do Trung bình của các độ lệch bình phương (phương sai) Giá trị kiểm định F Giữa các nhóm 16,9 6 ?(1) ?(2) Trong nội bộ nhóm ?(3) 41 ?(4) Tổng cộng 45,2 ?(5)
  • 21. dụng Ví dụ 4: Nghiên cứu về thu nhập của các hộ gia đình ở ngoại thành, người ta chia ngoại thành thành 7 địa bàn dân cư khác nhau. Chọn ngẫu nhiên các hộ trong từng địa bàn và ghi nhận thu nhập. Địa bàn dân cư thứ ba có 13 hộ được chọn, các địa bàn còn lại đều chọn 19 hộ. Kết quả ANOVA như sau: Ở mức ý nghĩa 1% có thể kết luận rằng thu nhập trung bình của các hộ gia đình ở các địa bàn dân cư khác nhau là như nhau được không? Source of Variation SS df MS F Between Groups 187,2649 ?(1) ?(2) ?(3) Within Groups ?(4) ?(5) ?(6) Total 1269,6891
  • 22. trường hợp bác bỏ H0 ta muốn kết luận về sự hơn kém của các trung bình thì ta cần phân tích sâu hơn ⇒ PHÂN TÍCH SÂU ANOVA (KIỂM ĐỊNH TURKEY)
  • 23. sâu ANOVA – kiểm định Turkey Mục đích phân tích sâu ANOVA Trong kiểm định: Nếu chấp nhận Ho phân tích xong Bác bỏ Ho phân tích sâu hơn để xem trung bình các nhóm nào khác nhau, lớn hơn hay nhỏ hơn. 0 1 2 1 : ... : toàn taïi ít nhaát 1 caëp trung bình khaùc nhau k H H µ µ µ = = =   
  • 24. sâu ANOVA – kiểm định Turkey Phương pháp phân tích sâu ANOVA: kiểm định Turkey: Với cùng mức ý nghĩa α, ta so sánh từng cặp trung bình để phát hiện những nhóm khác nhau. Khi có k nhóm, số cặp cần phải kiểm định là tổ hợp chập 2 của k nhóm Ck 2 Ví dụ 2.6: Trong ví dụ 2 ta có k=3, vậy ta cần kiểm định C3 2 =3 cặp 0 1 3 0 1 0 1 2 1 1 3 1 1 1 1 2 : : : , ,..., : : : k k k k H H H H H H µ µ µ µ µ µ µ µ µ µ µ µ − − = = =       ≠ ≠ ≠    0 2 3 0 1 3 0 1 2 1 2 3 1 1 3 1 1 2 : : : , , : : : H H H H H H µ µ µ µ µ µ µ µ µ µ µ µ = = =       ≠ ≠ ≠   
  • 25. sâu ANOVA – kiểm định Turkey Phương pháp phân tích sâu ANOVA: kiểm định Turkey: { } ( , ), min min 1 2 min , ,..., k n k k MSW T q n n n n n α − = = Ví dụ 2.7: Bước 1: tính Bước 2: tính trong đó q: phân phối Turkey ( bảng tra 9) Bước 3: Bác bỏ Ho nếu Dij T ij i j D x x = − 12 1 2 23 31 1: 0,2 0,65; 0,85 B D x x D D = − = = = 0,224 2: 3,59 0,6422 7 B T = = 12 1 2 23 2 3 31 3 1 3: B D T D T D T µ µ µ µ µ µ ⇒ = ⇒ ≠ ⇒ ≠ 2 1 3 2 3 1 3 ì , , v x x x µ µ µ µ ⇒
  • 26. HỢP Ban Giám hiệu một trường đại học muốn nghiên cứu ảnh hưởng của việc đi làm thêm đối với kết quả học tập của sinh viên. Một sinh viên đã thu thập thời gian đi làm thêm và kết quả học tập của một số sinh viên trong trường. Sinh viên có đi làm thêm được chia thành ba nhóm. Nhóm thứ nhất gồm 7 sinh viên có thời gian làm thêm ít, dưới 6 giờ / tuần. Nhóm thứ hai gồm 7 sinh viên có thời gian làm thêm vừa phải, từ 6 đến 12 giờ / tuần. Nhóm thứ ba gồm 8 sinh viên có thời gian làm thêm nhiều , trên 12 giờ / tuần. Điểm trung bình học tập của các sinh viên đó như sau. Nhóm 1 Nhóm 2 Nhóm 3 6,3 7.0 6,5 6,6 7,2 6,9 6,4 7,2 6,6 6,1 5,8 6,8 7,1 5,9 6,3 5,8 6,0 5,5 5,2 6,5 5,3 6,2 46,9 45,5 46,8 ∑ Phát biểu giả thuyết: thời gian đi làm thêm không ảnh hưỏng đến kết quả học tập của sinh viên, nghĩa là điểm trung bình học tập của ba nhóm trên là như nhau: . Ta kiểm định giả thuyết trên với mức ý nghĩa 5%.