Sử dụng stata để so sánh năm 2024

Nhìn chung, tiến trình phân tích số liệu bao gồm 3 bước: quản lý số liệu, phân tích số liệu mang tính chất thăm dò, và phân tích thống kê 1. Quản lý số liệu: bao gồm tất cả các công đoạn từ thu thập số liệu, nhập số liệu, kiểm tra và làm sạch số liệu 2. Phân tích số liệu mang tính chất thăm dò (exploratory data analysis): là công đoạn xem xét số liệu với các phép thống kê mô tả và các kỹ thuật vẽ đồ thị (graphs) 2.1 Kiểm tra số liệu Một số sai sót của số liệu có thể được phát hiện bằng việc kiểm tra nhanh với lệnh tabulate (đối với biến số phân loại) và summarize (đồi với biến số liên tục) 2.2 Xử lý "Các giá trị nằm ngoài" (Outliers) Các "outliers" có thể là do:

  • 1. KÊ CƠ BẢN VỚI STATA PGS.TS. Hoàng Văn Minh Hà nội- tháng 6 năm 2015 NỘI DUNG 1. Khái niệm thống kê cơ bản 2. Lựa chọn trắc nghiệm thống kê 3. Thực hành thống kê với Stata
  • 2. toán học có nhiệm vụ thu thập, phân tích, phiên giải và trình bày SỐ LIỆU” Thống kê Quần thể Mẫu Chọn mẫu Thống kê suy luận Thống kê mô tả
  • 3. đối tượng chính của thống kê Biến số# Hằng số Biến số Định lượng Định tính
  • 4. Tuổi,  Giới  Trị số huyết áp  Hàm lượng ure máu  Mức độ trầm trọng của bệnh  Các phương pháp điều trị  Tử vong/sống sót THỐNG KÊ Mô tả biến định lượng Mô tả biến định tính Suy luận biến định lượng Suy luận biến định tính
  • 5. tả biến định lượng Đo lường độ tập trung (Location) Trung bình (mean) Trung vị (median) Mode Đo lường độ phân tán (Spread ) Khoảng số liệu (range) Khoảng tứ phân vị (25%-75%) (Interquartile ) Độ lệch chuẩn (Standard deviation) Phương sai (Variance) Bài tập: sl1_ureamau sum urea sum urea, d histogram urea, normal graph box urea
  • 6. tả biến định tính Tần số Tỷ lệ phần trăm Bài tập: sl1_ureamau tab urecao graph pie, over(urecao) plabel(_all percent)
  • 7. Thực hiện thống kê mô tả biến urea theo nhóm tuổi (caotuoi) 2. Thực hiện thống kê mô tả biến urea cao theo nhóm tuổi (caotuoi) Bài tập: sl1_ureamau tabstat urea, by( caotuoi) stat(n mean median sd min max) f(%9.2g) tab urecao caotuoi, col graph pie, over(urecao) by(caotuoi) plabel(_all percent) graph bar (mean) urecao, over(caotuoi) blabel(bar)
  • 8. mẫu Thống kê suy luận Thống kê mô tả Thống kê suy luận Ước lượng khoảng Kiểm định giả thuyết Quần thể Mẫu Chọn mẫu Mẫu Chọn mẫu Thống kê suy luận Thống kê suy luận Thống kê mô tả
  • 9. 95%CI: 42%-67% Ước lượng khoảng-khoảng tin cậy (confidence interval) Thường chọn khoảng tin cậy 95% (95%CI) Khi thực hiện đo đạc 100 lần thì it nhất 95 lần kết quả nằm trong khoảng tin cậy 95% tin tưởng rằng giá trị thực của quần thể nằm trong khoảng tin cậy 95%CI= Trung bình± 1,96*sai số chuẩn
  • 10. (standard errors) 95%CI= Trung bình± 1,96*sai số chuẩn
  • 11. urea by caotuoi, sort: ci urea ci urecao by caotuoi, sort: ci urecao proportion urecao Quần thể Mẫu NC Chọn mẫu Ngoại suy Trắc nghiệm thống kê Kiểm định giả thuyết => Sử dụng trắc nghiệm (test) thống kê để khẳng định giả thuyết của nhà nghiên cứu
  • 12. định giả thuyết 1. Hình thành giả thuyết (Ho vs. Ha) 2. Xác định ý nghĩa thống kê (=0,05) 3. Xác định test TK 4. Thực hiện test TK để tính p 5. Phiên giải và kểt luận 1-Giả thuyết Giả thuyết Ho: Không có sự khác biệt Giả thuyết Ha: Có sự khác biệt
  • 13. Ho: Giả thuyết Ha: Tác dụng của tiêm nitrate tĩnh mạch có tác dụng giảm tỷ lệ tử vong ở bệnh nhân nhồi máu cơ tim? 2-Mức ý nghĩa thống kê Loại bỏ sai lầm loại I  = 0.05 p = probability= Xác suất để giả thuyết Ho đúng P<0.05 = Xác suất để giả thuyết Ho đúng là < 5% = Ho xảy ra chỉ là may rủi = Bác bỏ Ho = Xác suất để giả thuyết Ha đúng là > 95% = Ha xảy ra là chắc chắn = Chấp nhận Ha P>0.05 = ???
  • 14. (99) 2.576 .02 (98) 2.326 .05 (95) 1.960 .10 (90) 1.645 2-Mức ý nghĩa thống kê 3-Lựa chọn trắc nghiệm thống kê Xác định sự khác biệt Xác định liên quan Biến định lượng Biến định tính 1 2 3 4 MỤC TIÊU BIẾN SỐ
  • 15. khác biệt của biến định lượng Test tham số (Phân bố chuẩn) Test phi tham số (Phân bố chuẩn & không chuẩn) Kiểm định phân bố số liệu
  • 16. bố số liệu • histogram urea, bin (40) normal • sum urea, d • sktest urea • gladder urea 1. Xác định sự khác biệt biến định lượng 1 nhóm 2 nhóm t test ANOVA (ph.sai đ nhất) >2 nhóm Đ.lập: Mann- Whitney test Gh. cặp: Sign test Wilcoxon test Kruskal- Wallis test ttest đlập ttest g.cặp Ph bố Chuẩn Chuẩn & K chuẩn Sign test Wilcoxon test Ph bố Chuẩn Chuẩn & K chuẩn Ph bố Chuẩn Chuẩn & K chuẩn Test tham số Test phi tham số
  • 17. quả Tỷ lệ tử vong ở bệnh nhân nhồi máu cơ tim được tiêm nitrate tĩnh mạch thấp hơn tỷ lệ tử vong ở những bệnh nhân bị nhồi máu cơ tim mà không được tiêm, sự khác biệt là có ý nghĩa thống kê (p<0.05) 5-Phiên giải kết quả Có sự khác biệt không? (Nêu rõ sự khác biệt) Có ý nghĩa thống kê không? Căn cứ vào đâu? Tỷ lệ tử vong ở bệnh nhân nhồi máu cơ tim được tiêm nitrate tĩnh mạch thấp hơn Sự khác biệt là có ý nghĩa thống kê ( p< 0.05, trắc nghiệm khi bình phương)
  • 18. urea=5 signtest urea=5 ttest urea,by(caotuoi) oneway urea caotuoi ranksum urea,by(caotuoi) Bài tập: sl2_oxygen ttest vaovien= sau6h signtest vaovien= sau6h
  • 19. sự khác biệt về áp lực huyết tương của các bệnh nhi nhập viện theo 3 nhóm tuổi? oneway alht tuoi kwallis alht, by( tuoi) kwallis2 alht, by( tuoi) Giá trị mong đợi <5Giá trị mong đợi >=5 Xác định sự khác biệt biến định tính Fisher's exact testKhi bình phương
  • 20. sát và mong đợi Tốt Không tốt Tổng Điều trị 1 4 5 9 Điều trị 2 3 3 6 Tổng 7 8 15 Giá trị mong đợi = (Tổng hàng * Tổng cột) / Tổng chung Bài tập (sl4_benhcotim) So sánh tỷ lệ bệnh cơ tim tab benhcotim hutthuoc, expect tab benhcotim hutthuoc, col chi2 tab benhcotim hutthuoc, col exact
  • 21. liên quan 3. Biến định lượng:  Hệ số tương quan (r)  pearson  spearman  Hồi quy tuyến tính 4. Biến định tính  Tỷ suất chênh (OR), nguy cơ tương đối (RR)  Hồi quy logistic Tương quan biến định lượng (r) • Hệ số tương quan r – Có giá trị từ -1 đến +1 • Khi HSTQ > 0  tương quan đồng biến • Khi HSTQ < 0  tương quan nghịch biến • Càng gần 1  tương quan càng chặt – Quy ước: • <0,3: tương quan yếu • >=0,3-0,5: tương quan TB • >=0,5-0,7: tương quan chặt chẽ • >=0,7: tương quan rất chặt chẽ
  • 22. scatter tuoi thoigian twoway (scatter tuoi thoigian) (lfit tuoi thoigian) corr tuoi thoigian pwcorr tuoi thoigian, sig spearman tuoi thoigian Tương quan của 2 biến định tính Khi muốn tìm cường độ mối liên quan giữa hai biến định tính=> có thể sử dụng: – Tỷ suất chênh: OR – Nguy cơ tương đối: RR Tốt Không tốt Tổng Điều trị 1 4 5 9 Điều trị 2 3 3 6 Tổng 7 8 15
  • 23. -- odds2 risk1 RR= Risk Ratio= -- risk2 OR và RR >1  Yếu tố nguy cơ =1  Không liên quan <1  Yếu tố bảo vệ CI không chứa 1  Có ý nghĩa thống kê
  • 24. quan giữa phương pháp điều trị và nguy cơ tử vong? tabodds ketqua dieutri, or recode dieutri 1=0 2=1 cc ketqua dieutri cs ketqua dieutri