So sánh nhóm bệnh và nhóm chứng trong stata năm 2024

1. Tạo biến mới[chú ý rằng trong 1 bộ số liệu,biến mới chỉ tạo được từ số liệu đã có] a. tạo biến mới i. :gen tenbien = giá trị của biến ii. : gen tenbienmoi = irecode[bienlientuc, điểmchiakhỏang,.,.,] [ ví dụ :gen nhomtuoi= irecode[tuoime,29,34,39] ] iii. Recode " biến cũ " [luật định lại giá trị của biến mới],gen [biến mới] b. tạo nhãn :label define tenbien tennhan c. dán nhãn cho biến: label value tenbien tennhan d. dán nhãn vào hộp biến số trên giao diện màn hình stata: label var tenbien tennhan 2. Mô tả số liệu bằng bảng trong stata a. biến định tính :tab1 biếnđịnhtính b. biến định lượng: sum biếnđịnhlượng chú ý rằng lệnh sum không có chỉ định gì phía sau sẽ mô tả toàn bộ bộ số liệu giúp kiểm tra tính hợp lý của bộ số liệu c. phân tầng theo nhóm :-bysort biếnđịnhtính: sum biếnđịnhlượng-bysort biếnđịnhtính: tab1 biếnđịnhtính 3. mô tả số liệu bằng hình [vẽ đồ thị] trong stata a. phân tán đồ: i. ngắn gọn twoway[scatter bienphuthuoc biendoclap] lfit [bienphuthuoc biendoclap] ii. đầy đủ twoway [scatter bienphuthuoc biendoclap] lfit [bienphuthuoc biendoclap], ytitle[tentructung [donvidoluong]] ylabel[gitrinhonhat[khoangcach]giatrilonnhat, angle[horizontal]] xtitle[tentruchoanh [donvi]] xlabel[giatrinhonhat[khoangcach]giatrilonnhat, angle[vertical]] title[tên của phân tán đồ] iii. thí dụ vẽ phân tán đồ giữa biến tlsosinh và tuoithai trong tập tin ivf_2.dta: twoway [scatter tlsosinh tuoithai] lfit [tlsosinh tuoithai], ytitle[trong luong so sinh [gram]] ylabel[0[500]5000, angle[horizontal]] xtitle[tuoi thai [tuan]] xlabel[24[6]42, angle[vertical]] title[moi tuong quan trong luong so sinh và tuoi thai] b. thị suất đồ : qnorm biếnđịnhlượng c. tổ chức đồ : histogram biếnđịnhlượng, normal d. biểu đồ hình hộp 2 nhóm: graph box biếnđịnhlượng, over [biếnđịnhtính] e. biểu đồ hình thanh : graph bar [mean] biếnđịnhlượng, over [biếnđịnhtính] f. biểu đồ hình bánh: Graph pie, over [biếnđịnhtính]

Thongke.info xin giới thiệu phương pháp tính cỡ mẫu cho nghiên cứu thử nghiệm lâm sàng, nghiên cứu thuần tập tương lai có nhóm chứng.

Tình huống:

Một nhóm nghiên cứu tiến hành một nghiên cứu thử nghiệm một loại thuốc kháng sinh A [thuốc mới] để phòng chống nhiễm trùng cho bênh nhân sau mổ. Hiện tại kháng sinh B [tiêu chuẩn] vấn đang được sử dụng trong phòng chống nhiễm trùng sau mổ. Tỷ lệ vẫn bị nhiễm trùng khi dùng kháng sinh B là 30%. Kháng sinh mới A sẽ được công nhận là hiệu quả hơn kháng sinh cũ nếu tỷ lệ bệnh nhân sử dụng bị nhiễm trùng sau mổ giảm xuống 10%

Hãy tính cỡ mẫu cho hai nhóm bệnh nhân: một nhóm [thử nghiệm] sử dụng kháng sinh A và nhóm đối chứng sử dụng kháng sinh B [tiêu chuẩn]. Lực mẫu 80% cho kiểm định 2 phía ở mức alpha = 0.05

LỆNH SỬ DỤNG TRONG STATA

. sampsi 0.3 0.1, alpha [0.05] power [0.80]

GIẢI THÍCH CÁCH STATA TÍNH TOÁN CỠ MẪU

Sử dụng công thức tính cỡ mẫu Fleiss1

Where

n1\= number of exposed [intervention] - cỡ mẫu nhóm thử nghiệm dùng kháng sinh mới [A]

n2\= number of control - cỡ mẫu nhóm chứng sử dụng kháng sinh cũ B

standard normal deviate for two-tailed test based on alpha level [relates to the confidence interval level] = 1.96

standard normal deviate for one-tailed test based on beta level [relates to the power level 80%] = 0.842

r = ratio of unexposed [control] to exposed [intervention] - tỷ suất nhóm thử nghiệm/nhóm chứng = 1

p1 = proportion of exposed with outcome - tỷ lệ bệnh nhân nhóm thử nghiệm dùng kháng sinh mới bị nhiễm trùng = 0,3 và q1 = 1-p1 = 1 - 0,3 = 0,7

p2 = proportion of unexposed with outcome - tỷ lệ bệnh nhân nhóm chứng sử dụng kháng sinh cũ B bị nhiễm trùng =0,1 và q2 = 1-p2 = 1-0,1 = 0,9 Tỷ lệ lưu hành đo lường những trừơng hợp bệnh hiện có tại một thời điểm đặc biệt hoặc trong một khoảng thời gian. Point prevalence – proportion of all cases at a specific point in time. Period prevalence – proportion of all cases during a period of time. Must have a starting and ending point. Incidence generally a more relevant measure of disease occurrence. However in chronic diseases, where flow of new disease is slow, prevalence is more employed.

5 Đo lường tần suất bệnh Dân số có nguy cơ Incidence measures are useful for identifying risk factors and assessing disease etiology. Typically, incidence measures are estimated from clinical trials and from cohort studies, which involve the follow-up of subjects over time. Prevalence measures are not as useful as incidence measures for assessing etiology because prevalence does not consider persons who die from the disease before the prevalence study begins. Typically, prevalence measures are estimated from cross-sectional studies and from case-control studies that use prevalent, rather than incident, cases. Since the number of prevalent cases indicates demand for health care, prevalence measures are most useful in the planning of health services.

6 Đo lường tần suất bệnh P=C/N Loại nghiên cứu: P: Tỷ lệ lưu hành C: Số lượng bệnh hiện có N: Số lượng dân số ổn định Loại nghiên cứu: Nghiên cứu cắt ngang Đăng kí bệnh Incidence concerns new cases of a disease or other health outcome over a period of follow-up. Prevalence concerns existing cases of a disease at a point in time. Incidence measures are useful for identifying risk factors and assessing disease etiology. Prevalence measures are most useful in the planning of health services. By steady state, we mean that even though the population may be dynamic, the number of persons who enter and leave the population for whatever reasons are essentially equal over the study period, so that the population does not change.

7 Đo lường tần suất bệnh CI=I/N IR=I/PT CI: Tỷ lệ phát sinh tích luỹ I: Số lượng bệnh mới mắc N: Số lượng dân số không bị bệnh được theo dõi trong một khoảng thời gian IR=I/PT IR: Tỷ suất phát sinh PT: Thời gian trải nghiệm của dân số có nguy cơ The part of population which is susceptible to a disease is called the population at risk. Occupational injuries occur only among working people so the population at risk is the workforce. Men should not be included in calculations of the frequency of carcinoma of cervix. Cumulative incidence: fixed population

8 Đo lường tần suất bệnh Loại nghiên cứu: Đăng kí bệnh Nghiên cứu cohort Nghiên cứu thử nghiệm Incidence concerns new cases of a disease or other health outcome over a period of follow-up. Prevalence concerns existing cases of a disease at a point in time. Incidence measures are useful for identifying risk factors and assessing disease etiology. Prevalence measures are most useful in the planning of health services.

9 Đo lường tần suất bệnh D+ D- E+ a b a+b E- c d c+d a+c b+d a+b+c+d D+ : bệnh D- : không bệnh E+ : phơi nhiễm E- : không phơi nhiễm

10 Đo lường tần suất bệnh Nếu a+b là số ngươì có nguy cơ thì đây là tỷ lệ phát sinh tích luỹ Nếu a+b là số người năm có nguy cơ thì đây là tỷ suất phát sinh/mật độ phát sinh Re = a/a+b Rne= c/c+d

11 Tỷ lệ phát sinh tích luỹ

12 Tỷ lệ phát sinh tích luỹ Ví dụ: Sử dụng thuốc giảm ăn Nhồi máu cơ tim không tổng 30 470 500 11 489 41 959 1000

13 Tỷ lệ phát sinh tích luỹ Re=a/a+b 95% CI of Re= Re ±Z*SE[Re] SE[Re] là phương sai của Re. Phương sai của Re là: The standard error is a measure of the statistical variability of the estimate. Under the binomial model. Z[a/2]: two-tail Z[a]: one tail

14 Sự phân bố Z [Sự phân bố bình thường chuẩn]

15 Bảng Z //www.sjsu.edu/faculty/gerstman/StatPrimer/negative-z.pdf 2.5% 2.5% -1.96 1.96

16 Tỷ lệ phát sinh tích luỹ Re=30/500=0.06, or 6 per 100 95% CI for Re=0.06±1.96*0.01 95% CI for the risk estimate of 6 per 100 is 4-8 per 100

17 Tỷ suất phát sinh/Mật độ phát sinh

18 Tỷ suất phát sinh/Mật độ phát sinh a: số bệnh PT: người-thời gian E+: phơi nhiễm E-: không phơi nhiễm case PT E+ a PT1 E- c PT2 a+c PT1+PT2 Incidence density/rate data is observed through the transformation of non cases into cases [prospective study]. Follow two populations: those exposed and those unexposed to the factor.

19 Tỷ suất phát sinh/Mật độ phát sinh

20 Tỷ suất phát sinh/Mật độ phát sinh Ví dụ: Ung thư vùng miệng Người thời gian [năm] Hút thuốc lá 15 4768.5 Không hút thuốc lá 5 4872.5

21 Tỷ suất phát sinh/Mật độ phát sinh Follow the Poisson distribution 95% CI for IR=3.1±1.96*0.8 95% CI for the rate estimate of 3.1 per 1000 person-years is per 1000 person-years

22 Đo lường tần suất bệnh P=I*D nếu dân số ổn định và bệnh hiếm gặp. P=[I*D]/[[I*D]+1] nếu bệnh không hiếm gặp. By steady state, we mean that even though the population may be dynamic, the number of persons who enter and leave the population for whatever reasons are essentially equal over the study period, so that the population does not change. Example: prevalence of AIDS increases. Could be good: duration of disease increases. Could be bad: incidence increases.

23 Thiết kế nghiên cứu và các đo lường tương quan

24 Thiết kế nghiên cứu và các đo lường tương quan Nghiên cứu cohort: Câu hỏi nghiên cứu: So với những người không phơi nhiễm, những người phơi nhiễm có xu hướng dễ mắc bệnh hơn? Đo lường: Nguy cơ tương đối [Tỷ số nguy cơ]

25 Nghiên cứu cohort Tình trạng bệnh a b a +b Tình trạng phơi nhiễm c d không tổng có a b a +b Tình trạng phơi nhiễm không c d c +d a +c b +d N

26 Nghiên cứu cohort Ví dụ: Sử dụng thuốc giảm ăn Nhồi máu cơ tim có không tổng 30 470 500 11 489 41 959 1000 Data were obtained in a study in which 1000 nurses were followed for 20 years to examine the hypothesis that use of a certain diet pill is a risk factor for heart attack.

Chủ Đề