Mã hóa biến định lượng thành định tính trên stata

Website: https://sites.google.com/site/buitoanffb Bài giảng: Phân tích định lượng trên phần mềm Stata Giảng viên: ThS. Bùi Ngọc Toản NỘI DUNG CHÍNH  Tổng quan về nghiên cứu định lượng  Tiến trình thiết lập mô hình nghiên cứu;  Cách thức lựa chọn phần mềm thống kê trong nghiên cứu định lượng.  Phân tích định lượng trên phần mềm Stata  Giới thiệu phần mềm Stata;  Ứng dụng phần mềm Stata trong các tình huống cụ thể. Bài giảng: Phân tích định lượng trên phần mềm Stata Giảng viên: ThS. Bùi Ngọc Toản

Lớp thống kê Y học dùng SPSS - Hướng dẫn chấm trắc nghiệm bằng webcam với các mẫu phiếu 100 câu, 200 câu - Scan phiếu thu thâp số liệu - Chuyên mục Đổi mới dạy và học và chuyên mục Lượng giá - Giới thiệu hệ thống chấm trắc nghiệm bằng webcam -

Trong bộ số liệu định lượng có những biến được liệt kê dưới dạng chữ và phần mềm ta đang sử dụng không thể xử lý được dạng dữ liệu này. Vì vậy để có thể sử dụng được các thông tin này chúng ta cần mã hóa lại các biến dạng chữ thành biến mới hoặc biến đã có sẵn nhưng ở dạng số.

Syntax:

replace [biến cũ]=[giá trị mới bằng số] if [biến cũ]= “biến chữ”.

Ví dụ: Trong bộ số liệu Data 3, ta nhận thấy biến nghề nghiệp có thêm đáp án khác (q88a) được viết dưới dạng chữ. Nếu ta để nguyên dạng chữ như thế này thì phần mềm không thể xử lý được và ta sẽ bị thiếu đi thông tin về nghề nghiệp của 12 bà mẹ trong nghiên cứu.Vì vậy ta có thể sử dụng cú pháp biến đổi các biến chữ thành số và xử lý như sau:

tab q8

Phân bố tần số trước khi mã hóa biến dạng chữ.

Syntax ví dụ:

replace q8=1 if q88a== “CHAN NUOI” | q88a== “CHAN NUOI LON” | q88a== “TRONG CHE” |q88a== “LAM CHE”

replace q8==4 if q88a== “BAC SY” | q88a== “GIAO VIEN” | q88a== “PHO CHU TICH HOI PHU NU XA”

tab q8

Phân bố sau khi mã hóa biến dạng chữ.

Mã hóa biến định lượng thành định tính trên stata

******Kết hợp biến chữ và biến số - Sử dụng Data 5

Chúng ta sẽ cần biết cách kết hợp một biến số và một biến chữ vào những thời điểm nào?

Ví dụ: chúng ta có số phòng học là số (a2) và chúng ta có các môn học là biến chữ (a1). Nếu muốn sắp xếp các môn học theo từng phòng học riêng thì chúng ta sẽ làm gì? Hãy tạo ra một biến mới kết hợp cả số phòng học và tên môn học đi kèm. Cú pháp của chúng ta cần là:

Phần này chỉ ra cách tạo và mã hóa lại các biến. Trong Stata, bạn có thể tạo các biến mới bằng lệnh generate và bạn có thể sửa đổi các giá trị của một biến hiện có bằng lệnh replace hoặc recode. 3 phần chính sau sẽ được đề cập trong bài viết này:

  • Tính toán các biến mới bằng cách sử dụng generate và replace
  • Mã hóa phân loại các biến mới bằng cách sử dụng generate và replace
  • Mã hóa phân loại các biến bằng cách sử dụng recode

Hãy sử dụng file auto cho các ví dụ . Trong phần này, chúng ta sẽ xem cách tính toán các biến với lệnh generate và replace. sysuse auto, clear Biến length là chiều dài của xe tính bằng inch. Dưới đây là thống kê tóm tắt về chiều dài của xe.

Mã hóa biến định lượng thành định tính trên stata
Giờ muốn đổi chiều dài qua thành đơn vị mét thì tạo biến mới length_met như sau generate length_met=length*0.0254 Lưu ý để tạo biến mới thì dùng lệnh generate Còn để cập nhật giá trị cho biến đã có sẵn thì dùng lệnh replace Ví dụ cập nhật giá trị cho biến được tạo lúc nãy thì làm như sau: replace length_met=length*0.0254 summarize length length_met
Mã hóa biến định lượng thành định tính trên stata
Cú pháp của generate và replace giống hệt nhau, ngoại trừ: – generate hoạt động khi biến chưa tồn tại và sẽ báo lỗi nếu biến đã tồn tại. – replace hoạt động khi biến đã tồn tại và sẽ đưa ra lỗi nếu biến chưa tồn tại. Giả sử chúng ta muốn tạo một biến có tên là length2 là độ dài bình phương. generate length2=length^2 hoặc lấy Logarit tự nhiên (còn gọi là logarit Nêpe) generate loglen = log(length) Giờ sẽ tính trung bình cộng và độ lệch chuẩn của length, từ đó tính được điểm Z-scores của length. summarize length length_met
Mã hóa biến định lượng thành định tính trên stata
Trung bình cộng là 187.93 và độ lệch chuẩn là 22.27, vậy biến zlength được tính như sau. generate zlength = (length – 187.93) / 22.27 summarize zlength
Mã hóa biến định lượng thành định tính trên stata

Mã hóa phân loại các biến mới bằng cách sử dụng generate và replace

Giả sử rằng muốn chia biến mpg thành ba loại. Hãy xem bảng mpg hiện tại đang như thế nào nhé.

Mã hóa biến định lượng thành định tính trên stata
Ta dùng các câu lệnh sau để tạo biến mới và gán giá trị cho nó generate mpg3 = . replace mpg3 = 1 if (mpg <= 18) replace mpg3 = 2 if (mpg >= 19) & (mpg <=23) replace mpg3 = 3 if (mpg >= 24) & (mpg <.) tab mpg3
Mã hóa biến định lượng thành định tính trên stata
Như vậy quãng đường đi được trên một đơn vị xăng đã được chia ra 3 loại. Từ đó ta có thể phân khúc được xe nào ít tốn xăng hơn theo thể loại xe nhập và xe nội tab mpg3 foreign
Mã hóa biến định lượng thành định tính trên stata

Mã hóa phân loại các biến bằng cách sử dụng recode

Có một cách dễ dàng hơn để mã hóa lại biến mpg thành ba danh mục bằng cách sử dụng lệnh generate và recode. Đầu tiên, chúng ta tạo một bản copy của mpg, gọi nó là mpg3a. Sau đó, chúng ta sử dụng recode để chuyển đổi mpg3a thành ba loại: nhỏ nhất đến 18 thành 1, 19-23 thành 2 và 24 đến lớn nhất thành 3. generate mpg3a = mpg recode mpg3a (min/18=1) (19/23=2) (24/max=3) Giờ ta so sánh biến mpg3 và mpg3a xem có giống nhau không nhé tab mpg3 mpg3a

Mã hóa biến định lượng thành định tính trên stata
Hai biến này xem như là một nhé, tuy dùng 2 cách khác nhau nhưng cùng ra kết quả Ngoài ra, ta có thể sử dụng lệnh if nếu muốn recode một số đối tượng nào đó theo 1 chuẩn nào đó, ví dụ nhé generate mpgfd = mpg recode mpgfd (min/18=0) (19/max=1) if foreign==0 recode mpgfd (min/24=0) (25/max=1) if foreign==1 Ở đây có nghĩa là nếu xe nước ngoài thì ngưỡng chia recode khác, xe trong nước thì ngưỡng chia recode khác

Bạn cứ trao đổi thêm với nhóm ở đây, hoặc comment bên dưới nhé.

Liên hệ nhóm thạc sĩ Hỗ trợ Stata.

– SMS, Zalo, Viber:

Mã hóa biến định lượng thành định tính trên stata

– Facebook facebook.com/hotroStata

– Email [email protected]