Mã hóa biến định lượng thành định tính trên stata

Website: //sites.google.com/site/buitoanffb Bài giảng: Phân tích định lượng trên phần mềm Stata Giảng viên: ThS. Bùi Ngọc Toản NỘI DUNG CHÍNH  Tổng quan về nghiên cứu định lượng  Tiến trình thiết lập mô hình nghiên cứu;  Cách thức lựa chọn phần mềm thống kê trong nghiên cứu định lượng.  Phân tích định lượng trên phần mềm Stata  Giới thiệu phần mềm Stata;  Ứng dụng phần mềm Stata trong các tình huống cụ thể. Bài giảng: Phân tích định lượng trên phần mềm Stata Giảng viên: ThS. Bùi Ngọc Toản

Lớp thống kê Y học dùng SPSS - Hướng dẫn chấm trắc nghiệm bằng webcam với các mẫu phiếu 100 câu, 200 câu - Scan phiếu thu thâp số liệu - Chuyên mục Đổi mới dạy và học và chuyên mục Lượng giá - Giới thiệu hệ thống chấm trắc nghiệm bằng webcam -

Trong bộ số liệu định lượng có những biến được liệt kê dưới dạng chữ và phần mềm ta đang sử dụng không thể xử lý được dạng dữ liệu này. Vì vậy để có thể sử dụng được các thông tin này chúng ta cần mã hóa lại các biến dạng chữ thành biến mới hoặc biến đã có sẵn nhưng ở dạng số.

Syntax:

replace [biến cũ]=[giá trị mới bằng số] if [biến cũ]= “biến chữ”.

Ví dụ: Trong bộ số liệu Data 3, ta nhận thấy biến nghề nghiệp có thêm đáp án khác [q88a] được viết dưới dạng chữ. Nếu ta để nguyên dạng chữ như thế này thì phần mềm không thể xử lý được và ta sẽ bị thiếu đi thông tin về nghề nghiệp của 12 bà mẹ trong nghiên cứu.Vì vậy ta có thể sử dụng cú pháp biến đổi các biến chữ thành số và xử lý như sau:

tab q8

Phân bố tần số trước khi mã hóa biến dạng chữ.

Syntax ví dụ:

replace q8=1 if q88a== “CHAN NUOI” | q88a== “CHAN NUOI LON” | q88a== “TRONG CHE” |q88a== “LAM CHE”

replace q8==4 if q88a== “BAC SY” | q88a== “GIAO VIEN” | q88a== “PHO CHU TICH HOI PHU NU XA”

tab q8

Phân bố sau khi mã hóa biến dạng chữ.

******Kết hợp biến chữ và biến số - Sử dụng Data 5

Chúng ta sẽ cần biết cách kết hợp một biến số và một biến chữ vào những thời điểm nào?

Ví dụ: chúng ta có số phòng học là số [a2] và chúng ta có các môn học là biến chữ [a1]. Nếu muốn sắp xếp các môn học theo từng phòng học riêng thì chúng ta sẽ làm gì? Hãy tạo ra một biến mới kết hợp cả số phòng học và tên môn học đi kèm. Cú pháp của chúng ta cần là:

Phần này chỉ ra cách tạo và mã hóa lại các biến. Trong Stata, bạn có thể tạo các biến mới bằng lệnh generate và bạn có thể sửa đổi các giá trị của một biến hiện có bằng lệnh replace hoặc recode. 3 phần chính sau sẽ được đề cập trong bài viết này:

  • Tính toán các biến mới bằng cách sử dụng generate và replace
  • Mã hóa phân loại các biến mới bằng cách sử dụng generate và replace
  • Mã hóa phân loại các biến bằng cách sử dụng recode

Hãy sử dụng file auto cho các ví dụ . Trong phần này, chúng ta sẽ xem cách tính toán các biến với lệnh generate và replace. sysuse auto, clear Biến length là chiều dài của xe tính bằng inch. Dưới đây là thống kê tóm tắt về chiều dài của xe.

Giờ muốn đổi chiều dài qua thành đơn vị mét thì tạo biến mới length_met như sau generate length_met=length*0.0254 Lưu ý để tạo biến mới thì dùng lệnh generate Còn để cập nhật giá trị cho biến đã có sẵn thì dùng lệnh replace Ví dụ cập nhật giá trị cho biến được tạo lúc nãy thì làm như sau: replace length_met=length*0.0254 summarize length length_met
Cú pháp của generate và replace giống hệt nhau, ngoại trừ: – generate hoạt động khi biến chưa tồn tại và sẽ báo lỗi nếu biến đã tồn tại. – replace hoạt động khi biến đã tồn tại và sẽ đưa ra lỗi nếu biến chưa tồn tại. Giả sử chúng ta muốn tạo một biến có tên là length2 là độ dài bình phương. generate length2=length^2 hoặc lấy Logarit tự nhiên [còn gọi là logarit Nêpe] generate loglen = log[length] Giờ sẽ tính trung bình cộng và độ lệch chuẩn của length, từ đó tính được điểm Z-scores của length. summarize length length_met
Trung bình cộng là 187.93 và độ lệch chuẩn là 22.27, vậy biến zlength được tính như sau. generate zlength = [length – 187.93] / 22.27 summarize zlength

Mã hóa phân loại các biến mới bằng cách sử dụng generate và replace

Giả sử rằng muốn chia biến mpg thành ba loại. Hãy xem bảng mpg hiện tại đang như thế nào nhé.

Ta dùng các câu lệnh sau để tạo biến mới và gán giá trị cho nó generate mpg3 = . replace mpg3 = 1 if [mpg = 19] & [mpg = 24] & [mpg

Chủ Đề