Khoản cách mẫu là gì

Nghiên cứu khoa học

Có hai phương pháp chọn mẫu là chọn mẫu không xác suất và chọn mẫu xác suất. Mẫu được lựa chọn theo phương pháp xác suất mang tính đại diện cao hơn cho quần thể.

1. Mẫu không xác suất [non-probability sampling]

Chọn mẫu không xác suất là người nghiên cứu chọn các đối tượng tham gia nghiên cứu một cách chủ định, dựa trên các cá thể có sẵn khi thu thập số liệu và không tính cỡ mẫu. Chọn mẫu không xác suất có thể là chọn mẫu thuận tiện, chọn mẫu chỉ tiêu hay chọn mẫu có mục đích; nhằm thăm dò hay tìm hiểu sâu một vấn đề vào đó của quần thể [kiến thức, thái độ, niềm tin…]

2. Mẫu xác suất [probability sampling]

Mẫu xác suất là mẫu mà trong đó các cá thể được lựa chọn ngẫu nhiên, mỗi cá thể trong quần thể nghiên cứu đều có cơ hội được lựa chọn ngang nhau và không phụ thuộc vào ý kiến chủ quan của người nghiên cứu.

Các phương pháp chọn mẫu ngẫu nhiên bao gồm:

- Mẫu ngẫu nhiên đơn [single random sampling]

- Mẫu ngẫu nhiên hệ thống [systematic sampling]

- Mẫu ngẫu nhiên phân tầng [stratified sampling]

- Mẫu chùm [cluster sampling]

- Mẫu nhiều giai đoạn [multi-stage sampling]

[Last Updated On: 18/06/2021]

Mục đích của tất cả các phương pháp lấy mẫu là đạt được mẫu đại diện cho cả quần thể nghiên cứu. Khi chọn phương pháp lấy mẫu thì cần hiểu rõ các đặc tính của quần thể nghiên cứu để xác định cỡ mẫu quan sát đại diện và để đánh giá tương đối chính xác quần thể.

Trong nghiên cứu, không thể quan sát hết toàn bộ các cá thể trong quần thể, mà chỉ chọn một số lượng đủ các cá thể đại diện hay còn gọi là mẫu thí nghiệm. Phương pháp chọn mẫu thí nghiệm rất quan trọng, bởi vì có liên quan tới sự biến động hay độ đồng đều của mẫu. Có hai phương pháp chọn mẫu: [1] Chọn mẫu không xác suất [không chú ý tới độ đồng đều] và [2] chọn mẫu xác suất [đề cập tới độ đồng đều].

Chọn mẫu không có xác suất

Phương pháp chọn mẫu không xác suất là cách lấy mẫu trong đó các cá thể của mẫu được chọn không ngẫu nhiên hay không có xác suất lựa chọn giống nhau. Điều này thể hiện trong cách chọn mẫu như sau:

  • Các đơn vị mẫu được tự lựa chọn mà không có phương pháp.
  • Các đơn vị mẫu rất dễ dàng đạt được hoặc dễ dàng tiếp cận. Thí dụ chọn những hộ trên những con đường dễ đi.
  • Các đơn vị mẫu được chọn theo lý do kinh tế, thí dụ trả tiền cho sự tham dự.
  • Các đơn vị mẫu được quan tâm bởi người nghiên cứu trong cách “điển hình” của quần thể mục tiêu. Thí dụ người nghiên cứu chỉ quan tâm đến các nhân vật điển hình trong quần thể nghiên cứu, để so sánh với các nhân vật khác.
  • Các đơn vị mẫu được chọn mà không có sự thiết kế rõ ràng [thí dụ: chọn 50 người đầu tiên đến buổi sáng].

Phương pháp chọn mẫu không có xác suất thường có độ tin cậy thấp. Mức độ chính xác của cách chọn mẫu không xác suất tùy thuộc vào sự phán đoán, cách nhìn, kinh nghiệm của người nghiên cứu, sự may mắn hoặc dễ dàng và không có cơ sở thống kê trong việc chọn mẫu.

Chọn mẫu xác suất

Cơ bản của việc chọn mẫu xác suất là cách lấy mẫu trong đó việc chọn các  cá thể của mẫu sao cho mỗi cá thể có cơ hội lựa chọn như nhau, nếu như có một số cá thể có cơ hội xuất hiện nhiều hơn thì sự lựa chọn không phải là ngẫu nhiên. Để tối ưu hóa mức độ chính xác, người nghiên cứu thường sử dụng phương pháp lấy mẫu ngẫu nhiên.

Các phương pháp chọn mẫu ngẫu nhiên

– Chọn mẫu ngẫu nhiên đơn giản [simple random]

Cách đơn giản nhất của việc chọn các cá thể của mẫu trong cách chọn mẫu ngẫu nhiên là sử dụng xác suất. Việc lựa chọn n các cá thể từ một quần thể sao cho các cá thể có cơ hội bằng nhau hay một xác suất bằng nhau trong phương pháp nầy. Thí dụ: Một trường học có 1.000 sinh viên, người nghiên cứu muốn chọn ra 100 sinh viên để nghiên cứu về tình trạng sức khỏe trong số 1.000 sinh viên. Theo cách chọn mẫu đơn giản thì chỉ cần viết tên 1.000 sinh viên vào trong mẫu giấy nhỏ, sau đó bỏ tất cả vào trong một cái thùng và rồi rút ngẫu nhiên ra 100 mẫu giấy. Như vậy, mỗi sinh viên có một cơ hội lựa chọn như nhau và xác suất chọn ngẫu nhiên một sinh viên trên dễ dàng được tính. Thí dụ trên ta có quần thể N = 1.000 sinh viên và cỡ mẫu n = 100 sinh viên. Như vậy, sinh viên của trường được chọn trong cách lấy mẫu ngẫu nhiên sẽ có xác suất là n/[N x 100] hay 100/[1000 x 100] = 10%.

Một cách chọn mẫu ngẫu nhiên khác là sử dụng bảng số ngẫu nhiên trong sách thống kê phép thí nghiệm hoặc cách chọn số ngẫu nhiên bằng các chương trình thống kê trên máy tính.

Phương pháp chọn mẫu ngẫu nhiên trong các thí nghiệm lấy mẫu trong thực tế được thể hiện trong hình 1.

Hình 1. Phương pháp chọn mẫu ngẫu nhiên trong thực tế

– Chọn mẫu phân lớp [stratified samples]

Chọn mẫu phân lớp được thực hiện khi quần thể mục tiêu được chia thành các nhóm hay phân lớp. Trong phương pháp lấy mẫu phân lớp, tổng quần thể [N] đầu tiên được chia ra thành L lớp của các quần thể phụ N1, N2 … NL, như vậy:

Để áp dụng kỹ thuật chọn mẫu phân lớp thì trước tiên người nghiên cứu cần nắm các thông tin và các số liệu nghiên cứu trước đây có liên quan đến cách lấy mẫu phân lớp. Sau đó, người nghiên cứu sẽ xác định cỡ mẫu và chọn ngẫu nhiên các cá thể trong mỗi lớp.

Thí dụ: khi nghiên cứu về mức độ giàu nghèo của một vùng nghiên cứu có 4 huyện [4 phân lớp], mỗi huyện có số hộ gia đình khác nhau được biết trong Bảng bên dưới.

Người nghiên cứu muốn thực hiện 200 cuộc phỏng vấn hộ gia đình trong vùng nghiên cứu, như vậy cỡ mẫu của mỗi huyện sẽ được tính theo tỷ lệ phần trăm trong Bảng  như sau:

Bảng 1. Thí dụ về cách chọn mẫu phân lớp

Huyện Số hộ trong mỗi lớp Tỷ lệ hộ trong mỗi lớp [%] Cỡ mẫu phỏng vấn ỡ mỗi lớp
A 250 25 50
B 150 15 30
C 400 40 80
D 200 20 40
1000 100 200

Nếu như số hộ của 4 huyện gần như nhau, người nghiên cứu chỉ cần chọn 50 cuộc phỏng vấn trong mỗi huyện và sau đó chọn mẫu ngẫu nhiên trong mỗi lớp.

Cũng trong nghiên cứu trên, nếu người nghiên cứu không phân chia các huyện ra thành các lớp, thì phương pháp lấy mẫu ngẫu nhiên phỏng vấn hộ gia đình trong vùng nghiên cứu sẽ sai và số liệu thu thập sẽ không đại diện cho vùng nghiên cứu, do mẫu có thể tập trung ở một huyện nào đó.

Một số nghiên cứu thường được chia lớp trong quần thể mục tiêu gồm:

  • Phân lớp quần thể mục tiêu là các thành phố, tỉnh, huyện;
  • phân lớp theo vùng sinh thái khác nhau;
  • phân lớp quần thể mục tiêu là các hộ gia đình theo mức độ giàu nghèo, trình độ học vấn, …;

Trong phương pháp chọn mẫu phân lớp, các quần thể phụ là các vùng chia phụ hay các lô được chia trong Hình 2 khi đã xác định các yếu tố như loại đất, dạng đời sống thực vật hoặc dạng địa hình, … Các điểm được chọn ngẫu nhiên trong mỗi vùng phụ được thể hiện trong Hình 2.

Hình 2 Phương pháp chọn mẫu phân lớp

– Chọn mẫu hệ thống [systematic samples]

Đôi khi cách chọn đơn vị mẫu ngẫu nhiên không tốt hơn cách chọn mẫu hệ thống. Trong chọn mẫu hệ thống, cỡ mẫu n được chọn [có phương pháp tính xác suất tương tự] từ một quần thể N. Cách lấy mẫu hệ thống là khung mẫu giống như là 1 “hàng” của các đơn vị mẫu, và mẫu như là một chuổi liên tiếp của các điểm số có khoảng cách bằng nhau theo hàng dọc.

Thí dụ chọn mẫu hệ thống như sau: muốn nghiên cứu 1 thành viên trong mỗi nhóm có 10 cá thể, quần thể có 10 nhóm [tổng cá thể của quần thể là 100], đánh số cá thể từ 1-100. Lúc này nhóm 1 được đánh số từ 1-10; nhóm 2 từ 11-20; nhóm 3 từ 21-30; …nhóm 10 từ 91-100.

Trước tiên cần sắp xếp thứ tự các đơn vị mẫu [thí dụ theo thứ tự gia tăng trong trường hợp này]. Sau đó chọn điểm đầu tiên bất kỳ có giá trị < 10 [thí dụ chọn ngẫu nhiên một số trong khoảng từ 1-10 là 7. Số cá thể tiếp theo sẽ cộng thêm là 10. Như vậy các thành viên được chọn sẽ có số thứ tự là 7, 17, 27, 37, 47,… 97.

Nhóm 1:

  1. 93535459
  2. 93781078
  3. 93732085
  4. 93763450
  5. 93763450
  6. 94407382
  7. 94409687

Chủ Đề