Cách so sánh phương sai và độ lệch chuẩn

Độ lệch chuẩn, hay độ lệch tiêu chuẩn (Tiếng Anh: standard deviation) là một đại lượng thống kê mô tả dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai.

Khi hai tập dữ liệu có cùng giá trị trung bình cộng, tập nào có độ lệch chuẩn lớn hơn là tập có dữ liệu biến thiên nhiều hơn. Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau, thì việc so sánh độ lệch chuẩn của chúng không có ý nghĩa.

Độ lệch chuẩn còn được sử dụng khi tính sai số chuẩn. Khi lấy độ lệch chuẩn chia cho căn bậc hai của số lượng quan sát trong tập dữ liệu, sẽ có giá trị của sai số chuẩn.

Cách so sánh phương sai và độ lệch chuẩn
Độ lệch chuẩn phản ánh sự phân tán của dữ liệu so với giá trị trung bình

Khái niệm độ lệch chuẩn[sửa | sửa mã nguồn]

Độ lệch chuẩn, hay độ lệch tiêu chuẩn (Standard Deviation) là một đại lượng thống kê dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai. Khi hai tập dữ liệu có cùng giá trị trung bình cộng, tập nào có độ lệch chuẩn lớn hơn là tập có dữ liệu biến thiên nhiều hơn. Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau, thì việc so sánh độ lệch chuẩn của chúng không có ý nghĩa. Độ lệch chuẩn còn được sử dụng khi tính sai số chuẩn. Khi lấy độ lệch chuẩn chia cho căn bậc hai của số lượng quan sát trong tập dữ liệu, sẽ có giá trị của sai số chuẩn.

Công thức tính độ lệch chuẩn (S.D)[sửa | sửa mã nguồn]

Độ lệch chuẩn là căn bậc hai của phương sai. Do đó, công thức của độ lệch chuẩn của tổng thể / quần thể là:

Trong đó σ là độ lệch chuẩn của tổng thể / quần thể, μ là trung bình của tổng thể / quần thể. là phần tử thứ i của tổng thể / quần thể, và N là số thành phần của tổng thể / quần thể.

Tương tự, độ lệch chuẩn của mẫu được tính bằng công thức:

Trong đó, s là độ lệch chuẩn của mẫu, là trung bình của mẫu, là thành phần thứ i của mẫu, và n là tổng số thành phần của mẫu.

Ta cần phân biệt rõ 2 ký hiệu:

  • σ: Dùng khi nói về quần thể
  • s: Dùng khi nói về mẫu

Ý nghĩa của độ lệch chuẩn[sửa | sửa mã nguồn]

Độ lệch chuẩn đo tính biến động của giá trị mang tính thống kê. Nó cho thấy sự chênh lệch về giá trị của từng thời điểm đánh giá so với giá trị trung bình. Tính biến động cũng như độ lệch chuẩn sẽ cao hơn nếu giá đóng cửa và giá đóng cửa trên trung bình khác nhau đáng kể. Nếu sự chênh lệch không đáng kể thì độ lệch chuẩn và tính biến động ở mức thấp. Sự đảo chiều xu thế tạo các vùng đáy hoặc đỉnh của thị trường được xác định thời cơ bằng các mức độ biến động cao. Những xu thế mới của giá sau thời kỳ thoái trào của thị trường (tức là giai đoạn điều chỉnh) thường được xác định thời cơ bằng những mức độ biến động thấp. Sự thay đổi đáng kể về dữ liệu giá đem lại giá trị độ lệch chuẩn cao và dữ liệu giá ổn định hình thành độ lệch chuẩn ở mức thấp.

Xem thêm[sửa | sửa mã nguồn]

  • Phương sai
  • Hệ số biến thiên
  • Sai số chuẩn

Tham khảo[sửa | sửa mã nguồn]

Thống kê ứng dụng trong kinh tế – xã hội. Hoàng Trọng và Chu Nguyễn Mộng Ngọc. Nhà xuất bản Thống kê. Năm 2008.

Xét biến `X` của hai tổng thể có phương sai `sigma_1^2` và `sigma_2^2`. Lấy từ hai tổng thể ấy hai mẫu có kích thước là `n_1` và `n_2`. Sau khi đo lường và tính toán trên hai mẫu ấy, ta có phương sai của `X` là `s_1^2` và `s_2^2`.

Thông thường, chúng ta muốn so sánh phương sai của hai tổng thể với độ tin cậy `1-alpha` (hay mức ý nghĩa `alpha`) cho trước. Như vậy giả thuyết không sẽ là:

Ho : `sigma_1^2/sigma_2^2=1`(21)

Còn giả thuyết đối nghịch Ha thi tùy trường hợp cụ thể mà tỷ số hai phương sai có thể là khác 1, lớn hơn 1 hay bé hơn 1.

Tiêu chuẩn kiểm định cho so sánh hai phương sai là :

Tiêu chuẩn này có phân phối Fisher với các độ tự do `nu_1=n_1-1` và `nu_2=n_2-1`.

Thí dụ

Sổ sách theo dõi hoạt động sản xuất của một xí nghiệp cho thấy độ lệch chuẩn của năng suất của thiết bị A trong 30 ngày làm việc là 40 sản phẩm/ngày, trong khi đó số liệu này của thiết bị B trong 25 ngày làm việc là 32 sản phẩm/ngày. Ta có thể đánh giá thế nào về mức độ ổn định của hai thiết bị này với độ tin cậy 95%.

Để so sánh mức độ ổn định về mặt năng suất của hai thiết bị này, ta đi so sánh phương sai của chúng với cặp giả thuyết sau: