Đánh giá hệ số r bình phương

Đầu tiên, ta thu thập số liệu của y và x thông qua khảo sát một nhóm người. Ta số liệu thu thập được:

-Người ---Cholesterol -- Độ tuổi- 1 3.5 46 2 1.9 20 ... ... ... 30 4.0 50

  • Tiếp theo ta chạy số liệu theo một mô hình có dạng: y = a + bx trong một phần mềm thống kê (SPSS, Eviews, Stata...)
  • Ta có kết quả của hệ số a và b. Dấu và giá trị của b sẽ nói lên biến x có tác động thế nào đến biến y.
  • Một hệ số quan trọng nữa cần lưu ý là R2 hay còn được biết đến với nhiều tên gọi như: R squared / R bình phương / coefficient of determination / hệ số xác định bội / goodness of fit statistics
  • R2 có giá trị từ 0 đến 1 Giả sử: R2 có giá trị là 0.88. Điều này có nghĩa là: Mô hình y = a + bx nói trên giải thích khoảng 88% các khác biệt về nồng độ cholesterol giữa các cá nhân. Giá trị R2 càng cao là một dấu hiệu cho thấy mối liên hệ giữa biến độ tuổi và biến nồng độ cholesterol càng chặt chẽ.

Hệ số xác định (coefficient of determination) thường ký hiệu là R2, một con số thống kê tổng hợp khả năng giải thích của một phương trình. Nó biểu thị tỷ lệ biến thiên của biến phụ thuộc do tổng mức biến thiên của các biến giải thích gây ra và được tính bằng công thức:

Trong đó là tổng các bình phương của phần dư và là tổng các bình phương của biến độc lập. Như vậy, R2 phải nằm giữa 0 và 1. Khi R2 càng gần 0, khả năng giải thích càng kém và điều ngược lại sẽ đúng khi các giá trị của nó tiến dần tới 1.

(Tài liệu tham khảo: Nguyễn Văn Ngọc, Từ điển Kinh tế học, Đại học Kinh tế Quốc dân)

Sau đây là một ví dụ cụ thể:

Giả sử cần phân tích mối quan hệ giữa biến y là nồng độ cholesterol trong máu và biến x là độ tuổi.

Đầu tiên, ta thu thập số liệu của y và x thông qua khảo sát một nhóm người. Ta số liệu thu thập được:

Tiếp theo ta chạy số liệu theo một mô hình có dạng: y = a + bx trong một phần mềm thống kê (SPSS, Eviews, Stata...)

Ta có kết quả của hệ số a và b. Dấu và giá trị của b sẽ nói lên biến x có tác động thế nào đến biến y.

Một hệ số quan trọng nữa cần lưu ý là R2 hay còn được biết đến với nhiều tên gọi như: R squared / R bình phương / coefficient of determination / hệ số xác định bội / goodness of fit statistics

Giả sử: R2 có giá trị là 0.88. Điều này có nghĩa là: Mô hình y = a + bx nói trên giải thích khoảng 88% các khác biệt về nồng độ cholesterol giữa các cá nhân. Giá trị R2 càng cao thì có thể kết luận mối liên hệ giữa biến độ tuổi và biến nồng độ cholesterol càng chặt chẽ.

R square là một thuật ngữ không còn xa lạ. Tuy nhiên, nhiều người lại chưa thực sự hiểu về thuật ngữ này. Vậy r square là gì và nó có ý nghĩa thế nào trong kinh tế lượng? Tất cả những thắc mắc đó sẽ được giải đáp dưới đây. Hãy cùng DINHNGHIA.VN tìm hiểu nhé!

R square là gì? Ý nghĩa của r square

Khái niệm r square

R square hay còn được biết tới với cách viết r squared và r bình phương. Vậy r square là gì? Hay nói cách khác, r bình phương là gì? Đây là một thước đo được sử dụng trong thống kê và nó cho chúng ta biết mức độ phù hợp của mô hình nghiên cứu với ý nghĩa là các nhân tố (hay còn gọi là các biến). Đồng thời, hệ số này giải thích nhân tố phụ thuộc đó đạt bao nhiêu phần trăm trong quá trình nghiên cứu.

Ý nghĩa của r square

R square hay r bình phương được sử dụng nhiều trong kinh tế lượng. Vậy ý nghĩa của r bình phương trong kinh tế lượng là gì? R bình phương được sử dụng trong thống kê và được thực hiện bởi phương pháp gọi là hồi quy tuyến tính.

  • R bình phương cho biết mô hình đó hợp với dữ liệu ở mức bao nhiêu %.

Ví dụ: r bình phương = 0,65. Vậy mô hình hồi quy tuyến tính đang được thống kê sẽ phù hợp với dữ liệu (hoặc biến) ở mức 65%.

  • R bình phương cũng cho biết độ phù hợp của mô hình, người ta nghiên cứu được rằng, với r bình phương > 50% thì một mô hình được đánh giá là phù hợp.

Tất nhiên, không phải tất cả các mô hình đều phải có r bình phương > 50%, ta có thể loại trừ một số mô hình có sự biến động lớn như giá vàng hay giá cổ phiếu…

  • Đặc biệt, giá trị r2 càng cao thì mối quan hệ giữa nhân tố độc lập (biến độc lập) và nhân tố phụ thuộc càng chặt chẽ. Vì thế mà r bình phương còn được biết tới với cái tên hệ số tương quan r bình phương.

Qua đó có thể thấy ý nghĩa hệ số xác định r2 là vô cùng quan trọng trong thống kê và nghiên cứu, đặc biệt là trong phương pháp hồi quy tuyến tính.

Đánh giá hệ số r bình phương

Công thức tính r square

Sau khi đã biết r square là gì và nó có ý nghĩa như thế nào, chúng ta cùng tìm hiểu đến công thức tính hệ số này.

Hiện nay, công thức tính hệ số tương quan r2 đang được sử dụng như sau:

\(R^{2} = 1 – \frac{ESS}{TSS}\)

Trong đó:

  • ESS là viết tắt của Residual Sum of Squares, tức là tổng các độ lệch bình phương của phần dư.
  • TSS là viết tắt của Total Sum of Squares, tức là tổng độ lệch bình phương của toàn bộ các nhân tố nghiên cứu.

Từ công thức này, có thể thấy R sẽ trong khoảng từ 0 đến 1. Trong khi tính ESS ta cũng cần lưu ý multiple r. Vậy multiple r là gì? Multiple r là viết tắt của multiple regression. Đây là hệ số tương quan hồi quy nhiều lần gắn liền mật thiết với r square.

Chỉ số này cho phép bạn kiểm tra xem việc đưa thêm một biến vào mô hình có còn được hay không; đồng thời nó còn có khả năng loại trừ ảnh hưởng của một số biến. Khi chạy SPSS – một phần mềm thống kê phổ biến hiện nay, bạn cần hết sức lưu ý chỉ số này.

Hệ số r bình phương hiệu chỉnh

Bên cạnh r bình phương, r bình phương hiệu chỉnh cũng là một khái niệm không thể bỏ qua. Đây là một hệ số được sử dụng để hạn chế những nhược điểm của r bình phương.

Công thức tính r bình phương hiệu chỉnh

\(R_{hc}^{2} = 1 – \frac{ESS/(n-k)}{TSS/(n-1)}\)

Sau khi biến đổi ta được: \(R_{hc}{2} = 1 – \frac{n-1}{n-k}(1-R{2})\)

Trong đó:

  • n là số lượng mẫu quan sát.
  • k tham số của mô hình (bằng lượng biến độc lập cộng thêm 1)

Ý nghĩa của r2 hiệu chỉnh

Hạn chế nổi bật nhất của r square là việc giảm tính chính xác của mô hình khi ta thêm một tham số trong quá trình tính toán. Vì vậy, r bình phương hiệu chỉnh được nghiên cứu giúp khắc phục nhược điểm của r bình phương thông thường. Hệ số này cho phép ta đo độ thích hợp khi ta thêm một tham số nữa. Qua đó giúp giảm sự phức tạp của mô hình.

Vậy r square là gì? Công thức tính r square thế nào và ý nghĩa của nó ra sao? Chắc hẳn bạn đã có câu trả lời cho riêng mình thông qua bài viết r square là gì. Đây là một hệ số quan trọng trong tính toán và thống kê, vì thế việc hiểu rõ nó sẽ giúp quá trình thống kê của bạn đơn giản hơn rất nhiều.