Hướng dẫn khai căn trên phần mềm r
Khai báo đối tượng dạng vector. Trong đó, hàm c(concatenate), được sử dụng để gán vector cho đối tượng
Show
Lệnh cơ bản với đối tượng (objects) và hàm (functions)Khai báo đối tượng dạng bảng. Trong đó, hàm data.frame, được sử dụng để gán bảng cho đối tượng
Lệnh cơ bản với đối tượng (objects) và hàm (functions)Bạn đọc có thể tạo ra một hàm riêng bằng cách sử dụng những phép toán và hàm đã có bằng hàm function
Nhập dữ liệu từ các tập tin có định dạng khác nhauBạn cũng có thể nhập dữ liệu từ nhiều nguồn khác nhau: (.txt), (.csv), (.xlsx), (.sav), (.rda) Trong trường hợp dữ liệu được lưu bằng phần mềm Excel có định dạng là .xls hay .xlsx, bạn đọc nên chuyển định dạng trên thành định dạng .csv (Comma delimited) như sau:
Nhập dữ liệu từ Excel (.csv)Bạn đọc nhập tập dữ liệu có định dạng .csv vào R bằng cách sử dụng hàm read.csv.
Trực quan hóa dữ liệuĐiểm mạnh tuyệt đối của R là khả năng trực quan hóa dữ liệu. Trong đó, một số các biểu đồ thông dụng:
Trực quan hóa dữ liệuBiểu đồ thanh (bar chart)
0
1 Trực quan hóa dữ liệuBiểu đồ thanh (bar chart)
2 Trực quan hóa dữ liệuBiểu đồ thanh (bar chart) Trực quan hóa dữ liệuBiểu đồ tròn (pie chart)
3 Trực quan hóa dữ liệuBiểu đồ tròn (pie chart) Trực quan hóa dữ liệuBiểu đồ hộp (box plot)
4 Trực quan hóa dữ liệuBiểu đồ hộp (box plot) Trực quan hóa dữ liệuBiểu đồ hộp (box plots) Trực quan hóa dữ liệuBiểu đồ Sunbrust Thống kê ứng dụngR tồn tại để thực hiện các bài toán thống kê ứng dụng. Một số nội dung cơ bản bao gồm:
Thống kê mô tảMục đính là mô tả, tóm tắt và hiểu được khuynh hướng tập trung và phân tán của tập dữ liệu. Ví dụ như:
5
6 Thống kê mô tảBảng tóm tắt các đại lượng thống kê mô tả cho biến Score của tập dữ liệu “data”:
7 Kiểm định giả thuyết thống kêMục đính là kểm định giả thuyết có hay không sự khác biệt một cách có ý nghĩa của tham số tổng thế: trung bình, phương sai, tỷ lệ…. Vi dụ: Người quản lý nhân sự muốn kiểm định có hay không mối liên hệ giữa kết quả học tập và mức độ hiệu quả trong việc hoàn thành các nhiệm vụ được giao. Có 3 mức độ để phân loại kết quả học tập “excellence”, “good” và “pass” đánh giá hiệu quả làm việc theo 4 mức độ “A.plus”, “A”, “B”, “C”. Dữ liệu được thu thập bằng cách khảo sát 98 nhân viên.
8 Kiểm định giả thuyết thống kê
9
8 Kiểm định giả thuyết thống kê
1
2 Phân tích hồi quyPhân tích hồi quy là tìm hiểu mối liên hệ (dự báo) giữa một biến phụ thuộc (response variable) với một hoặc nhiều biến độc lập (independent variable) hay còn gọi là biến giải thích (explanatory variable).
3
4 Phân tích hồi quyPhương trình hồi quy: response = 55.7410 + 2.1624 × indepenA + 1.5685 × indepenB
5
6 Những ứng dụng khácCó quá nhiều các ứng dụng trong R, ví dụ như: Phương pháp Six Sigma, Khai thác văn bản, Machine learning, vv… |