R-001 Giới thiệu ngôn ngữ R
1. R là gì?
R là một ngôn ngữ lập trình dùng cho tính toán thống kê và đồ họa. R được phát triển bởi hai nhà thống kê Robert Gentleman và Ross Ihaka, tên gọi R xuất phát từ việc lấy chữ cái đầu của tên hai tác giả.
Trước đây để thực hiện thống kê, hầu như những nhà thống kê học phải sử dụng những phần mềm đắt tiền như SPSS, SAS, STATA, EXCEL hay MINITAB. Với sự xuất hiện R, phân tích thống kê đang dần chuyển sang trang mới với định hướng mở, dành cho tất cả mọi người. Dù R miễn phí nhưng R rất mạnh và khả năng mở rộng cao phù hợp cho con đường thống kê chuyên nghiệp.
R có nền tảng thư viện đồ họa thống kê rất mạnh. Trong tất cả các ngôn ngữ lập trình mà mình từng sử dụng hổ trợ visualize mạnh như python (seaborn, matplotlib, bokeh,…) hay scilab (tương tự matlab) thì mình thấy R có hệ thống thư viện đồ họa bắt mắt nhất.
2. Vì sao nên học R:
- R thích hợp cho các nhà thống kê học từ nhiều lĩnh vực khác nhau. Không yêu cầu kiến thức nền tảng khoa học máy tính.
- R dể học và là một ngôn ngữ thú vị.
- R cung cấp rất nhiều thư viện để tạo một bài báo cáo khoa học chuyên nghiệp.
- Lượng công việc liên quan đến khoa học dữ liệu (Data Science) trong thời gian sắp tới là rất lớn :D
3. Nguồn tham khảo bắt đầu học R:
- Giới thiệu R của GS. Nguyễn Văn Tuấn: Intro_to_R_Vietnamese.pdf
- Tidyverse - gói thư viện cho khoa học dữ liệu với R: Tidyverse
- ggplot2 cheatsheet dành cho vẽ biểu đồ thống kê: ggplot2
- Các khóa học trên DataCamp: https://www.datacamp.com/
- R-bloggers: https://www.r-bloggers.com/
…và tất nhiên không thể thiếu https://thetalog.com :D