NGUYỄN VĨNH LỢI
Tổng hợp từ NGUỒN: wikipedia.com
Ngôn ngữ R đã trở thành một tiêu chuẩn trên thực tế (de facto) giữa các nhà thống kê cho thấy sự phát triển của phần mềm thống kê, và được sử dụng rộng rãi để phát triển phần mềm thống kê và phân tích dữ liệu.
R là một bộ phận của dự án GNU. Mã nguồn của nó được công bố tự do theo Giấy phép Công cộng GNU, và có các phiên bản dịch sẵn cho nhiều hệ điều hành khác nhau. R sử dụng giao diện dòng lệnh, tuy cũng có một vài giao diện đồ họa người dùng dành cho nó.
Mục lục
• 1 Tính năng
• 2 Ví dụ
• 3 Các mốc quan trọng
• 4 Giao diện
o 4.1 Giao diện đồ họa
Tính năng
R có chứa nhiều loại kỹ thuật thống kê (mô hình hóa tuyến tính và phi tuyến, kiểm thử thống kê cổ điển, phân tích chuỗi thời gian, phân loại, phân nhóm, v.v.) và đồ họa. R, giống như S, được thiết kế xoay quanh một ngôn ngữ máy thực thụ, và nó cho phép người dùng thêm các tính năng bổ sung bằng cách định nghĩa các hàm mới. Cũng có một số khác biệt quan trọng đối với S, nhưng nhiều mã viết bằng S vẫn chạy được mà không cần thay đổi. Nhiều hệ thống trong R được viết bằng chính ngôn ngữ của nó, giúp cho người dùng dễ theo dõi các giải thuật. Để thực hiện công việc chuyên về tính toán, R có thể liên kết được với ngôn ngữ C, C++ và Fortran để có thể được gọi trong khi chạy. Người dùng thông thạo có thể viết mã C để xử lý trực tiếp các đối tượng của R.
R cũng có tính mở rộng cao bằng cách sử dụng các gói cho người dùng đưa lên cho một số chức năng và lĩnh vực nghiên cứu cụ thể. Do được thừa hưởng từ S, R có nền tảng lập trình hướng đối tượng mạnh hơn đa số các ngôn ngữ tính toán thống kê khác. Việc mở rộng R cũng dễ dàng nhờ các luật đóng khối từ vựng.[7]
Một điểm mạnh khác của R là nền tảng đồ họa của nó, có thể tạo ra những đồ thị chất lượng cao cùng các biểu tượng toán học. R cũng có đinh dạng văn bản riêng tương tự như LaTeX, dùng để cung cấp tài liệu hướng dẫn toàn diện, có trực tuyến ở các định dạng khác nhau và cả bản in.
Dù R được dùng chủ yếu bởi những nhà thống kê và những người sử dụng khác đòi hỏi một môi trường tính toán thống kê và phát triển phần mềm, nó cũng có thể dùng làm một công cụ tính toán ma trận tổng quát với các kết quả đo đạc cạnh tranh so với GNU Octave và đối thủ thương mại của nó, MATLAB.[8] Giao diện RWeka[9] đã được thêm vào phần mềm khai phá dữ liệu phổ biến Weka, cho phép đọc/ghi định dạng arff vì vậy cho phép sử dụng tính năng khai phá dữ liệu trong Weka và thống kê trong R.
Ví dụ
Các mốc quan trọng
Một số mốc quan trọng trong quá trình phát triển.
• Phiên bản 0.16 – Đây là bản alpha cuối cùng do Ihaka và Gentleman phát triển. Đa số các tính năng cơ bản trong "Sách Trắng" đã được hiện thực. Danh sách gửi thư bắt đầu vào ngày 1 tháng 4 năm 1997.
• Phiên bản 0.49 – 23 tháng 4, 1997 – Đây là bản phát hành mã nguồn cũ nhất, và dịch trên một số hệ điều hành tương tự Unix. CRAN được bắt đầu vào ngày này, với 3 trang gương ban đầu chứa 12 gói. Phiên bản alpha của R dành cho Microsoft Windows và Mac OS đã được đưa lên một thời gian ngắn sau phiên bản này.
• Phiên bản 0.60 – 5 tháng 12, 1997 – R trở thành một phần chính thức của Dự án GNU. Mã nguồn được lưu giữ và bảo trì trên CVS.
• Phiên bản 1.0.0 – 29 tháng 2, 2000 – Được các nhà phát triển xem là đủ ổn định để sử dụng đại trà[10].
• Phiên bản 1.4.0 – Các phương thức S4 được giới thiệu và phiên bản đầu tiên dành cho Mac OS X được phát hành ngay sau đó.
• Phiên bản 2.0.0 – Giới thiệu lazy loading, cho phép tải nhanh dữ liệu mà ít tốn bộ nhớ.
• Phiên bản 2.1.0 – Hỗ trợ mã hóa UTF-8, và bắt đầu quốc tế hóa và bản địa hóa cho các ngôn ngữ khác nhau.
• Phiên bản 2.9.0 – Gói 'Matrix' giờ là gói đề nghị chứa trong bản phân phối R cơ bản.
Giao diện
Giao diện đồ họa
• R Studio - Môi trường phát triển tích hợp đa nền tảng, (có thể chạy trên một máy linux từ xa)
• Deducer - Giao diện hướng - menu
• Java GUI for R ( JGR) - trình biên tập và terminal R viết trên Java
• Rattle GUI - giao diện dựa trên RGtk2, thiết kế riêng cho Khai thác dữ liệu
• R Commander
• Revolution Analytics -
• RGUI
• RKWard
• RWeka - hỗ trợ tính năng khai thác dữ liệu trong Weka và phân tích thống kê trong R
---------------------------------------------------------------------------------------------------------------------------
Tham khảo thêm: bài viết của 2 tác giả Bùi Quang Hà và Nguyễn Trung Kiên R
0 comments :
Post a Comment