Tài liệu về RMySQL khá tốt - nhưng nó cho rằng bạn biết những điều cơ bản về SQL. Đây là:
- tạo cơ sở dữ liệu
- tạo một bảng
- đưa dữ liệu vào bảng
- đưa dữ liệu ra khỏi bảng
Bước 1 rất dễ dàng:trong bảng điều khiển MySQL, chỉ cần "tạo cơ sở dữ liệu DBNAME". Hoặc từ dòng lệnh, sử dụng mysqladmin hoặc thường có GUI quản trị MySQL.
Bước 2 khó hơn một chút, vì bạn phải xác định các trường trong bảng và kiểu của chúng. Điều này sẽ phụ thuộc vào nội dung của tệp CSV (hoặc tệp được phân tách khác) của bạn. Một ví dụ đơn giản sẽ giống như sau:
use DBNAME;
create table mydata(
id INT(11) NOT NULL AUTO_INCREMENT PRIMARY KEY,
height FLOAT(3,2)
);
Có nội dung là tạo bảng có 2 trường: id , sẽ là khóa chính (vì vậy phải là duy nhất) và sẽ tự động bổ sung khi các bản ghi mới được thêm vào; và chiều cao , ở đây được chỉ định dưới dạng số thực (kiểu số), với tổng 3 chữ số và 2 sau dấu thập phân ( ví dụ: 100,27). Điều quan trọng là bạn phải hiểu các loại dữ liệu .
Bước 3 - có nhiều cách khác nhau để nhập dữ liệu vào bảng. Một trong những cách dễ nhất là sử dụng mysqlimport tính thiết thực. Trong ví dụ trên, giả sử rằng dữ liệu của bạn nằm trong một tệp có cùng tên với bảng (mydata), cột đầu tiên là ký tự tab và cột thứ hai là biến chiều cao (không có hàng tiêu đề), điều này sẽ hoạt động:
mysqlimport -u DBUSERNAME -pDBPASSWORD DBNAME mydata
Bước 4 - yêu cầu bạn biết cách chạy các truy vấn MySQL. Một lần nữa, một ví dụ đơn giản:
select * from mydata where height > 50;
Có nghĩa là "tìm nạp tất cả các hàng (id + chiều cao) từ mydata của bảng trong đó chiều cao lớn hơn 50".
Khi bạn đã thành thạo những điều cơ bản đó, bạn có thể chuyển sang các ví dụ phức tạp hơn, chẳng hạn như tạo 2 hoặc nhiều bảng và chạy các truy vấn kết hợp dữ liệu từ mỗi bảng.
Sau đó - bạn có thể chuyển sang hướng dẫn sử dụng RMySQL. Trong RMySQL, bạn thiết lập kết nối cơ sở dữ liệu, sau đó sử dụng cú pháp truy vấn SQL để trả về các hàng từ bảng dưới dạng khung dữ liệu. Vì vậy, điều quan trọng là bạn phải nắm được phần SQL - phần RMySQL thật dễ dàng.
Có rất nhiều hướng dẫn về MySQL và SQL trên web, bao gồm "chính thức" hướng dẫn tại trang web MySQL. Chỉ cần tìm kiếm "hướng dẫn mysql" trên Google.
Cá nhân tôi không coi 80 Mb là một tập dữ liệu lớn; Tôi ngạc nhiên rằng điều này đang gây ra sự cố RAM và tôi chắc chắn rằng các hàm R nguyên bản có thể xử lý nó khá dễ dàng. Nhưng thật tốt khi học kỹ năng mới như SQL, ngay cả khi bạn không cần chúng cho vấn đề này.