Giống như bạn nói, DBStorage
chỉ hỗ trợ lưu kết quả vào cơ sở dữ liệu.
Để tải dữ liệu từ MySQL, bạn có thể xem xét một dự án có tên sqoop (sao chép dữ liệu từ cơ sở dữ liệu sang HDFS) hoặc bạn có thể thực hiện kết xuất mysql và sau đó sao chép tệp vào HDFS. Cả hai cách đều yêu cầu một số tương tác và không thể sử dụng trực tiếp từ bên trong Pig.
Tùy chọn thứ ba sẽ là xem xét việc viết một Pig LoadFunc (bạn nói rằng bạn đã cố gắng viết một UDF). Nó sẽ không quá khó, bạn sẽ cần phải vượt qua nhiều tùy chọn giống như DBStorage (trình điều khiển, thông tin đăng nhập kết nối và truy vấn SQL để thực thi) và bạn có thể sử dụng một số kiểm tra siêu dữ liệu tập kết quả để tự động tạo một lược đồ.