Bạn muốn có «Trình kết nối MongoDB cho Hadoop» . ví dụ .
Thật hấp dẫn khi chỉ thêm mã trong Bộ giảm tốc của bạn, như một tác dụng phụ, chèn dữ liệu vào cơ sở dữ liệu của bạn. Tránh cám dỗ này. Một lý do để sử dụng trình kết nối thay vì chỉ chèn dữ liệu như một tác dụng phụ của lớp trình giảm của bạn là thực thi suy đoán:Hadoop đôi khi có thể chạy song song hai trong số các tác vụ giảm giống hệt nhau, điều này có thể dẫn đến chèn không liên quan và dữ liệu trùng lặp.