Ý tưởng là bạn cải thiện hiệu suất của các truy vấn tổng hợp bằng cách sử dụng MapReduce trên cơ sở dữ liệu phân đoạn được phân phối trên nhiều máy.
Tôi đã thực hiện một số so sánh về hiệu suất của Mapreduce của Mongo với câu lệnh từng nhóm trong Oracle trên cùng một máy. Tôi thấy rằng Mongo chậm hơn khoảng 25 lần. Điều này có nghĩa là tôi phải chia nhỏ dữ liệu trên ít nhất 25 máy để có được hiệu suất tương tự với Mongo như Oracle cung cấp trên một máy. Tôi đã sử dụng một bộ sưu tập / bảng với khoảng 14 triệu tài liệu / hàng.
Xuất dữ liệu từ mongo qua mongoexport.exe và sử dụng dữ liệu đã xuất dưới dạng bảng bên ngoài trong Oracle và thực hiện từng nhóm trong Oracle nhanh hơn nhiều so với sử dụng MapReduce của chính Mongo.