Tôi cho rằng bạn có rất nhiều điểm và cần kết quả nhanh - nếu không, bạn có thể sử dụng hầu hết mọi thứ.
Có vẻ như công việc thu gọn bản đồ đối với tôi
Phần bản đồ sẽ là vòng lặp "cho mỗi điểm không được kiểm tra" và phải phát ra cấu trúc dữ liệu chứa các cụm từ, cụm ứng viên và bất cứ thứ gì khác. Trong trường hợp điểm được phân loại là tiếng ồn, nó sẽ không phát ra gì.
Mở rộng cụm sẽ giảm và có thể hoàn thiện một phần - cũng có thể lựa chọn ngôn ngữ sẽ là javascript và mọi thứ sẽ diễn ra bên trong mongo