MongoDB
 sql >> Cơ Sở Dữ Liệu >  >> NoSQL >> MongoDB

Trình kết nối Spark Mongo, MongoShardedPartitioner không hoạt động

Rất tiếc khi biết bạn đang gặp sự cố với trình kết nối.

Thông tin về trình phân vùng có thể được tìm thấy trên trang web tài liệu về trình kết nối Spark . Vui lòng gửi yêu cầu trong dự án Docs jira nếu bạn cảm thấy thiếu hoặc không rõ ràng bất cứ điều gì, nó thực sự có thể giúp ích cho những người dùng trong tương lai!

Trình phân vùng mặc định là một trình bao bọc mỏng xung quanh MongoSamplePartitioner . Nó chia bộ sưu tập thành các phân vùng có kích thước dựa trên việc lấy mẫu thống kê của bộ sưu tập.

MongoShardedPartitioner sử dụng shardKey để tạo các phân vùng. Theo mặc định, nó sẽ sử dụng _id là chìa khóa. Bạn có thể cần phải định cấu hình giá trị đó.

Lưu ý: Các phân đoạn băm thì không được hỗ trợ bởi MongoShardedPartitioner vì hiện tại không có cách nào để truy vấn một tập hợp đối với giá trị được băm - vì vậy khi truy xuất các phân vùng, nó sẽ không trả lại kết quả. Tôi đã thêm DOCS-12345 để cập nhật tài liệu.

Có vẻ như đã xảy ra sự cố trong quá trình thiết lập của bạn trong đó MongoShardedPartitioner không thể phân vùng bộ sưu tập như mong đợi và trả về 0 kết quả. Suy luận lược đồ sẽ vẫn hoạt động vì nó truy vấn bộ sưu tập như thế nào. Nếu nó không phải là vấn đề cấu hình / mã băm thì sự cố, vui lòng gửi lỗi trong Dự án Spark jira và tôi có thể giúp xác định nguyên nhân và đưa ra giải pháp khắc phục cho bạn.




  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Mongoose - xác thực cú pháp email

  2. Cập nhật hàng loạt mảng tài liệu phụ phù hợp trong Mongodb

  3. Phiên mùa xuân với MongoDB

  4. MongoDB:Hàng tỷ tài liệu trong một bộ sưu tập

  5. MongoDB $ toDecimal