Tại sao trình kết nối Spark Mongo không đẩy bộ lọc xuống?

Nó không phải là GreaterThan đang gây ra sự cố của bạn, thực tế là bộ lọc nằm trên một trường lồng nhau. Bộ lọc của bạn trên doc_type hoạt động vì nó không được lồng vào nhau. Đây, rõ ràng là một vấn đề với động cơ Catalyst trong Spark, không phải đầu nối Mongo. Nó ảnh hưởng đến việc đẩy xuống vị từ trong, ví dụ:Parquet.

Xem các cuộc thảo luận sau trong Spark Jira để biết thêm chi tiết.

Spark 19638

Spark 17636