Nó không phải là GreaterThan
đang gây ra sự cố của bạn, thực tế là bộ lọc nằm trên một trường lồng nhau. Bộ lọc của bạn trên doc_type
hoạt động vì nó không được lồng vào nhau. Đây, rõ ràng là một vấn đề với động cơ Catalyst trong Spark, không phải đầu nối Mongo. Nó ảnh hưởng đến việc đẩy xuống vị từ trong, ví dụ:Parquet.
Xem các cuộc thảo luận sau trong Spark Jira để biết thêm chi tiết.