MongoDB
 sql >> Cơ Sở Dữ Liệu >  >> NoSQL >> MongoDB

Làm cách nào để xóa các tweet trống bằng filter () trong pyspark?

Nếu dữ liệu của bạn như thế này

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

bạn có thể sử dụng len(x) làm điều kiện bộ lọc:

tweets.filter(lambda x: len(x) > 0).count()



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Xóa các đối tượng Javascript lớn khi quá trình sắp hết bộ nhớ

  2. mô hình mongoose .js mà không xuất, yêu cầu trong thư mục bao phấn vẫn hoạt động nó giản đồ

  3. Mongoose chọn các trường phụ

  4. JSONObject tới tài liệu

  5. Hiệu suất tăng khi sử dụng UUID thay vì biểu diễn chuỗi của nó là _id trên MongoDB?