PostgreSQL
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> PostgreSQL

Pyspark:Xóa ký tự rỗng UTF khỏi khung dữ liệu pyspark

À đợi đã - tôi nghĩ là tôi có nó. Nếu tôi làm điều gì đó như thế này, nó có vẻ hoạt động:

null = u'\u0000'
new_df = df.withColumn('e', regexp_replace(df['e'], null, ''))

Và sau đó ánh xạ tới tất cả các cột chuỗi:

string_columns = ['d','e']
new_df = df.select(
  *(regexp_replace(col(c), null, '').alias(c) if c in string_columns else c for
    c in df.columns)
  )


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Cách lấy kiểu cơ sở mảng trong postgres thông qua jdbc

  2. 7 cách tìm hàng trùng lặp trong PostgreSQL khi bỏ qua khóa chính

  3. PostgreSQL:từ OID sang Bytea

  4. Nhập dữ liệu CSV vào ứng dụng Rails, sử dụng thứ gì đó khác sau đó là id liên kết

  5. Chuyển đổi thủ tục lưu trữ SQL Server thành thủ tục lưu trữ PostgreSQL