PostgreSQL
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> PostgreSQL

Tạo bảng sql từ khung dữ liệu dask bằng map_partitions và pd.df.to_sql

Đơn giản, bạn đã tạo một khung dữ liệu là một quy định về công việc cần thực hiện, nhưng bạn chưa thực hiện nó. Để thực thi, bạn cần gọi .compute() về kết quả.

Lưu ý rằng đầu ra ở đây không thực sự là khung dữ liệu, mỗi phân vùng đánh giá là None (bởi vì to_sql không có đầu ra), vì vậy có thể rõ ràng hơn khi diễn đạt điều này bằng df.to_delayed , một cái gì đó giống như

dto_sql = dask.delayed(pd.DataFrame.to_sql)
out = [dto_sql(d, 'table_name', db_url, if_exists='append', index=True)
       for d in ddf.to_delayed()]
dask.compute(*out)

Cũng lưu ý rằng việc bạn có được tính song song tốt hay không sẽ phụ thuộc vào trình điều khiển cơ sở dữ liệu và bản thân hệ thống dữ liệu.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. PostgreSQL:Loại dữ liệu nào nên được sử dụng cho Tiền tệ?

  2. Khai báo biến kiểu kết hợp trong PostgreSQL bằng cách sử dụng% TYPE

  3. Truy vấn Postgresql bằng Hibernate (JPA) không tìm thấy bảng

  4. Làm cách nào để bạn thêm Trình điều khiển PostgreSQL làm phụ thuộc trong Maven?

  5. Sắp xếp các giá trị cột riêng biệt theo (giá trị đầu tiên của) cột khác trong hàm tổng hợp