Đơn giản, bạn đã tạo một khung dữ liệu là một quy định về công việc cần thực hiện, nhưng bạn chưa thực hiện nó. Để thực thi, bạn cần gọi .compute()
về kết quả.
Lưu ý rằng đầu ra ở đây không thực sự là khung dữ liệu, mỗi phân vùng đánh giá là None
(bởi vì to_sql
không có đầu ra), vì vậy có thể rõ ràng hơn khi diễn đạt điều này bằng df.to_delayed
, một cái gì đó giống như
dto_sql = dask.delayed(pd.DataFrame.to_sql)
out = [dto_sql(d, 'table_name', db_url, if_exists='append', index=True)
for d in ddf.to_delayed()]
dask.compute(*out)
Cũng lưu ý rằng việc bạn có được tính song song tốt hay không sẽ phụ thuộc vào trình điều khiển cơ sở dữ liệu và bản thân hệ thống dữ liệu.