Nếu bạn muốn sửa đổi (xóa bản ghi) nguồn dữ liệu thực tế, tức là các bảng trong postgres thì Spark không phải là một cách tuyệt vời. Bạn có thể sử dụng trực tiếp ứng dụng khách jdbc để đạt được điều tương tự.
Nếu bạn vẫn muốn thực hiện việc này (theo cách bị phân tán dựa trên một số manh mối mà bạn đang tính toán như một phần của khung dữ liệu); bạn có thể có cùng một mã ứng dụng jdbc được viết tương ứng với khung dữ liệu có thông tin logic / kích hoạt để xóa bản ghi và chúng tôi có thể thực thi song song trên nhiều nhân viên.