Bạn đã có ý tưởng đúng, chắc chắn; bạn có thể lấy ngày giờ gần đây nhất từ cơ sở dữ liệu và chỉ chèn các mục mới hơn hoặc (nếu bạn muốn thực sự hoàn chỉnh) lấy mọi thứ từ cơ sở dữ liệu, so sánh với mọi thứ trong nguồn cấp dữ liệu và chỉ chèn các mục không khớp với một cái gì đó đã có trong cơ sở dữ liệu. Nhưng nếu bạn thực sự muốn CHÈN chỉ để chèn dữ liệu mới, như ngụ ý trong tiêu đề câu hỏi của bạn, thì hãy INSERT IGNORE
là cách để đi và chắc chắn là cách triển khai đơn giản nhất. Trừ khi bạn lo lắng về lượng lưu lượng truy cập trên cơ sở dữ liệu, tôi sẽ gắn bó với nó.