Lấy danh sách các từ dừng (không phải từ khóa) từ đây, anh chàng thậm chí đã định dạng chúng bằng php cho bạn. http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/
Sau đó, chỉ cần thực hiện một preg_replace trên chuỗi bạn đang lập chỉ mục.
Những gì tôi đã làm trước đây là xóa các hậu tố như 's', 'ed', v.v. bằng regex và sử dụng cùng một regex trên chuỗi tìm kiếm. Nó không phải là lý tưởng mặc dù. Đây là một trang web cơ bản chỉ có 200 trang.
Nếu bạn lo lắng về hiệu suất, bạn có thể muốn xem xét sử dụng một công cụ tìm kiếm như Lucine (solr) thay vì cơ sở dữ liệu. Điều này sẽ làm cho việc lập chỉ mục dễ dàng hơn nhiều. Bạn không muốn phát minh lại bánh xe ở đây.