có một bộ lọc cho các tệp .htm và .html.
để xem bạn đã cài đặt bộ lọc hay chưa, hãy chạy sql này:
SELECT * FROM sys.fulltext_document_types
bạn sẽ thấy:
.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation
.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation
vì vậy, nếu bạn có thể chuyển đổi cột bài viết của mình thành varbinary (max), thì bạn có thể thêm chỉ mục văn bản đầy đủ vào đó và chỉ định loại tài liệu là '.html'
khi chỉ mục đã được điền, bạn có thể xác minh các từ khóa bằng cách sử dụng sql này:
SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table'))