Sqlserver
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Sqlserver

Cách bỏ qua các thẻ html trong Sql Server 2008 Full Text Search

có một bộ lọc cho các tệp .htm và .html.

để xem bạn đã cài đặt bộ lọc hay chưa, hãy chạy sql này:

SELECT * FROM sys.fulltext_document_types

bạn sẽ thấy:

.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

vì vậy, nếu bạn có thể chuyển đổi cột bài viết của mình thành varbinary (max), thì bạn có thể thêm chỉ mục văn bản đầy đủ vào đó và chỉ định loại tài liệu là '.html'

khi chỉ mục đã được điền, bạn có thể xác minh các từ khóa bằng cách sử dụng sql này:

SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table')) 


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Cập nhật SQL với row_number ()

  2. Nhận ngày đầu tiên trong tuần trong SQL Server

  3. Vấn đề về hiệu suất kỳ lạ:Biểu thức bảng phổ biến trong hàm nội tuyến do người dùng xác định

  4. Làm cách nào để thay đổi cột được tính toán này trong SQL Server 2008?

  5. Cách tính tuổi (theo năm) dựa trên Ngày sinh và getDate ()