Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Văn bản bằng tiếng Bengali không được hiển thị trong tệp Unicode CSV

Theo câu trả lời cho câu hỏi Excel sang CSV với mã hóa UTF8 , Google Tài liệu phải lưu CSV đúng cách, ngược với Excel, sẽ hủy tất cả các ký tự không thể đại diện trong mã hóa “ANSI” đang được sử dụng. Nhưng có thể họ đã thay đổi điều này, hoặc điều gì đó sai, hoặc phân tích tình hình không chính xác.

Đối với tiếng Bangla (tiếng Bengali) được mã hóa đúng cách được xử lý trong các chương trình MS Office, không cần bất kỳ “phông chữ Bangla” nào, vì phông chữ Arial Unicode MS (đi kèm với Office) có chứa các ký tự Bangla. Vì vậy, có thực sự dữ liệu trong một số mã hóa không tiêu chuẩn dựa trên một phông chữ được mã hóa đặc biệt? Trong trường hợp đó, trước tiên nó nên được chuyển đổi sang Unicode, mặc dù có thể nó có thể được quản lý bằng cách nào đó bằng cách sử dụng các chương trình nhất quán sử dụng phông chữ cụ thể đó.

Trong Excel, khi sử dụng Save As, bạn có thể chọn “Unicode text (* .txt)”. Nó lưu dữ liệu dưới dạng TSV (các giá trị được phân tách bằng tab) trong mã hóa UTF-16. Sau đó, bạn có thể cần phải chuyển đổi nó để sử dụng dấu phẩy làm dấu phân cách thay vì tab và / hoặc từ UTF-16 sang UTF-8. Nhưng điều này chỉ hoạt động nếu dữ liệu gốc được mã hóa đúng cách.




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Dòng lệnh PHP mysql_connect () Lỗi

  2. Nhóm theo giá trị RAND ()

  3. MySQL:Số lượng bản ghi với các tháng liên tiếp

  4. Python, mysql.connector Lỗi:Không có kết quả nào được đặt để tìm nạp từ; cgitb hiển thị giá trị chính xác được chuyển đến hàm

  5. pandas 'read_sql với danh sách các giá trị cho điều kiện WHERE