Database
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Database

Nội dung không có cấu trúc:Nguồn nhiên liệu chưa được khai thác cho AI và Máy học

Bởi Alex Welsh , Phó chủ tịch, Thực hành Analytics, Ephesoft

Bạn sẽ chọn nơi đi nghỉ nếu bạn chỉ có thể truy cập 10 đến 20 phần trăm các bài đánh giá và thông tin trên một trang Web du lịch? Nếu bạn làm vậy, bạn có thể sẽ có một chuyến đi khó quên, nhưng vì những lý do mà bạn có thể không thích. Tuy nhiên, các tổ chức chính phủ và doanh nghiệp — từ sản xuất đến công ty bảo hiểm, chăm sóc sức khỏe đến ngân hàng — đều đưa ra quyết định theo cùng một đường lối này. Và, họ đã làm như vậy trong nhiều năm. Họ xem xét thông tin dễ dàng mà họ có thể nhận được từ dữ liệu có cấu trúc trong khi bỏ qua dữ liệu phi cấu trúc của họ, mà Deloitte tin rằng có thể chiếm 80 đến 90% nội dung được tạo trên toàn cầu, khiến dữ liệu phi cấu trúc trở thành nguồn giá trị to lớn chưa được khai thác.

May mắn thay, những tiến bộ trong AI (Trí tuệ nhân tạo) và học máy hiện giúp bạn có thể sàng lọc và tìm kiếm ý nghĩa trong một lượng lớn dữ liệu phi cấu trúc thu được từ các tệp video và âm thanh, e-mail, nhật ký, bài đăng trên mạng xã hội và thậm chí cả thông báo. từ các thiết bị Internet of Things (IoT). Tất cả dữ liệu này có thể mang lại những lợi ích to lớn, chẳng hạn như khi được sử dụng để tự động hóa các tác vụ đòi hỏi nhiều công sức thủ công và thường có tính lặp lại cao. Một nhiệm vụ, ví dụ, là đề phòng những dấu hiệu đỏ:các tiêu chí hoặc hành vi cụ thể có thể chỉ ra điều gì đó không ổn và phải nhanh chóng thực hiện hành động khắc phục. Hãy xem xét một số trường hợp từ các ngành khác nhau.

Làm thế nào về một yêu cầu bảo hiểm có vẻ tốt trên bề mặt, nhưng đáng bị điều tra, hoặc một người xin việc có thể đang che giấu thông tin? Điều gì về một lô hàng dược phẩm rất dễ hư hỏng có thể không được bảo quản lạnh trong một phần hành trình của họ, hoặc một hợp đồng có thể vi phạm luật pháp của một quốc gia hoặc phá vỡ thỏa thuận hiện có với một công ty khác? Điều quan trọng là một lá cờ đỏ chỉ ra các vấn đề mà nếu không được kiểm soát, có thể gây ra thiệt hại lớn.

Trí tuệ nhân tạo đang có độ đói dữ liệu lớn

Làm cách nào để AI và học máy cho phép phân tích dữ liệu hiệu quả và hiệu quả hơn? Thông qua việc cung cấp dữ liệu cho nó. Bằng cách đưa ra các ví dụ về mô hình học máy về các giao dịch tốt và xấu, nó tự dạy cho mình cách phân biệt giữa hai loại. Và, càng nhiều dữ liệu mà mô hình học máy xử lý, nó càng củng cố những bài học đó, nâng cao độ chính xác.

Vì vậy, mặc dù AI và học máy đang có những bước tiến dài, các doanh nghiệp và tổ chức khác cần phải bắt kịp. Hãy nghĩ về nó theo cách này:dữ liệu giống như nhiên liệu. Chúng ta cần nó để cung cấp sức mạnh cho suy nghĩ của mình để đưa ra những quyết định sáng suốt. Tuy nhiên, chúng tôi đã khai thác tất cả những thứ dễ dàng, dữ liệu có cấu trúc có trong các gói đẹp và gọn gàng. Tuy nhiên, đây là nơi mà sự tương đồng về nhiên liệu bị phá vỡ:Mặc dù một gallon xăng khác cho phép chúng ta lái xe thêm 20 đến 30 dặm nữa, nhưng càng nhiều dữ liệu chúng ta đưa vào cho phép chúng ta đưa ra quyết định tốt hơn và chính xác hơn đáng kể — không chỉ từ 20 đến 30 nữa -dd dặm có giá trị — và để làm cho chúng nhanh hơn nữa.

Tuy nhiên, trong suốt một thời gian dài, một phần lớn dữ liệu của chúng tôi, dữ liệu không có cấu trúc, vẫn chưa được khai thác vì nó quá đắt và quá khó để truy cập và xử lý. Và, mặc dù điều đó không còn xảy ra khi công nghệ mới để thu thập và phân tích dữ liệu phi cấu trúc trở nên sẵn có, nhưng nhiều người trong doanh nghiệp và các tổ chức khác đã bỏ qua những tiến bộ này.

Tiền thông minh ở đâu

Tập đoàn Dữ liệu Quốc tế (IDC) dự đoán rằng vào năm 2020, các tổ chức phân tích cả dữ liệu có cấu trúc và không có cấu trúc — tức là tất cả dữ liệu có liên quan — và cung cấp thông tin có thể hành động sẽ đạt được thêm 430 tỷ đô la tăng năng suất so với các đối thủ cạnh tranh của họ không thực hiện phân tích dữ liệu đó. Và, các doanh nghiệp hiểu được điều này không phải đợi đến năm 2020. Một giám đốc điều hành tại một công ty bảo hiểm đa quốc gia có trụ sở tại Đức coi dữ liệu phi cấu trúc là rủi ro lớn nhất của họ. Họ hiểu những con số liên quan và đang làm việc để đảm bảo họ không mất cảnh giác bằng cách viết các hợp đồng bảo hiểm khiến họ phải gánh chịu những khoản nợ mà họ lẽ ra có thể tránh được.

Sức mạnh tổng hợp của dữ liệu lớn, AI và học máy có thể giúp xử lý thông tin liên quan đến những thách thức phức tạp hơn dễ dàng hơn. Ví dụ:các ngân hàng và các tổ chức khác có thể phát hiện gian lận, trốn thuế, rửa tiền và các âm mưu khác một cách chính xác hơn và nhanh chóng hơn bằng cách khai thác những gì trước đây chưa được xử lý, dữ liệu không có cấu trúc. Điều này cho phép họ bắt và chặn các trường hợp gian lận và lạm dụng, cũng như tránh nhiều trường hợp dương tính giả có thể xảy ra khi chỉ dựa vào dữ liệu có cấu trúc. Các hiệp định tài trợ thương mại, bao gồm hợp đồng và nhiều nguồn dữ liệu, giữa các quốc gia hoặc công ty cũng có thể được rà soát để xác định xem có gian lận hoặc bất bình đẳng tồn tại hay không, cho dù chúng có cố ý hay không.

Hơn nữa, AI và học máy có thể giúp các ngân hàng và các loại hình doanh nghiệp khác xác định và xác minh danh tính khách hàng của họ tốt hơn thông qua quy trình Biết khách hàng của bạn (KYC) tự động. Các thủ tục như vậy có thể giúp ngăn chặn việc sử dụng chúng, cố ý hoặc vô ý, cho các hoạt động rửa tiền cũng như giúp ngăn ngừa hối lộ và các hình thức tham nhũng khác xảy ra. Các thủ tục KYC cũng có thể cho phép các doanh nghiệp hiểu rõ hơn về các giao dịch tài chính và nhu cầu của khách hàng, cũng như giúp họ quản lý rủi ro một cách thận trọng hơn. Các lợi thế khác bao gồm đẩy nhanh thời gian tạo ra doanh thu khi có thêm khách hàng mới, khiến KYC không phải là một khoản chi phí khác mà thay vào đó, là một nguồn lợi nhuận.

AI và Machine Learning có thể tăng khả năng cạnh tranh của bạn

Với tất cả những lợi ích thu được thông qua AI và học máy — và những tiến bộ trong công nghệ được sử dụng để xử lý dữ liệu có cấu trúc và phi cấu trúc — đã đến lúc nhiều doanh nghiệp và tổ chức hơn tận dụng nguồn thông tin tốt nhất hiện có:dữ liệu phi cấu trúc của riêng họ.

Giới thiệu về tác giả

Alex Welsh dẫn đầu Thực hành phân tích toàn cầu của Ephesoft. Anh ấy là giám đốc bán hàng, giám đốc dự án và doanh nhân giàu kinh nghiệm với niềm đam mê giải quyết các vấn đề quan trọng trong sứ mệnh của khách hàng bằng các giải pháp công nghệ sáng tạo hiệu quả về chi phí.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. API REST Python với Flask, Connexion và SQLAlchemy - Phần 3

  2. Cách sử dụng mệnh đề HAVING trong SQL

  3. Tại sao Học Cassandra với Hadoop?

  4. Khóa chính SQL

  5. Đặc quyền của người dùng cơ sở dữ liệu là gì?