Sqlserver
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Sqlserver

Học máy có ý nghĩa như thế nào đối với các chuyên gia cơ sở dữ liệu

Cơ sở dữ liệu học máy hiện đang phát triển. Điều này mang lại cơ hội lớn cho các chuyên gia cơ sở dữ liệu, những người có khả năng phát triển để tận dụng sự thay đổi này.

Hiện tại các chuyên gia cơ sở dữ liệu, ví dụ như quản trị viên cơ sở dữ liệu (DBA) và nhà phát triển cơ sở dữ liệu là một số vị trí quan trọng nhất trong bất kỳ tổ chức CNTT nào. Chuyên gia cơ sở dữ liệu chịu trách nhiệm tạo, quản lý và cung cấp quyền truy cập có kiểm soát vào cơ sở dữ liệu. Có đúng người làm DBA có thể giúp các công ty tiết kiệm thời gian và rút ngắn thời gian phát triển ứng dụng. Tuy nhiên, với việc ngày càng có nhiều quyền truy cập vào một lượng lớn dữ liệu, trách nhiệm của một chuyên gia cơ sở dữ liệu đang phát triển nhanh chóng.

Một số công nghệ đã được phát triển có thể được sử dụng để không chỉ quản lý và khám phá dữ liệu mà còn có thể giúp đưa ra các quyết định sáng suốt trên cơ sở dữ liệu. Máy học là một trong những công nghệ đã chứng kiến ​​sự phát triển vượt bậc trong thập kỷ qua Bài viết này cung cấp tổng quan ngắn gọn về cách máy học có thể tác động đến các nghề cơ sở dữ liệu và lợi ích của việc sử dụng máy học như một bộ kỹ năng.

Học máy là gì?

Học máy là một quá trình hiểu và trích xuất các mẫu hữu ích từ dữ liệu với sự trợ giúp của các thuật toán thống kê khác nhau. Học máy được chia thành các kỹ thuật học có giám sát và không giám sát. Máy học hiện đang được sử dụng để giải quyết nhiều vấn đề phức tạp như phân loại email ham và spam, dự đoán giá nhà, tạo thơ, phân loại hình ảnh, v.v.

Liệu Học máy có thay thế các Nghề cơ sở dữ liệu không?

Một trong những quan niệm sai lầm phổ biến nhất về học máy là nó sẽ thay thế con người trong nhiều công việc. Mặc dù điều này có thể đúng với một số tác vụ lặp đi lặp lại, nhưng về cơ bản AI và học máy sẽ bổ sung cho bộ não con người chứ không thay thế nó. Đối với các chuyên gia cơ sở dữ liệu, cơ sở dữ liệu học máy sẽ không thay thế chúng, thay vào đó chúng sẽ giúp ích rất nhiều cho họ.

Nó sẽ cho phép các chuyên gia cơ sở dữ liệu tập trung nhiều hơn vào các nhiệm vụ lập kế hoạch và chiến lược, vì nó sẽ tự động hóa các tác vụ nhàm chán và tự chủ hơn như cài đặt, cấu hình và cập nhật cơ sở dữ liệu thường xuyên. Do đó, thay vì lo sợ tác động của học máy đối với công việc của họ, các chuyên gia cơ sở dữ liệu nên nắm lấy nó như một cách để hoàn thành các nhiệm vụ ít thách thức hơn một cách nhanh chóng và hiệu quả hơn nhiều. .

Xử lý dữ liệu lớn là một thách thức

Do sự phát triển của web trên toàn thế giới trong hai thập kỷ qua, dữ liệu có sẵn ở mọi hình dạng và kích cỡ. Trên thực tế, thuật ngữ dữ liệu lớn thường được sử dụng cho tập dữ liệu có khối lượng lớn, đến với tốc độ cao và chứa nhiều nội dung.

Xử lý một lượng lớn dữ liệu phi cấu trúc như vậy đã trở thành một thách thức đối với DBA. Các thuật toán chạy trên cơ sở dữ liệu học máy cũng hoạt động tốt với dữ liệu phi cấu trúc. Một lượng lớn dữ liệu có thể dễ dàng được chia nhỏ thành thông tin có ý nghĩa thông qua các kỹ thuật học máy, điều này làm nổi bật nhu cầu của các chuyên gia cơ sở dữ liệu để có được các kỹ năng học máy.

Đã có cơ sở dữ liệu học máy

Các công ty như Microsoft và Oracle đã bắt đầu kết hợp các khả năng học máy khác nhau vào cơ sở dữ liệu. Ví dụ:Cơ sở dữ liệu Microsoft Azure SQL có một mô-đun gợi ý và đề xuất các chiến lược cải thiện hiệu suất khác nhau có thể được áp dụng tự động. Tương tự, SQL Server Query Store cung cấp một kế hoạch để xác định các truy vấn gây ra tắc nghẽn hiệu suất. Cơ sở dữ liệu Oracle 18c có khả năng tự phục hồi và có thể tự áp dụng các bản vá lỗi và nâng cấp bất cứ khi nào xảy ra sự cố cơ sở dữ liệu. Kiến thức tốt về học máy thực sự giúp các nhà phát triển cơ sở dữ liệu hiểu được cơ sở lý luận đằng sau các đề xuất khác nhau được thực hiện bởi các công cụ cơ sở dữ liệu học máy.

Cuộc phiêu lưu của các cơ sở dữ liệu hoàn toàn tự trị

Cơ sở dữ liệu học máy hiện tại có khả năng hạn chế. Trọng tâm của nghiên cứu hiện nay là phát triển cơ sở dữ liệu hoàn toàn tự động. Sẽ thật tuyệt nếu có một cơ sở dữ liệu có thể lường trước các vấn đề sắp xảy ra và đủ chủ động để thực hiện các biện pháp phòng ngừa trước phải không? Hay nó sẽ không làm cho cuộc sống của một chuyên gia cơ sở dữ liệu dễ dàng hơn nhiều nếu cơ sở dữ liệu tự động sao lưu bất cứ khi nào một giao dịch quan trọng xảy ra? Có nhiều tình huống trong đó cơ sở dữ liệu học máy cực kỳ hữu ích.

Ví dụ:cơ sở dữ liệu hiện có thực hiện sao lưu tự động tại một thời điểm cụ thể nhưng không phải tất cả các giao dịch cơ sở dữ liệu đều có giá trị sao lưu. Trong trường hợp này, cơ sở dữ liệu học máy có thể trở nên đủ thông minh để biết khi nào nên sao lưu và khi nào không nên sao lưu.

Hơn nữa, nhiều vấn đề về cơ sở dữ liệu có thể được lường trước. Ví dụ, trong các tình huống mà nhiều người dùng đang truy cập các tài nguyên cơ sở dữ liệu khác nhau, khả năng xảy ra bế tắc sẽ tăng lên gấp nhiều lần. Nếu điều này xảy ra, cơ sở dữ liệu máy học có thể chuyển sang cung cấp quyền truy cập có kiểm soát vào tài nguyên và tránh bế tắc.

Có một số nhóm nghiên cứu hàn lâm đã cố gắng phát triển cơ sở dữ liệu hoàn toàn tự trị.

Nhóm nghiên cứu cơ sở dữ liệu Carnegie Mellon đã phát triển dự án OtterTune trong đó sử dụng các kỹ thuật máy học và dữ liệu khối lượng công việc từ một số lượng lớn cơ sở dữ liệu cũ để tạo ra các mô hình có khả năng tự động điều chỉnh khối lượng công việc mới. Cơ sở dữ liệu máy học OtterTune cũng tự động đề xuất các cài đặt tối ưu để cải thiện thông lượng và giảm độ trễ cho các ứng dụng cơ sở dữ liệu mới.

MIT cũng đã phát triển một khung quản lý cơ sở dữ liệu mã nguồn mở được gọi là DBSee r dự đoán hiệu suất cho một tập hợp tài nguyên cơ sở dữ liệu nhất định và xác định các nút thắt về hiệu suất.

Đường cong học tập

Học máy thường được định nghĩa là giao điểm của khoa học máy tính và thống kê. Bất kỳ ai có kiến ​​thức về khoa học máy tính đều có thể tương đối nhanh chóng xây dựng kỹ năng học máy của họ lên trình độ trung cấp nếu họ hiểu biết hợp lý về số liệu thống kê.

Nhiều công cụ GUI và nền tảng đám mây như Google AI, IBM Watson, Amazon Sagemaker, Azure ML đã đơn giản hóa quá trình triển khai các kỹ thuật máy học bằng cách cung cấp giao diện kéo và thả dựa trên GUI cho cơ sở dữ liệu máy học. Người dùng chỉ cần biết cách sử dụng công cụ vì phần lớn công việc (thêm bộ dữ liệu, chọn kỹ thuật tiền xử lý, đào tạo mô hình và cuối cùng là đánh giá mô hình) có thể được thực hiện với một vài cú nhấp chuột.

Tuy nhiên, nếu một chuyên gia cơ sở dữ liệu thực sự muốn xây dựng sự nghiệp trong lĩnh vực máy học nâng cao, họ sẽ cần xây dựng sự hiểu biết thấu đáo về số liệu thống kê. Nền tảng khoa học máy tính của một chuyên gia cơ sở dữ liệu sẽ đủ tốt để nắm bắt các khái niệm liên quan đến CS của máy học một cách nhanh chóng.

Tuy nhiên, như chúng tôi đã nói ở trên, nếu một chuyên gia cơ sở dữ liệu chỉ quan tâm đến việc sử dụng học máy để tự động hóa các tác vụ lặp đi lặp lại, thì kiến ​​thức về các công cụ học máy dựa trên GUI là quá đủ.

Nhiều con đường nghề nghiệp

Sự thành công của học máy và trí tuệ nhân tạo đã thúc đẩy các tổ chức phát triển các nhóm khoa học dữ liệu chuyên dụng bao gồm các chuyên gia học máy có tay nghề cao.

Hiện tại, các chuyên gia học máy và chuyên gia cơ sở dữ liệu có các con đường sự nghiệp khác nhau, tuy nhiên ngày càng nhiều tổ chức mong đợi các chuyên gia về học máy hoặc khoa học dữ liệu có một số trình độ chuyên môn về cơ sở dữ liệu và ngược lại.

Do điều này hiện đang diễn ra phổ biến, các chuyên gia cơ sở dữ liệu có kiến ​​thức về kỹ năng học máy được ưu tiên hơn và có cơ hội tốt hơn được tuyển dụng làm chuyên gia cơ sở dữ liệu hoặc chuyên gia học máy hoặc một người nào đó có cả hai trách nhiệm trong công việc.

Phán quyết cuối cùng

Sự ra đời của dữ liệu lớn và các kỹ thuật máy học liên quan có khả năng mang lại những thay đổi đáng kể trong trách nhiệm công việc của các chuyên gia cơ sở dữ liệu khi ngoài giờ, trọng tâm của họ sẽ chuyển sang dữ liệu từ cơ sở dữ liệu, khi cơ sở dữ liệu học máy ngày càng tự quản lý.

Học máy sẽ giúp các chuyên gia cơ sở dữ liệu tự động hóa rất nhiều tác vụ thủ công và tốn công sức, đồng thời giải phóng họ đầu tư thời gian và công sức để nắm bắt các kỹ năng học máy và đưa chúng vào sử dụng.

Học các số liệu thống kê cần thiết để phát triển từ một chuyên gia cơ sở dữ liệu thành một cơ sở dữ liệu rộng hơn và máy học không phải là điều dễ hiểu nhưng sẽ mang lại lợi ích lớn về cơ hội và phát triển nghề nghiệp.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Cách nhanh nhất để chạy cùng một truy vấn nhiều lần trong SQL Server

  2. Làm cách nào để sử dụng tính năng xóa theo tầng với SQL Server?

  3. Biểu thức chính quy trong máy chủ SQL Server?

  4. Sự khác biệt của hai ngày thời gian trong máy chủ sql

  5. Có cách nào để chèn hoặc cập nhật SQLBulkCopy nếu tồn tại không?