Database
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Database

Xu hướng cơ sở dữ liệu năm 2019 - SQL so với NoSQL, Cơ sở dữ liệu hàng đầu, Sử dụng một cơ sở dữ liệu so với Nhiều cơ sở dữ liệu

Bạn đang băn khoăn không biết cơ sở dữ liệu nào đang thịnh hành trong năm 2019? Chúng tôi đã yêu cầu hàng trăm nhà phát triển, kỹ sư, kiến ​​trúc sư phần mềm, nhóm nhà phát triển và các nhà lãnh đạo CNTT tại DeveloperWeek khám phá cách sử dụng NoSQL so với SQL hiện tại, cơ sở dữ liệu phổ biến nhất, các số liệu quan trọng cần theo dõi và các tác vụ quản lý cơ sở dữ liệu tốn nhiều thời gian nhất của họ. Nhận thông tin chi tiết mới nhất về cơ sở dữ liệu được hỗ trợ của chúng tôi MySQL, MongoDB®, PostgreSQL, Redis ™ * và nhiều cơ sở dữ liệu khác để xem hệ quản trị cơ sở dữ liệu nào được ưa chuộng nhất trong năm nay.

SQL so với NoSQL

Như bất kỳ quản trị viên cơ sở dữ liệu nào cũng biết, câu hỏi đầu tiên bạn phải tự hỏi mình là nên sử dụng cơ sở dữ liệu SQL hay NoSQL cho ứng dụng của mình. Sự khác biệt giữa cả hai là gì?

Cơ sở dữ liệu SQL

Còn được gọi là cơ sở dữ liệu quan hệ, xác định và thao tác dữ liệu dựa trên ngôn ngữ truy vấn có cấu trúc (SQL). Chúng được sử dụng phổ biến nhất và hữu ích để xử lý dữ liệu có cấu trúc, tổ chức các phần tử của dữ liệu và chuẩn hóa cách chúng liên quan với nhau và với các thuộc tính khác nhau.

Cơ sở dữ liệu NoSQL

Còn được gọi là cơ sở dữ liệu không quan hệ, cho phép bạn lưu trữ và truy xuất dữ liệu phi cấu trúc bằng lược đồ động. NoSQL được sử dụng phổ biến nhờ khả năng linh hoạt trong việc tạo cấu trúc độc đáo và có thể là tài liệu, đồ thị, cột hoặc thậm chí KeyValue được tổ chức dưới dạng cấu trúc dữ liệu.

SQL đã dẫn đầu nhiều so với các lựa chọn thay thế không quan hệ trong nhiều thập kỷ, nhưng NoSQL đang nhanh chóng thu hẹp khoảng cách với các cơ sở dữ liệu phổ biến như MongoDB, Redis, và Cassandra. Mặc dù nhiều tổ chức đang chọn chuyển từ cơ sở dữ liệu cũ, chẳng hạn như Oracle, nhưng không phải tất cả đều chuyển sang NoSQL theo cách. Dựa trên những phát hiện của chúng tôi, SQL vẫn chiếm 60% với nhu cầu ngày càng tăng đối với các hệ thống như PostgreSQL:

Sử dụng cơ sở dữ liệu SQL:60,48%

Sử dụng cơ sở dữ liệu NoSQL:39,52%

Các cơ sở dữ liệu phổ biến nhất

Vậy, cơ sở dữ liệu nào phổ biến nhất trong năm 2019? Biết rằng SQL đã được sử dụng bởi hơn 3/5 số người được hỏi, bạn có thể cho rằng Oracle đã đánh cắp chương trình. Đoán lại. MySQL thống trị báo cáo này với 38,9% sử dụng, tiếp theo là MongoDB với 24,6%, PostgreSQL là 17,4%, Redis là 8,4% và Cassandra là 3,0%. Oracle xếp sau với chỉ 1,8% so với các phóng viên cơ sở dữ liệu này và người dùng CouchDB, Berkeley DB, Microsoft SQL Server, Redshift, Firebase, Elasticsearch và InfluxDB kết hợp danh mục Khác của chúng tôi với 2,4%.

Mặc dù những con số này có thể gây sốc, nhưng không thể nhầm lẫn sự gia tăng phổ biến của MySQL, MongoDB và PostgreSQL. Vậy khảo sát này so sánh với nguồn nổi tiếng nhất về xu hướng hệ quản trị cơ sở dữ liệu như thế nào? Xếp hạng DB-Engines - Báo cáo về mức độ phổ biến của xu hướng đưa những người dẫn đầu này vào top 5, nhưng Oracle vẫn giữ vị trí số một và Microsoft SQL Server ở vị trí số 3.

Mặc dù chúng tôi dự kiến ​​sẽ thấy lượng người dùng cơ sở dữ liệu Oracle hiện diện nhiều hơn, nhưng mức độ đại diện của họ thấp tại hội chợ dành cho nhà phát triển lớn nhất thế giới.

Cơ sở dữ liệu đơn lẻ so với Sử dụng nhiều cơ sở dữ liệu

Việc sử dụng nhiều loại cơ sở dữ liệu đã bùng nổ trong thập kỷ qua, so với chiến lược truyền thống là ném tất cả trứng vào một giỏ. Nhiều như vậy? Gần một nửa số tổ chức mà chúng tôi đã nói chuyện thực sự sử dụng nhiều hơn một loại cơ sở dữ liệu để cung cấp năng lượng cho các ứng dụng của họ hơn là một cơ sở dữ liệu duy nhất! 44,3% cho biết sử dụng nhiều cơ sở dữ liệu, trong khi 55,7% đang sử dụng một cơ sở dữ liệu:

Xu hướng cơ sở dữ liệu năm 2019 - SQL so với NoSQL, Cơ sở dữ liệu hàng đầu, Sử dụng cơ sở dữ liệu đơn so với nhiều cơ sở dữ liệu Nhấp để Tweet

Kết hợp nhiều cơ sở dữ liệu SQL &NoSQL

Vì vậy, biết rằng gần một nửa số người được hỏi của chúng tôi đang kết hợp nhiều cơ sở dữ liệu để hỗ trợ sản phẩm của họ, họ đang sử dụng loại hệ thống quản lý cơ sở dữ liệu nào? Điều này ít gây sốc hơn, 75,6% việc sử dụng nhiều loại cơ sở dữ liệu được tạo thành từ sự kết hợp của cả cơ sở dữ liệu SQL và NoSQL. Điều này củng cố cho trường hợp rằng, đối với nhiều tổ chức, một quy mô không phù hợp với tất cả. Mặc dù bạn có thể có sở thích hơn SQL so với NoSQL, nhưng không thể phủ nhận thực tế là cả hai đều cung cấp những lợi thế rõ ràng của cái còn lại. Thay vì giới hạn tổ chức của bạn trong một loại cơ sở dữ liệu, hãy phát triển (hoặc phát triển) chiến lược dữ liệu của bạn để tương thích để các hệ thống quản lý cơ sở dữ liệu mạnh mẽ này có thể bổ sung cho nhau và lấp đầy khoảng trống trong nhu cầu dữ liệu của bạn!

Sử dụng cơ sở dữ liệu SQL + NoSQL:75,6%

Sử dụng cơ sở dữ liệu SQL + SQL:14,6%

Sử dụng Cơ sở dữ liệu NoSQL + NoSQL:9,8%

Các kiểu kết hợp nhiều loại cơ sở dữ liệu phổ biến nhất

Nếu bạn là người dùng loại cơ sở dữ liệu duy nhất đang xem xét thêm một loại cơ sở dữ liệu khác vào kết hợp của mình, phần này có thể được quan tâm nhiều - cơ sở dữ liệu nào, SQL và NoSQL, là nhất được sử dụng phổ biến cùng nhau.

Người chiến thắng rõ ràng với hơn 1/3 việc sử dụng nhiều loại cơ sở dữ liệu là sự kết hợp của MySQL và MongoDB. Trong khi MongoDB thường được coi là một giải pháp thay thế cho MySQL, hai cơ sở dữ liệu này hoạt động tốt với nhau khi được thiết kế đúng cách. Sự kết hợp phổ biến thứ hai là MySQL và PostgreSQL với nhau. Hai cơ sở dữ liệu SQL này là đối thủ cạnh tranh rõ ràng, nhưng có thể được sử dụng chung để lưu trữ các tập dữ liệu khác nhau. Như bạn có thể thấy trong biểu đồ phần trên, biểu diễn 9,76% của MySQL và PostgreSQL bao gồm phần lớn việc sử dụng SQL + SQL trong nhiều cơ sở dữ liệu.

MySQL + MongoDB:34,15%

MySQL + PostgreSQL:9,76%

MongoDB + PostgreSQL:7,32%

MongoDB + Redis:7,32%

MySQL + MongoDB + PostgreSQL:4,88%

MySQL + MongoDB + PostgreSQL + Redis:4,88%

Nhiệm vụ quản lý cơ sở dữ liệu tiêu tốn nhiều thời gian nhất

Vì vậy, bây giờ chúng ta đã biết hệ thống quản lý cơ sở dữ liệu, loại và kết hợp sử dụng nào phổ biến nhất, hãy cùng xem những gì đang tiêu tốn thời gian của chúng ta trên mặt trận quản lý cơ sở dữ liệu. Như bất kỳ ai từng quản lý cơ sở dữ liệu trước đây đều biết, có vô số nhiệm vụ liên quan đến việc duy trì triển khai sản xuất lành mạnh. Vì vậy, chúng tôi không ngạc nhiên khi thấy câu trả lời đa dạng như vậy trong câu hỏi nhiệm vụ quản lý cơ sở dữ liệu tốn nhiều thời gian nhất của chúng tôi.

Giám sát đứng ở vị trí số một với 12,6% từ những người được hỏi của chúng tôi, hầu như không vượt trước các bản sao lưu, quản lý không gian đĩa, chia tỷ lệ và tham gia các bảng, tất cả đều đứng ở vị trí thứ hai với 11,6% mỗi. Độc lập ở vị trí thứ ba là duy trì và phân phối lại các thay đổi giữa các chế độ xem và các chương trình được lưu trữ ở mức 8,7%, và một lần nữa đứng ở vị trí thứ 4 với 7,2% cho mỗi lần dọn dẹp và thiết lập cơ sở dữ liệu. Nâng cấp đứng ở vị trí thứ năm với 6,5% và hàng chục tác vụ khác chiếm 11,6% Danh mục khác, bao gồm di chuyển, truy vấn, so sánh, điều chỉnh và nhân rộng.

Số liệu quan trọng nhất được theo dõi để đạt hiệu suất cơ sở dữ liệu

Mặc dù chúng tôi thấy nhiều phản hồi cho nhiệm vụ quản lý cơ sở dữ liệu quan trọng nhất, nhưng chỉ số quan trọng nhất để theo dõi hiệu suất có ba nhà lãnh đạo quan trọng.

Thời gian phản hồi truy vấn không chỉ là chỉ số được theo dõi nhiều nhất mà còn chiếm đa số với 51,8% phản hồi! Chúng tôi kỳ vọng điều này sẽ dẫn đầu khi nó đạt 30,8% từ báo cáo Nhiệm vụ quản lý PostgreSQL tiêu tốn nhiều thời gian nhất mà chúng tôi đã biên soạn vào tháng 10 năm 2018, nhưng đã tăng lên đáng kể khi chúng tôi mở rộng câu hỏi này cho tất cả các hệ thống quản lý cơ sở dữ liệu. Tốc độ truy vấn là một số liệu cực kỳ quan trọng để theo dõi liên tục để bạn có thể xác định các truy vấn chạy chậm có thể ảnh hưởng đến hiệu suất ứng dụng của bạn. Nhiều DBA sử dụng công cụ Trình phân tích truy vấn chậm để xác định các truy vấn có vấn đề, xem loại truy vấn nào được liên kết với, hiểu các truy vấn của họ theo phạm vi thời gian và tìm các truy vấn hàng đầu gây ra tải đọc trong hệ thống của bạn để xác định những truy vấn không được lập chỉ mục .

Đứng ở vị trí thứ hai là độ tin cậy với 18,2% từ những người được hỏi. Không cần phải nói, trong khi sự cố ít phổ biến hơn các truy vấn chậm, nhưng nếu cơ sở dữ liệu của bạn gặp sự cố, nó sẽ có tác động nghiêm trọng nhất đến hiệu suất của bạn. Đó là lý do tại sao điều cực kỳ quan trọng là phải triển khai khuôn khổ tính sẵn sàng cao cho các triển khai sản xuất của bạn để giữ cho cơ sở dữ liệu của bạn luôn trực tuyến nếu một trong các trung tâm dữ liệu của bạn bị ngừng hoạt động.

Bộ nhớ đứng ở vị trí thứ ba với 8,2% phản hồi. Bạn càng có nhiều bộ nhớ, thì cơ sở dữ liệu của bạn càng hoạt động tốt hơn. Cả việc hiểu và giám sát việc sử dụng bộ nhớ đều phải cao trong danh sách của bạn, vì bộ nhớ không đủ hoặc cạn kiệt sẽ khiến cơ sở dữ liệu của bạn đọc và ghi dữ liệu vào đĩa chậm hơn đáng kể.

Cảm ơn hàng trăm người tham gia đã đóng góp vào báo cáo xu hướng cơ sở dữ liệu đám mây tại DeveloperWeek 2019! Chúng tôi rất vui được chia sẻ những thông tin chi tiết này và hy vọng sẽ nghe được suy nghĩ của bạn bên dưới trong phần nhận xét của chúng tôi.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. So sánh Hiệu suất Windows Azure VM, Phần 1

  2. SCD loại 4

  3. 7 điều chính cần nhớ về toàn cầu hóa mô hình dữ liệu

  4. Giới thiệu về Dịch vụ Web Amazon (AWS) Tự động mở rộng quy mô

  5. Làm thế nào để chuyển đổi một chuỗi thành chữ thường trong SQL