Database
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Database

Xu hướng ScyllaDB - Cách người dùng triển khai cơ sở dữ liệu dữ liệu lớn theo thời gian thực

ScyllaDB là một kho dữ liệu NoSQL phân tán mã nguồn mở, được hoàn thiện lại từ cơ sở dữ liệu Apache Cassandra phổ biến. Được phát hành chỉ bốn năm trước vào năm 2015, Scylla đã đạt mức tăng trưởng trung bình hơn 220% so với cùng kỳ năm trước theo DB-Engines. Chúng tôi đã nghe rất nhiều về cơ sở dữ liệu ngày càng tăng này từ cộng đồng DBA và người dùng của chúng tôi, đồng thời quyết định trở thành nhà tài trợ cho Scylla Summit năm nay để tìm hiểu thêm về xu hướng triển khai từ người dùng. Trong bài đăng này, chúng tôi phân tích việc triển khai đám mây ScyllaDB so với triển khai tại chỗ, các nhà cung cấp đám mây phổ biến nhất, cơ sở dữ liệu SQL và NoSQL được sử dụng với ScyllaDB, các tác vụ quản lý tốn nhiều thời gian nhất và lý do bạn nên sử dụng ScyllaDB so với Cassandra.

  • ScyllaDB đấu với Cassandra
  • ScyllaDB Cloud so với ScyllaDB Tại chỗ
  • Các nhà cung cấp đám mây phổ biến nhất cho ScyllaDB
  • Cơ sở dữ liệu được sử dụng phổ biến nhất với ScyllaDB
  • Công việc quản lý ScyllaDB tiêu tốn nhiều thời gian nhất

ScyllaDB so với Cassandra - Cái nào Tốt hơn?

Bạn đang băn khoăn không biết sử dụng cửa hàng cột rộng nào cho việc triển khai của mình? Trong khi Cassandra vẫn là cửa hàng phổ biến nhất, ScyllaDB đang nhanh chóng trở thành cửa hàng cột rộng phổ biến thứ 7 theo DB-Engines. Vậy một số lý do khiến người dùng chọn ScyllaDB so với Cassandra là gì?

ScyllaDB cung cấp độ trễ thấp hơn đáng kể, cho phép bạn xử lý khối lượng lớn dữ liệu với độ trễ tối thiểu. Trên thực tế, theo báo cáo điểm chuẩn hiệu suất của ScyllaDB, độ trễ phân vị 99,9 của họ cao hơn tới 11 lần so với Cassandra trên AWS EC2 kim loại trần. Vì vậy, loại hiệu suất này phải đi kèm với một chi phí, phải không? Đúng vậy, nhưng họ tuyên bố trong báo cáo này rằng chi phí giảm 2,5 lần so với chạy Cassandra, vì họ có thể đạt được hiệu suất này chỉ với 10% số nút.

Có hàng tá bài viết chất lượng về ScyllaDB so với Cassandra, vì vậy chúng ta sẽ dừng lại ở đây để chúng ta có thể đi đến mục đích thực sự của bài viết này, phân tích dữ liệu người dùng ScyllaDB .

ScyllaDB Cloud so với ScyllaDB Tại chỗ

ScyllaDB có thể chạy trên cả đám mây công cộng và tại chỗ. Trên thực tế, ScyllaDB được triển khai phổ biến nhất trong cả môi trường đám mây công cộng và môi trường tại chỗ trong một tổ chức. 44% các triển khai ScyllaDB tận dụng cả điện toán đám mây và điện toán tại chỗ có thể thông qua môi trường đám mây kết hợp tận dụng cả hai cho một ứng dụng cụ thể hoặc sử dụng các môi trường này riêng biệt để quản lý các ứng dụng khác nhau.

Triển khai tại chỗ ScyllaDB và triển khai đám mây ScyllaDB đều đã chết ở mức 28% mỗi lần. Bạn có thể chạy cả mã nguồn mở miễn phí ScyllaDB và ScyllaDB Enterprise trên đám mây hoặc tại chỗ và giấy phép ScyllaDB Enterprise bắt đầu từ $ 28,8 nghìn / năm cho tổng số 48 lõi.

Cách tốt nhất để triển khai #ScyllaDB là gì? Đám mây so với On-PremiseClick To Tweet

Nhà cung cấp đám mây phổ biến nhất cho ScyllaDB

Với 28% cụm ScyllaDB được triển khai độc quyền trên đám mây và 72% sử dụng đám mây ở một mức độ nào đó, chúng tôi muốn biết nhà cung cấp đám mây nào phổ biến nhất cho khối lượng công việc của ScyllaDB .

# 1. AWS

Chúng tôi nhận thấy rằng 39,1% trong tổng số các triển khai đám mây ScyllaDB đang chạy trên AWS từ những người tham gia khảo sát của chúng tôi. Mặc dù chúng tôi kỳ vọng AWS sẽ là nhà cung cấp đám mây số 1 cho ScyllaDB, nhưng tỷ lệ này thấp hơn đáng kể so với các phản hồi từ tất cả các loại cơ sở dữ liệu đám mây trong cuộc khảo sát này báo cáo rằng 55% đang triển khai trên AWS. Con số này phù hợp hơn với Báo cáo xu hướng cơ sở dữ liệu nguồn mở năm 2019 gần đây của chúng tôi, trong đó 56,9% triển khai đám mây được báo cáo đang chạy trên AWS. Điều này có thể là do AWS không hỗ trợ ScyllaDB thông qua Dịch vụ cơ sở dữ liệu quan hệ (RDS) của họ, vì vậy chúng tôi có thể giả thuyết rằng khi nhiều tổ chức tiếp tục di chuyển dữ liệu của họ sang ScyllaDB, AWS có thể bị suy giảm cơ sở khách hàng của họ.

# 2. Google Cloud

Google Cloud Platform (GCP) là nhà cung cấp đám mây phổ biến thứ hai cho ScyllaDB, chiếm 30,4% trong tổng số các lần triển khai đám mây. Google Cloud cung cấp kho dữ liệu lớn và kho dữ liệu lớn của riêng họ, được gọi là Bigtable, thực sự được xếp hạng # 111, một dưới ScyllaDB ở vị trí # 110 trên DB-Engines. Chi phí thấp và khả năng hiệu suất cao của ScyllaDB làm cho nó trở thành một lựa chọn hấp dẫn đối với người dùng GCP, đặc biệt vì nó là mã nguồn mở so với Bigtable chỉ có sẵn trên thị trường thương mại trên GCP.

# 3. Azure

Azure theo sau ở vị trí thứ ba, chiếm 17,4% tổng số các triển khai ScyllaDB trên đám mây từ những người trả lời khảo sát của chúng tôi. Azure là một nhà cung cấp đám mây hấp dẫn cho các tổ chức tận dụng bộ dịch vụ của Microsoft.

Nhà cung cấp đám mây nào phổ biến nhất cho #ScyllaDB? AWS so với Azure so với GCPClick To Tweet

13,0% còn lại trong việc triển khai đám mây ScyllaDB được phát hiện đang chạy trên các dịch vụ điện toán đám mây DigitalOcean, Alibaba và Tencent.

Dịch vụ được quản lý của họ, Scylla Cloud, hiện chỉ khả dụng trên AWS và bạn phải sử dụng phiên bản ScyllaDB Enterprise để tận dụng DBaaS của họ. Scylla Cloud có kế hoạch bổ sung hỗ trợ cho GCP và Azure trong tương lai, nhưng với chỉ 39% báo cáo trên AWS, chúng tôi có thể giả định hơn 60% việc triển khai ScyllaDB đang được tự quản lý trên đám mây.

Cơ sở dữ liệu được sử dụng phổ biến nhất với ScyllaDB

Như chúng tôi cũng đã tìm thấy từ Báo cáo cơ sở dữ liệu nguồn mở năm 2019, các tổ chức trung bình sử dụng 3,1 loại cơ sở dữ liệu khác nhau. Tuy nhiên, trong cuộc khảo sát này, các tổ chức sử dụng ScyllaDB báo cáo chỉ sử dụng trung bình 2,3 loại cơ sở dữ liệu khác nhau, giảm 26% so với kết quả của chúng tôi từ tất cả người dùng cơ sở dữ liệu nguồn mở. Chúng tôi cũng nhận thấy rằng 39% triển khai ScyllaDB chỉ đang sử dụng ScyllaDB và không tận dụng bất kỳ loại cơ sở dữ liệu nào khác trong các ứng dụng của họ.

Vậy cơ sở dữ liệu nào được sử dụng phổ biến nhất cùng với ScyllaDB? Chúng tôi nhận thấy rằng người dùng ScyllaDB cũng đang sử dụng cơ sở dữ liệu SQL MySQL 20% thời gian và PostgreSQL 20% thời gian. Cơ sở dữ liệu được sử dụng phổ biến thứ hai với ScyllaDB là Cassandra được đại diện trong 16% các lần triển khai và chúng tôi có thể giả định rằng điều này là do các tổ chức đang thử nghiệm ScyllaDB như một giải pháp thay thế cho Cassandra trong các ứng dụng của họ vì cả hai loại cơ sở dữ liệu đều là kho lưu trữ cột rộng.

MongoDB là cơ sở dữ liệu được triển khai phổ biến thứ tư với ScyllaDB ở mức 12%. Redis và Elasticsearch đồng hạng ở vị trí thứ năm, cả hai đều là đòn bẩy 8% thời gian với việc triển khai ScyllaDB.

Chúng tôi cũng nhận thấy 20% việc triển khai Scylla đang tận dụng các loại cơ sở dữ liệu khác, bao gồm Oracle, Aerospike, Kafka (hiện đang chuyển đổi thành cơ sở dữ liệu phát trực tuyến sự kiện), DB2 và Tarantool.

Công việc quản lý ScyllaDB tiêu tốn nhiều thời gian nhất

Chúng tôi biết rằng ScyllaDB rất mạnh, nhưng nó dễ sử dụng đến mức nào? Chúng tôi đã hỏi người dùng ScyllaDB xem nhiệm vụ quản lý tốn thời gian nhất của họ là gì và 28% nhận xét rằng Scylla Repair là nhiệm vụ quản lý lâu nhất. Scylla Repair là một quá trình đồng bộ hóa chạy trong nền để đảm bảo tất cả các bản sao cuối cùng đều giữ cùng một dữ liệu. Người dùng phải chạy lệnh sửa chữa nút bấm thường xuyên, vì không có cách nào để tự động sửa chữa trong các phiên bản nguồn mở ScyllaDB hoặc ScyllaDB Enterprise, nhưng bạn có thể thiết lập lịch trình sửa chữa thông qua Trình quản lý Scylla.

Phân tích truy vấn chậm ScyllaDB buộc các bản sao lưu và khôi phục của ScyllaDB ở vị trí thứ hai với 14% cho mỗi tác vụ quản lý tốn nhiều thời gian nhất. Có vẻ như ScyllaDB hiện không có sẵn trình phân tích truy vấn để xác định các truy vấn cần tối ưu hóa, nhưng người dùng có thể sử dụng Ghi nhật ký truy vấn chậm của họ để xem truy vấn nào có thời gian phản hồi lâu nhất. Sao lưu ScyllaDB cũng không thể được tự động hóa thông qua các phiên bản mã nguồn mở và doanh nghiệp, nhưng chúng tuyên bố rằng các bản sao lưu định kỳ sẽ có sẵn trong các phiên bản tương lai của Scylla Manager. Cũng không có cách tự động nào để khôi phục bản sao lưu ScyllaDB, vì chúng phải được thực hiện thủ công trong tất cả các phiên bản.

10% người dùng ScyllaDB báo cáo rằng việc thêm, xóa hoặc thay thế các nút là công việc tốn thời gian nhất, đứng ở vị trí thứ tư. Đây là những quy trình thủ công có thể mất khá nhiều thời gian, đặc biệt nếu bạn đang xử lý kích thước dữ liệu lớn. Việc thêm các nút được sử dụng để mở rộng quy mô triển khai trong khi loại bỏ chúng sẽ thu nhỏ quá trình triển khai của bạn. Các nút phải được thay thế nếu chúng gặp sự cố hoặc bị chết, mặc dù một cụm vẫn có thể sử dụng được khi nhiều nút gặp sự cố.

Xếp ở vị trí thứ năm với 7% là nâng cấp và khắc phục sự cố. ScyllaDB Enterprise và mã nguồn mở đều yêu cầu các bước mở rộng để nâng cấp một cụm. Các phương pháp được đề xuất là thông qua quy trình luân phiên để không có thời gian chết, nhưng đây là quy trình thủ công nên người dùng phải gỡ bỏ một nút tại một thời điểm, thực hiện tất cả các bước nâng cấp, khởi động lại và xác thực nút trước khi chuyển sang thực hiện các bước tương tự cho các nút còn lại trong cụm. Thực sự tốn thời gian, nhưng may mắn thay không phải là một nhiệm vụ hàng ngày! Việc khắc phục sự cố tất nhiên là một lỗ hổng sâu để đi sâu vào, nhưng khách hàng của ScyllaDB Enterprise nhận được hỗ trợ quan trọng trong sứ mệnh 24/7 và người dùng nguồn mở có quyền truy cập vào rất nhiều tài nguyên, bao gồm tài liệu, danh sách gửi thư, Đại học Scylla và một kênh dành cho người dùng thảo luận.

Nhiệm vụ quản lý #ScyllaDB ngốn nhiều thời gian nhất là gì? Nhấp để đăng bài

21% tác vụ tốn thời gian còn lại được người dùng ScyllaDB báo cáo bao gồm giám sát, di chuyển, cung cấp, cân bằng phân đoạn, nén và vá.

Vì vậy, làm thế nào để những kết quả này so sánh với việc triển khai ScyllaDB của bạn? Bạn đang tìm cách tự động hóa các công việc quản lý tốn nhiều thời gian này? Mặc dù chúng tôi hỗ trợ Cơ sở dữ liệu MySQL, PostgreSQL, Redis ™ * và MongoDB® ngay hôm nay, nhưng chúng tôi luôn tìm kiếm phản hồi về cơ sở dữ liệu nào để bổ sung hỗ trợ tiếp theo thông qua các kế hoạch DBaaS của chúng tôi. Hãy cho chúng tôi biết trong phần nhận xét hoặc trên Twitter tại @scalegridio nếu bạn đang tìm kiếm một cách dễ dàng hơn để quản lý các cụm ScyllaDB của mình trên đám mây hoặc tại chỗ!


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Ước tính số lượng cho một vị từ trên một biểu thức COUNT

  2. Đánh giá sách:Benjamin Nevarez:Điều chỉnh &Tối ưu hóa Truy vấn

  3. Phục vụ Đồ ăn Ngon (và Dữ liệu) - Mô hình Dữ liệu cho Nhà hàng

  4. Làm thế nào để tạo cơ sở dữ liệu trong SQL?

  5. Mã hóa dữ liệu minh bạch và luôn được mã hóa