Apache Phoenix dành cho CDH:Tính năng mới tốt nhất cho DBMS
Cloudera đang áp dụng và sẽ hỗ trợ Apache Phoenix cho CDH trong khi nó tích hợp nó cho Nền tảng dữ liệu Cloudera của mình trong tương lai.
Các bản phát hành CDH của Cloudera đã bao gồm Apache HBase, cung cấp một DBMS NoSQL, có khả năng phục hồi cho các ứng dụng hoạt động của khách hàng muốn tận dụng sức mạnh của dữ liệu lớn. Các ứng dụng này đã phát triển thành các ứng dụng quan trọng có sứ mệnh và sứ mệnh thúc đẩy doanh thu hàng đầu và lợi nhuận cuối cùng. Các ứng dụng này bao gồm các ứng dụng đối mặt với khách hàng, nền tảng thương mại điện tử, phát hiện rủi ro &gian lận được sử dụng ở hậu trường tại các ngân hàng hoặc phục vụ các mô hình AI / ML cho các ứng dụng và cho phép đào tạo củng cố thêm dựa trên kết quả thực tế.
Tuy nhiên, đối với nhiều khách hàng, HBase là một hành trình quá khó khăn - đòi hỏi họ phải học hỏi
- Mô hình dữ liệu mới là HBase là một lược đồ bảng rộng hỗ trợ hàng triệu cột nhưng không có liên kết và
- Sử dụng các API Java thay vì ANSI SQL
Họ đã yêu cầu có thể sử dụng thiết kế lược đồ truyền thống hơn giống với thiết kế do Oracle hoặc MySQL cung cấp và sẵn sàng thực hiện một số đánh đổi về tính linh hoạt, ví dụ:
- Họ sẵn sàng sử dụng các loại dữ liệu được cung cấp thay vì xác định các loại dữ liệu riêng của họ
- Họ sẵn sàng từ bỏ sự linh hoạt để một cột có nhiều loại tùy thuộc vào hàng để đổi lấy một loại duy nhất trong một hàng
Để cho phép khách hàng dễ dàng tiếp cận các lợi ích khác của Apache HBase (mở rộng quy mô không giới hạn, hàng triệu hàng, tiến hóa lược đồ, v.v.) trong khi cung cấp các khả năng giống như RDBMS (ANSI SQL, các phép nối đơn giản, các kiểu dữ liệu ngoài , v.v.), chúng tôi đang giới thiệu hỗ trợ cho Apache Phoenix trên CDH.
Đối với những người khác, các ứng dụng dựa trên Phoenix cũng được hưởng lợi từ các tối ưu hóa HBase hậu trường, giúp dễ dàng đạt được hiệu suất HBase tốt hơn. Ví dụ:Phoenix thực hiện việc ướp muối các khóa chính - vì vậy người dùng HBase không cần phải suy nghĩ kỹ về khía cạnh này của thiết kế khóa.
Hơn nữa, các ứng dụng dựa trên Phoenix có thể cùng tồn tại với các ứng dụng HBase - nghĩa là bạn có thể sử dụng một cụm HBase duy nhất để hỗ trợ cả hai. Với Phoenix, khách hàng có thể tiếp tục sử dụng các công cụ BI &dashboarding yêu thích của họ giống như họ đã làm với Hive &Impala trước đây. Khi sử dụng Phoenix, họ cũng có thể chọn sử dụng trực tiếp Phoenix với các công cụ đó ngoài tùy chọn sử dụng Hive / Impala, loại bỏ một bước cho các triển khai mới.
Từ góc độ bảo mật và quản trị (SDX), trong CDH, Phoenix sử dụng HBase ACL để kiểm soát truy cập dựa trên vai trò cho các bảng Phoenix. Phoenix cũng sử dụng tích hợp HBase vào Cloudera Navigator để có thông tin kiểm tra.
Cloudera đã phát hành gói Phoenix 4.14.1 dành cho khách hàng CDH 5.16.2 và gói Phoenix 5.0 dành cho khách hàng CDH 6.2+.
Các khách hàng HDP hiện tại đã có hỗ trợ Apache Phoenix và gần một nửa số người dùng HBase sử dụng HDP hiện đang sử dụng Phoenix cũng như nói lên sự phổ biến của nó trong cộng đồng người dùng HBase.
Tải xuống Apache Phoenix cho CDH
Xây dựng các ứng dụng quan trọng bằng Apache Phoenix. Tải xuống phần mềm tại đây.
Câu hỏi thường gặp về Phoenix
Q) Khối lượng công việc mà Phoenix nên được sử dụng để làm gì
Phoenix hỗ trợ các trường hợp sử dụng tương tự như HBase, chủ yếu là khối lượng công việc có độ trễ thấp, đồng thời cao. Tuy nhiên, Phoenix làm cho việc tận dụng dữ liệu cơ bản cho các mục đích về bảng điều khiển &BI
trở nên đơn giản hơn.Q) Cơ chế ủy quyền với Phoenix là gì?
Phoenix phụ thuộc vào HBase để được ủy quyền. Đối với khách hàng CDH, điều này sử dụng HBase ACL. Đối với khách hàng HDP, điều này là thông qua tích hợp HBase-Ranger
Q) Khả năng mở rộng của Phoenix là gì? Cụm lớn nhất đã biết là gì?
Phoenix có quy mô lên đến hàng trăm TB dữ liệu. Khách hàng lớn nhất có hơn 0,5 PB dữ liệu do Phoenix quản lý. Bạn có thể tìm thấy thông tin cụ thể về các trường hợp sử dụng trong kho lưu trữ PhoenixCon và trong kho lưu trữ video ngày NoSQL đầu năm nay bằng từ ngữ và trang trình bày của chính người dùng.
Q) Phoenix có hỗ trợ lập chỉ mục phụ theo không gian địa lý không? Dữ liệu không gian hỗ trợ ở cấp độ nào?
Nó có hỗ trợ hạn chế cho dữ liệu không gian địa lý. Tuy nhiên, GeoMesa cung cấp một lớp không gian địa lý trên HBase có thể hỗ trợ nhu cầu này và tích hợp với các ứng dụng của khách hàng. Phoenix, GeoMesa cũng như JanusGraph và OpenTSDB đều có thể cùng tồn tại trong một cụm HBase duy nhất.
Q) Làm cách nào để bạn tạo và sử dụng Chỉ mục?
Xem trang Lập chỉ mục phụ của Phoenix để biết chi tiết về lập chỉ mục. Từ Phoenix 4.8.0 trở đi, không cần thay đổi cấu hình để sử dụng lập chỉ mục cục bộ.
Q) Có giới hạn về số cột bạn có thể đặt trên chỉ mục không?
Giống như trong RDBMS, chỉ mục về cơ bản là một bảng riêng biệt với chỉ mục và liên kết đến dữ liệu nguồn. Nếu bạn lập chỉ mục tất cả các cột, bạn sẽ đánh bại mục đích bằng cách duy trì hai bảng giống hệt nhau. Chỉ mục nên được sử dụng một cách thận trọng vì có một số chi phí không nhỏ khi ghi (chỉ mục chung) hoặc đọc (chỉ mục cục bộ).