HBase
 sql >> Cơ Sở Dữ Liệu >  >> NoSQL >> HBase

Tìm hiểu Tính năng sẵn có cao của Hadoop

Blog này cung cấp cho bạn mô tả về Hadoop Tính năng sẵn sàng cao HDFS. Trong blog này, trước hết chúng ta sẽ thảo luận về tính khả dụng cao chính xác là gì, Hadoop đạt được tính khả dụng cao như thế nào, nhu cầu của tính năng sẵn có cao HDFS là gì.

Chúng tôi cũng sẽ đề cập đến ví dụ về tính năng sẵn có cao của Hadoop trong hướng dẫn về Hadoop dữ liệu lớn này.

Tính khả dụng cao của Hadoop HDFS là gì?

Hadoop HDFS là một hệ thống tệp phân tán. HDFS phân phối dữ liệu giữa các nút trong cụm Hadoop bằng cách tạo một bản sao của tệp. Khung Hadoop lưu trữ các bản sao của các tệp này trên các máy khác có trong cụm.

Vì vậy, khi một máy khách HDFS muốn truy cập dữ liệu của mình, anh ta có thể dễ dàng truy cập dữ liệu đó từ một số máy có mặt trong cụm. Dữ liệu có sẵn dễ dàng trong nút gần nhất trong cụm.

Tại một số điều kiện không thuận lợi như sự cố của một nút, máy khách có thể dễ dàng truy cập dữ liệu của họ từ các nút khác. Tính năng này của Hadoop được gọi là Tính khả dụng cao .

Làm thế nào để đạt được Tính khả dụng cao trong Hadoop?

Trong cụm HDFS, có một số Mã dữ liệu . Sau một khoảng thời gian xác định, tất cả các DataNode này sẽ gửi thông báo nhịp tim đến NameNode . Nếu NameNode ngừng nhận thông báo về nhịp tim từ bất kỳ DataNode nào trong số này, thì nó giả định rằng nó đã chết.

Sau đó, nó kiểm tra dữ liệu có trong các nút đó và sau đó đưa ra lệnh cho nút dữ liệu khác để tạo bản sao của dữ liệu đó cho các nút dữ liệu khác. Do đó, dữ liệu luôn có sẵn.

Khi một máy khách yêu cầu truy cập dữ liệu trong HDFS, trước hết, NameNode sẽ tìm kiếm dữ liệu trong các nút dữ liệu đó, trong đó dữ liệu sẽ nhanh chóng có sẵn. Và sau đó cung cấp quyền truy cập vào dữ liệu đó cho khách hàng.

Khách hàng không phải tìm kiếm dữ liệu trong tất cả các nút dữ liệu. Bản thân nút tên HDFS giúp khách hàng dễ dàng cung cấp dữ liệu bằng cách cung cấp địa chỉ của nút dữ liệu mà từ đó người dùng có thể đọc trực tiếp.

Ví dụ về Tính khả dụng cao của Hadoop

Hadoop HDFS cung cấp dữ liệu sẵn có cao. Khi máy khách yêu cầu NameNode để truy cập dữ liệu, thì NameNode sẽ tìm kiếm tất cả các nút có sẵn dữ liệu đó.

Sau đó, nó cung cấp quyền truy cập vào dữ liệu đó cho người dùng từ nút mà dữ liệu đã có sẵn nhanh chóng. người dùng đến nút khác có cùng dữ liệu.

Không có bất kỳ sự gián đoạn nào, dữ liệu được cung cấp cho người dùng. Vì vậy, trong điều kiện nút bị hỏng, dữ liệu cũng có sẵn cho người dùng.

Các vấn đề trong hệ thống cũ là gì?

  • Dữ liệu không có sẵn do sự cố máy.
  • Ứng dụng khách HDFS phải đợi một khoảng thời gian dài để truy cập dữ liệu của họ. Hầu hết thời gian người dùng phải đợi trong một khoảng thời gian cụ thể cho đến khi trang web hoạt động.
  • Các chức năng và tính năng hạn chế.
  • Do không có dữ liệu, việc hoàn thành nhiều dự án lớn tại các tổ chức sẽ bị kéo dài trong một thời gian dài và do đó các công ty phải trải qua những tình huống nguy cấp.

Kết luận

Do đó, dữ liệu Trong Hadoop rất sẵn có và có thể truy cập được mặc dù bị lỗi phần cứng do nhiều bản sao dữ liệu. Vì vậy, nếu bất kỳ nút hoặc máy móc nào gặp sự cố hoặc gặp sự cố, dữ liệu chúng ta có thể truy cập dữ liệu từ một đường dẫn khác. Tìm hiểu thêm các Tính năng của HDFS.

Nếu bạn thấy blog này hữu ích về Tính khả dụng cao của Hadoop, vì vậy hãy chia sẻ suy nghĩ của bạn trong phần bình luận.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Tách và hợp nhất vùng Apache HBase

  2. Tìm hiểu Tính năng sẵn có cao của Hadoop

  3. Khối dữ liệu HDFS - Tìm hiểu nội dung bên trong của Big Data Hadoop

  4. Đưa hỗ trợ giao dịch vào Cơ sở dữ liệu hoạt động của Cloudera

  5. Cách thực hiện:Sử dụng Giao diện Tiết kiệm HBase, Phần 1