MongoDB
 sql >> Cơ Sở Dữ Liệu >  >> NoSQL >> MongoDB

Sáu thành phần quan trọng của quản trị dữ liệu thành công

Quản trị dữ liệu là gì?

Đối với các tổ chức hoặc công ty lớn tham gia quản lý dữ liệu, quản trị dữ liệu sở hữu chìa khóa thành công trong việc quản lý, kiểm soát hoặc quản lý dữ liệu đã được sở hữu hoặc thu thập. Nó là cơ bản cho bất kỳ tổ chức hoặc công ty. Doanh nghiệp của bạn được hưởng lợi từ các quy trình và trách nhiệm nhất quán, chung nếu chiến lược quản trị dữ liệu của bạn hoạt động theo đúng kế hoạch. Các trình điều khiển kinh doanh của bạn sẽ nêu bật dữ liệu nào cần được kiểm soát cẩn thận trong chiến lược quản trị dữ liệu của bạn, vì kết quả sẽ tuân theo những lợi ích mong đợi của nỗ lực này. Chiến lược này sẽ là cơ sở của chương trình hoặc khuôn khổ quản trị dữ liệu của bạn.

Quản trị dữ liệu xác định một loạt các nguyên tắc để đảm bảo chất lượng dữ liệu trong một công ty. Nó mô tả chung các quy trình, vai trò, chính sách hoặc trách nhiệm và các chỉ số để đảm bảo trách nhiệm giải trình và quyền sở hữu tài sản dữ liệu trong toàn doanh nghiệp.

Quản trị dữ liệu là chìa khóa để đạt được các mục tiêu của tổ chức, đặc biệt là ở cấp độ doanh nghiệp. Nó xác định ai có thể thực hiện hành động nào, dựa trên dữ liệu nào, trong những tình huống nào, sử dụng những phương pháp nào. Tóm lại, quản trị dữ liệu là gì, là về các tiêu chuẩn, chính sách và cách nó có thể được tái sử dụng dựa trên các mô hình của nó. Phạm vi tổng thể của nó bao gồm hệ thống quyền quyết định và trách nhiệm giải trình đối với các quá trình liên quan đến thông tin, được thực hiện theo các mô hình đã thỏa thuận, mô tả ai có thể thực hiện các hành động với thông tin nào và khi nào, trong hoàn cảnh nào, sử dụng các phương pháp nào.

Trong một ví dụ nhất định, hãy xem xét những tổ chức tham gia bảo hiểm y tế hoặc các tổ chức hoặc công ty liên quan đến sức khỏe. Quyền riêng tư của dữ liệu là rất quan trọng và phải tuân thủ các quy định pháp luật như HIPAA hoặc GDPR. Nếu yếu tố thúc đẩy kinh doanh của bạn cho chiến lược quản trị dữ liệu của bạn đảm bảo quyền riêng tư, thì dữ liệu bệnh nhân sẽ cần được quản lý an toàn khi nó chảy qua doanh nghiệp của bạn. Các yêu cầu lưu giữ (ví dụ:lịch sử ai đã thay đổi thông tin nào và khi nào) sẽ được xác định để đảm bảo tuân thủ các yêu cầu liên quan của chính phủ.

Các Thành phần Quan trọng của Quản trị Dữ liệu Thành công

Quản trị dữ liệu và phân tích tốt cho phép đưa ra quyết định nhanh hơn, thông minh hơn. Các nhà lãnh đạo dữ liệu và phân tích, bao gồm Giám đốc Dữ liệu (CDO), phải đảm bảo dữ liệu và tài sản phân tích của họ được quản lý tốt để thực hiện chiến lược kinh doanh và các ưu tiên của doanh nghiệp. Quản trị dữ liệu được xử lý tốt cung cấp những hiểu biết cần thiết để đưa ra các quyết định kinh doanh tối ưu. Với tất cả những điều này, các yếu tố quan trọng đóng vai trò là thành phần quan trọng quyết định sự thành công trong quản trị dữ liệu.

Trong blog này, chúng tôi sẽ trình bày năm thành phần quan trọng của việc quản trị dữ liệu thành công.

Kiến trúc Dữ liệu

Kiến trúc dữ liệu đóng vai trò là trái tim và linh hồn của quản trị dữ liệu. Nếu sai sót trong thiết kế kiến ​​trúc, chất lượng dữ liệu sẽ kém hoặc bị hỏng về bản chất. Bất kỳ thứ gì đã được phân tích và xử lý, kết quả không thể đáng tin cậy và có thể ảnh hưởng đến thông tin chi tiết được doanh nghiệp phân tích và ảnh hưởng đến mục tiêu kinh doanh.

Theo Khuôn khổ Kiến trúc Nhóm Mở (TOGAF), Kiến trúc Dữ liệu mô tả cấu trúc của các tài nguyên dữ liệu vật lý và logic của một tổ chức và các tài nguyên quản lý dữ liệu. Nó là một nhánh của kiến ​​trúc doanh nghiệp bao gồm các mô hình, chính sách, quy tắc và tiêu chuẩn chi phối việc thu thập, lưu trữ, sắp xếp, tích hợp và sử dụng dữ liệu trong tổ chức. Kiến trúc dữ liệu của một tổ chức là tầm nhìn của các kiến ​​trúc sư dữ liệu.

Kiến trúc Dữ liệu làm sáng tỏ bí ẩn giữa một loạt các thành phần được quản trị dữ liệu bao phủ. Nó kết nối một cách có hệ thống tất cả các thành phần liên quan khi dữ liệu đang được xử lý trong một tổ chức hoặc thực thể doanh nghiệp. Nó chỉ đơn giản là giải thích nơi dữ liệu tồn tại và cách nó di chuyển trong tổ chức (dữ liệu riêng tư hoặc dữ liệu đi ra và nhập vào) và hệ thống của nó. Nó làm nổi bật những thay đổi và chuyển đổi được thực hiện khi dữ liệu di chuyển từ hệ thống này sang hệ thống tiếp theo.

Các sơ đồ luồng dữ liệu và kho dữ liệu này cung cấp thông tin và công cụ mà Nhóm quản trị dữ liệu (DGT) cần để đưa ra quyết định về các chính sách và tiêu chuẩn dữ liệu một cách chính xác. Trên thực tế, trong nhiều trường hợp, các bên liên quan của doanh nghiệp nói rằng họ muốn hiểu rõ hơn về bối cảnh dữ liệu và cách nó di chuyển trong tổ chức. Vai trò của DGT trong việc giáo dục tổ chức về thông tin này và phủ lên thông tin đó bằng các chính sách và tiêu chuẩn kiến ​​trúc giúp đảm bảo tính chính xác và tính toàn vẹn của dữ liệu trong suốt vòng đời của nó.

Chất lượng Dữ liệu

Chất lượng dữ liệu của bạn phản ánh về cách nó được thu thập, lập kế hoạch, phân tích và xử lý. Theo Gartner, Bốn mươi hai phần trăm các nhà lãnh đạo dữ liệu và phân tích không đánh giá, đo lường hoặc giám sát việc quản trị dữ liệu và phân tích của họ dựa trên một cuộc khảo sát của Gartner. Trong khi những người cho biết họ đo lường hoạt động quản trị của mình chủ yếu tập trung vào việc đạt được các mục tiêu theo định hướng tuân thủ.

Quản trị dữ liệu thúc đẩy tổ chức hoặc công ty đưa ra các quyết định nhanh hơn và thông minh hơn với dữ liệu và phân tích phù hợp. Khi quản trị dữ liệu ngày càng được cải thiện nhanh chóng, các tổ chức đang bắt đầu xem xét vấn đề này vì đây là một khởi đầu tốt để bắt đầu tập trung vào dữ liệu và phân tích để giúp cải thiện chất lượng dữ liệu của họ khi dữ liệu phát triển. Nó cung cấp thông tin tốt hơn để thúc đẩy các hành vi thông tin tốt hơn thông qua các chính sách của họ. Các chính sách này giúp tối đa hóa khoản đầu tư mà các tổ chức có vào dữ liệu và phân tích và nội dung, đó là đa phương tiện, email doanh nghiệp, v.v. Tuy nhiên, các thực tiễn quản trị vẫn tiếp tục theo định hướng dữ liệu hơn là định hướng kinh doanh.

Vì quản trị dữ liệu giám sát chất lượng của dữ liệu, DGT sẽ xác định khi nào dữ liệu bị hỏng, cũ hoặc không chính xác. Dữ liệu cũ hoặc cũ có thể được lưu trữ hoặc xóa nếu không còn cần thiết. Chất lượng của dữ liệu không phải là yếu tố duy nhất phải được duy trì mà còn phải xem xét chi phí, và nên cân nhắc để dọn dẹp tủ của một người và tránh bất kỳ sự lộn xộn nào với dữ liệu được nhắm mục tiêu của bạn. Nhóm quản trị dữ liệu của bạn phải có khả năng thiết lập các quy tắc và quy trình một cách dễ dàng. Dữ liệu đáng tin cậy của bạn sẽ là trụ cột cho các tổ chức dựa trên dữ liệu đưa ra quyết định dựa trên thông tin từ nhiều nguồn khác nhau. Báo cáo của Dataversity cho biết 58% các tổ chức tham gia cuộc khảo sát của họ nói rằng việc hiểu chất lượng dữ liệu nguồn là một trong những điểm nghẽn nghiêm trọng nhất trong chuỗi giá trị dữ liệu của tổ chức họ. Cần lưu ý rằng dựa trên khảo sát của họ, việc tự động hóa và đối sánh các điều khoản kinh doanh với nội dung dữ liệu và lập hồ sơ xuống cấp cột là các bước quan trọng để tối ưu hóa chất lượng dữ liệu.

Quản lý Dữ liệu

Đây là lúc bạn phải hỏi những câu hỏi quan trọng này, dữ liệu nào cần quản lý và dữ liệu đó sẽ nằm ở đâu? Nó có cần phải lưu trữ tại chỗ hay sẽ có giá trị và hợp lệ nếu dữ liệu nằm trên một bên thứ ba, chẳng hạn như đám mây công cộng.

Quản lý dữ liệu về cơ bản là thực hiện chiến lược quản trị dữ liệu. Nó đặt ra trách nhiệm thực hiện các tiêu chuẩn và chính sách mà chiến lược hoặc khuôn khổ quản trị dữ liệu đã được xây dựng. Nó bao gồm các nhiệm vụ phổ biến như

  • Tạo quy tắc Truy cập Dựa trên Vai trò (RBAC) đặt cấp độ truy cập cho dữ liệu

  • Triển khai các quy tắc cơ sở dữ liệu phù hợp với chính sách quản trị dữ liệu

  • Thiết lập và duy trì bảo mật dữ liệu] để tuân thủ những gì DGT của CDO đã xác định cho dữ liệu thuộc sở hữu của tổ chức

  • Thực hiện các biện pháp thích hợp để giảm thiểu rủi ro liên quan đến việc lưu trữ dữ liệu nhạy cảm

  • Tạo hệ thống quản lý dữ liệu tổng thể, là một chế độ xem dữ liệu duy nhất trong toàn doanh nghiệp.

Quản lý dữ liệu là chìa khóa để thực hiện loại kiểm kê dữ liệu này:Có chiến lược và phương pháp để truy cập, tích hợp, lưu trữ, truyền và chuẩn bị dữ liệu cho phân tích. Theo Forrester Research, quản trị dữ liệu hiệu quả phát triển sau thời gian trưởng thành của quản lý dữ liệu.

Công cụ Phần mềm Dữ liệu

Quản trị dữ liệu bao gồm các quy trình quản lý vòng đời dữ liệu. Nó nhằm mục đích đảm bảo tính sẵn có, khả năng sử dụng và tính toàn vẹn của dữ liệu. Trong khi những điều này được duy trì, DGT và CDO phải liên tục theo dõi và phân tích dữ liệu của tổ chức. Nó phải được chăm sóc đúng cách và được lưu giữ một cách an toàn và bảo mật. Điều này không thể đạt được nếu không có các công cụ phần mềm thích hợp dựa vào các giải pháp sẵn có được sử dụng. Nó có thể dựa vào các dịch vụ của bên thứ ba, đặc biệt là khi nó được lưu trữ trên đám mây hoặc tại chỗ.

Các giải pháp này giúp các tổ chức duy trì một bộ chính sách, quy trình và chủ sở hữu nhất quán xung quanh nội dung dữ liệu của họ, cho phép họ theo dõi, quản lý và kiểm soát việc di chuyển dữ liệu một cách hiệu quả. Các sản phẩm này giúp người dùng thiết lập các nguyên tắc, quy tắc và các biện pháp trách nhiệm để đảm bảo đáp ứng các tiêu chuẩn chất lượng dữ liệu. Các công cụ quản trị dữ liệu thường cũng sẽ cung cấp các đề xuất để tăng hiệu quả và hợp lý hóa các quy trình.

Bảo mật

Trong bài viết trước của chúng tôi, trong số vô số các mối đe dọa phần mềm độc hại ảnh hưởng đến doanh nghiệp, ransomware là kẻ vi phạm lớn nhất, khiến các tổ chức thiệt hại hơn 7,5 tỷ đô la chỉ trong năm 2019. Hãy tưởng tượng những vi phạm bảo mật nghiêm trọng có thể làm xấu đi kế hoạch tổ chức của bạn để xây dựng một doanh nghiệp phát triển mạnh mẽ như thế nào.

Quản trị dữ liệu là rất quan trọng vì CDO hoặc DGT phải phân tích kỹ lưỡng và che đậy những dữ liệu bí mật đó. Nếu bảo mật dữ liệu được cấu trúc một cách có hệ thống, thì nó cũng có thể theo dõi được tương tự như việc quản lý dữ liệu thành công. Nó có thể xác định dữ liệu của bạn đến từ đâu, ở đâu, ai có quyền truy cập, cách sử dụng và cách xóa dữ liệu.

Quản trị dữ liệu xác định các quy tắc và thủ tục quản lý dữ liệu tổ chức của bạn, ngăn chặn khả năng rò rỉ thông tin doanh nghiệp nhạy cảm hoặc dữ liệu khách hàng để dữ liệu không bị rơi vào tay kẻ xấu. Khi dữ liệu phát triển, nó có thể là một thách thức thuần túy.

Đối với các nền tảng kế thừa và các tổ chức lớn hơn với dữ liệu phong phú, các nền tảng kế thừa có xu hướng tạo ra thông tin ẩn khó xác định nguồn gốc của nó. Các silo đó thường được xuất, chủ yếu là vào cơ sở dữ liệu của bạn và được sao chép để kết hợp dữ liệu với các dữ liệu được lưu khác, khiến việc biết tất cả dữ liệu đã đi đâu càng khó hơn.

Tuân thủ

Quản trị và tuân thủ dữ liệu hoạt động song song với nhau. Trong báo cáo của Dataversity, 48% công ty xếp hạng việc tuân thủ quy định là động lực chính để quản trị dữ liệu. Nếu không có quản trị dữ liệu phù hợp, làm sao bạn có thể tự tin rằng tổ chức của mình đang tuân thủ các quy định?

Dữ liệu trưởng thành nhanh chóng, đặc biệt là khi đại dịch này bắt đầu; mọi người phụ thuộc quá nhiều vào phương tiện truyền thông xã hội và các phương tiện khác qua internet để tránh tiếp xúc với người khác. Dữ liệu phát triển rất nhiều và điều đó có nghĩa là việc tuân thủ dữ liệu phải được giải quyết trước và được quan tâm tốt bởi các tổ chức hoặc công ty nắm giữ thông tin và dữ liệu nhạy cảm của bạn. Các tổ chức phải tuân thủ các quy định trong chính phủ của họ. Theo Liên minh Châu Âu, bạn có GDPR (Quy định chung về bảo vệ dữ liệu), trong khi ở Hoa Kỳ, bạn có PCI DSS (Tiêu chuẩn bảo mật dữ liệu ngành thẻ thanh toán), HIPAA (Đạo luật về trách nhiệm giải trình và cung cấp bảo hiểm y tế) và SOX ACT hoặc Sarbanes – Đạo luậtOxley năm 2002 (còn được gọi là Đạo luật Cải cách Kế toán Công ty Đại chúng và Bảo vệ Nhà đầu tư).

Tuân thủ là rất quan trọng để quản trị thành công vì chiến lược này phải được áp dụng trước khi thu thập và hoàn thiện dữ liệu trong tổ chức. Tuân thủ hướng tổ chức bắt đầu theo các quy định và tuân thủ trong chính phủ, mà khuôn khổ quản trị dữ liệu của bạn đã bao gồm. Các quy định này yêu cầu các tổ chức phải có khả năng theo dõi dữ liệu của họ từ nguồn cho đến khi lỗi thời, xác định ai có quyền truy cập vào nó, cũng như biết cách thức và nơi sử dụng nó. Quản trị dữ liệu đặt ra các quy tắc và thủ tục xung quanh quyền sở hữu và khả năng truy cập dữ liệu.

Khung quản trị dữ liệu của bạn đảm bảo rằng dữ liệu của bạn phù hợp với mục đích của nó. Bằng cách sắp xếp con người, quy trình và công nghệ của tổ chức bạn theo chiến lược dữ liệu trung tâm, bạn có thể bắt đầu tận dụng dữ liệu của mình để mang lại lợi ích cho các mục tiêu kinh doanh lớn hơn. Về mặt tuân thủ, việc có các quy trình kiểm soát rõ ràng đối với dữ liệu của bạn phù hợp với các quy tắc kinh doanh đặt trước. Điều này đặc biệt quan trọng trong các ngành được quản lý cao như tài chính và bảo hiểm. Quản trị dữ liệu có nghĩa là đảm bảo bạn có sẵn các quy trình để kiểm soát dữ liệu của mình và đảm bảo rằng tất cả các quy định được đáp ứng trong tất cả các thông lệ về dữ liệu của tổ chức bạn. Việc tuân thủ hiệu quả chỉ có thể đi kèm với cách tiếp cận toàn diện và đầy đủ đối với chiến lược quản trị dữ liệu của bạn. Làm sao bạn có thể chắc chắn 100% rằng bạn đang tuân thủ các quy định mà không có toàn quyền kiểm soát đối với dữ liệu của bạn và cách dữ liệu đó được thu thập và lưu trữ. Nếu không có nó, thông tin nhạy cảm có thể lọt vào tay kẻ xấu hoặc bị chuyển đi không đúng cách, dẫn đến các hình phạt tài chính của chính phủ hoặc cơ quan quản lý, các vụ kiện và thậm chí là ngồi tù. Snowflake cung cấp các tính năng có thể thiết lập các kiểm soát về quyền sở hữu và truy cập dữ liệu, cho phép thực hiện các quy tắc và thủ tục quản lý dữ liệu. Chúng bao gồm Mặt nạ dữ liệu động và Chế độ xem an toàn.

Ba khía cạnh quan trọng của việc xây dựng chiến lược quản trị dữ liệu hiệu quả là con người, quy trình và công nghệ. Với một chiến lược hiệu quả, bạn không chỉ có thể đảm bảo rằng tổ chức của mình vẫn tuân thủ mà còn có thể gia tăng giá trị cho chiến lược kinh doanh tổng thể của mình.

Kết luận

Quản trị dữ liệu không phải là một dòng chảy cố định và liên tục. Đó là một quy ước và thực hành phải là một công việc đang được tiến hành một cách năng động. Quản trị dữ liệu dựa vào cách dữ liệu trưởng thành trong tổ chức hoặc công ty, đặc biệt là việc được sử dụng ở cấp doanh nghiệp. Điều quan trọng đối với các tổ chức là coi trọng dữ liệu của mình hoặc dữ liệu đóng vai trò là động lực chính cho lợi ích của tổ chức để ổn định hoạt động tài chính của tổ chức đó. Việc xác định 6 thành phần quan trọng này là điều bắt buộc và phải giao cho người phù hợp để quản lý và đảm bảo lợi ích của tổ chức và công ty.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Làm thế nào để thực hiện các hoạt động mongodb thô trong mongoose?

  2. Hiểu về giới hạn kích thước tài liệu MongoDB BSON

  3. 2 cách để có được kích thước tài liệu trong MongoDB

  4. Tìm và Đếm các phần tử của bộ sưu tập với Mongoose

  5. Mongoose Mongodb truy vấn một mảng đối tượng