Database
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Database

Hướng dẫn SSIS cho người mới bắt đầu:Tại sao, Cái gì và Bằng cách nào?

Dịch vụ Tích hợp Máy chủ SQL (SSIS) là một phần không thể thiếu của phần mềm Cơ sở dữ liệu Microsoft SQL Server. Điều này làm cho công việc quản lý dữ liệu dễ dàng hơn rất nhiều với các tính năng khác nhau của nó. Trong hướng dẫn này, chúng ta sẽ tìm hiểu sâu hơn về SSIS ở cấp độ khái niệm, theo thứ tự sau:

  • Tích hợp dữ liệu là gì?
  • Tại sao nên sử dụng SSIS?
  • SSIS là gì?
  • Các tính năng của SSIS
  • Cách thức hoạt động của SSIS?
    • Quy trình ETL
    • Kho dữ liệu
  • Yêu cầu đối với dịch vụ tích hợp máy chủ SQL
    • Cài đặt SQL Server
    • Cài đặt Công cụ Dữ liệu Máy chủ SQL
  • Gói SSIS là gì?

Hãy bắt đầu.

Tích hợp dữ liệu là gì?

Tích hợp dữ liệu là một quá trình trong đó dữ liệu không đồng nhất được truy xuất và kết hợp dưới dạng cấu trúc và biểu mẫu hợp nhất. Ví dụ, mọi công ty ngày nay đều phải xử lý một lượng lớn dữ liệu từ nhiều nguồn khác nhau. Dữ liệu này cần được xử lý để cung cấp thông tin sâu sắc cho việc đưa ra các quyết định kinh doanh. Vì vậy, một giải pháp đơn giản sẽ là Tích hợp dữ liệu. Về cơ bản, nó sẽ tích hợp tất cả dữ liệu của bạn hiện có trong các cơ sở dữ liệu khác nhau và kết hợp chúng trên cùng một nền tảng.

Dưới đây là một số cách để đạt được Tích hợp dữ liệu:

Bây giờ bạn đã hiểu về tích hợp dữ liệu, hãy xem lý do tại sao SSIS được sử dụng. SSIS là viết tắt của SQL Server Integration Services.

Tại sao sử dụng SSIS?

  • Dữ liệu có thể được tải song song đến nhiều đích khác nhau
  • SSIS loại bỏ nhu cầu của các lập trình viên chuyên nghiệp
  • Tích hợp chặt chẽ với các sản phẩm khác của Microsoft
  • SSIS rẻ hơn hầu hết các Công cụ ETL khác
  • SIS cung cấp GUI để dễ dàng chuyển đổi dữ liệu
  • Xây dựng BI thành một quá trình chuyển đổi dữ liệu
  • Xử lý lỗi và sự kiện mạnh mẽ

Tiếp tục trong Hướng dẫn SSIS này, hãy xem chính xác nó là gì và nó hoạt động như thế nào.

SSIS là gì?

Dịch vụ tích hợp máy chủ SQL (SSIS) là một thành phần của phần mềm cơ sở dữ liệu Microsoft SQL Server có thể được sử dụng để thực hiện nhiều tác vụ tích hợp dữ liệu và chuyển đổi dữ liệu.

  • Tích hợp Dữ liệu: Nó kết hợp dữ liệu ở các nguồn khác nhau và cung cấp cho người dùng cái nhìn thống nhất về những dữ liệu này
  • Quy trình làm việc: Nó cũng có thể được sử dụng để tự động bảo trì cơ sở dữ liệu SQL Server và cập nhật dữ liệu phân tích đa chiều

Tính năng của SSIS

Một số tính năng để sử dụng SSIS là:

  • Các phép biến đổi có tổ chức và tra cứu
  • Tích hợp chặt chẽ với họ Microsoft SQL khác
  • Cung cấp Môi trường Studio phong phú
  • Cung cấp nhiều chức năng tích hợp dữ liệu để chuyển đổi tốt hơn
  • Kết nối dữ liệu tốc độ cao

Bạn có thể xem qua video dưới đây bao gồm tất cả các khái niệm cơ bản bao gồm các khái niệm về kho dữ liệu được sử dụng để trích xuất, chuyển đổi và tải dữ liệu (ETL). Nó lý tưởng cho cả người mới bắt đầu và những người chuyên nghiệp muốn tìm hiểu những kiến ​​thức cơ bản về MSBI.

Tiếp tục trong phần hướng dẫn SSIS, hãy xem nó hoạt động chính xác như thế nào.

SSIS hoạt động như thế nào?

SSIS bao gồm ba thành phần chính, đó là:

  • Dữ liệu hoạt động
  • Quy trình ETL
  • Kho dữ liệu

Các tác vụ chuyển đổi dữ liệu và tạo quy trình làm việc này được thực hiện bằng cách sử dụng ‘Gói SSIS’, sẽ được thảo luận sau trong blog này. Tiếp tục với hướng dẫn SSIS, trước tiên chúng ta hãy hiểu chi tiết từng thành phần sau:

Dữ liệu hoạt động

Kho dữ liệu hoạt động (ODS) là cơ sở dữ liệu được thiết kế để tích hợp dữ liệu từ nhiều nguồn cho các hoạt động bổ sung trên dữ liệu. Đây là nơi chứa hầu hết dữ liệu được sử dụng trong hoạt động hiện tại trước khi được chuyển vào kho dữ liệu để lưu trữ hoặc lưu trữ lâu dài hơn.

Quy trình ETL

ETL là một quá trình để trích xuất, biến đổi và tải dữ liệu. Trích xuất, chuyển đổi và tải (ETL) là quá trình trích xuất dữ liệu từ nhiều nguồn khác nhau, chuyển đổi dữ liệu này để đáp ứng yêu cầu của bạn và sau đó tải vào kho dữ liệu đích. ETL cung cấp GIẢI PHÁP DỪNG LẠI cho tất cả những vấn đề này.

  • Trích xuất
  • Chuyển đổi
  • Tải

Trích xuất: Trích xuất là quá trình trích xuất dữ liệu từ các nguồn dữ liệu đồng nhất hoặc không đồng nhất khác nhau dựa trên các điểm xác nhận khác nhau.

Chuyển đổi: Trong quá trình chuyển đổi, toàn bộ dữ liệu được phân tích và các chức năng khác nhau được áp dụng trên đó để tải dữ liệu vào cơ sở dữ liệu đích ở định dạng chung và được làm sạch.

Tải: Đang tải là quá trình tải dữ liệu đã xử lý vào kho dữ liệu đích bằng cách sử dụng tài nguyên tối thiểu.


Kho dữ liệu

  • Datawarehouse thu thập dữ liệu từ nhiều nguồn khác nhau để phân tích và truy cập hữu ích.
  • Datawarehousing là một tập hợp lớn dữ liệu được tích lũy được sử dụng để tập hợp và quản lý dữ liệu từ nhiều nguồn khác nhau nhằm mục đích trả lời các câu hỏi kinh doanh. Do đó, giúp đưa ra quyết định.

Yêu cầu đối với dịch vụ tích hợp máy chủ SQL

Để làm việc với SSIS, bạn phải cài đặt những thứ sau:

  • Máy chủ SQL
  • Công cụ Dữ liệu Máy chủ SQL

Hãy xem quá trình cài đặt.

Cài đặt SQL Server

Truy cập trang web:https://www.microsoft.com/en-au/sql-server/sql-server-downloads để cài đặt SQL Server. Bạn có thể cài đặt phiên bản mới nhất hoặc phiên bản trước tùy theo sự lựa chọn của bạn.

Vì vậy, có các phiên bản SQL Server khác nhau, cụ thể là:

    • Bản dùng thử miễn phí: Bạn nhận được bản dùng thử miễn phí 180 ngày của SQL Server 2017 trên Windows.
    • Ấn bản dành cho Nhà phát triển: Đây là phiên bản miễn phí đầy đủ tính năng, được cấp phép để sử dụng làm cơ sở dữ liệu phát triển và thử nghiệm trong môi trường phi sản xuất.
    • Phiên bản Express: Express là phiên bản miễn phí của SQL Server, lý tưởng để phát triển và sản xuất cho các ứng dụng máy tính để bàn, web và máy chủ nhỏ.

Tiếp theo, hãy xem cách cài đặt các công cụ dữ liệu.

Công cụ dữ liệu máy chủ SQL

Truy cập trang web:https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server -ver15 và kiểm tra các bản phát hành khác nhau do Microsoft cung cấp. Tham khảo ảnh chụp màn hình bên dưới với bản phát hành SSDT gần đây cùng với liên kết tải xuống.

Trong hướng dẫn này, tôi sẽ cài đặt phiên bản 15.9.1. Vậy hãy bắt đầu.

Bước 1: Khi bạn mở tệp .exe, bạn sẽ được yêu cầu khởi động lại hệ thống trước khi cài đặt.

Bước 2: Khi bạn đã khởi động lại hệ thống của mình, bạn đã sẵn sàng. Chỉ cần nhấp vào nút “Tiếp theo” và làm theo hướng dẫn trên màn hình.

Bước 3: Nó sẽ hiển thị các công cụ cần thiết và các tính năng như Cơ sở dữ liệu SQL Server, SSAS, SSRS và SSIS. Đảm bảo rằng bạn kiểm tra tất cả chúng và nhấp vào nút “cài đặt”. Tham khảo ảnh chụp màn hình dưới đây để biết điều tương tự.

Tiếp theo trong Hướng dẫn SSIS, chúng ta sẽ thảo luận về gói SSIS và cách bạn có thể tạo nó bằng các công cụ trên.

Gói SSIS là gì?

Gói là một khối cơ bản nơi bạn tiếp tục và viết mã trong SSIS. Bây giờ “mã” không dùng để chỉ bất kỳ ngôn ngữ lập trình nào, đó là sự phát triển của bạn. Vì vậy, về cơ bản sự phát triển của bạn được thực hiện bên trong một gói. Như đã thảo luận ở trên, SSIS là cần thiết cho ETL và gói SSIS sẽ thực hiện quy trình ETL. Do đó, nó là một đối tượng triển khai chức năng Dịch vụ tích hợp để trích xuất, chuyển đổi và tải dữ liệu . Một gói bao gồm:

  • Kết nối
  • Kiểm soát các phần tử luồng
  • Phần tử luồng dữ liệu

Đó là tất cả cho Hướng dẫn SSIS này. Tôi hy vọng bạn đã thích đọc nó.

Điều này đưa chúng ta đến phần cuối của blog này. Tôi hy vọng bạn thích blog hướng dẫn Power BI này. Đây là blog đầu tiên của loạt Power BI. Hướng dẫn Power BI này sẽ được tiếp nối bởi blog tiếp theo của tôi, sẽ tập trung vào Bảng điều khiển Power BI, bạn cũng nên đọc.

Nếu bạn muốn tìm hiểu SSIS và xây dựng sự nghiệp trong trực quan hóa dữ liệu hoặc BI, thì hãy xem Chứng chỉ đào tạo MSBI của chúng tôi đi kèm với đào tạo trực tiếp do người hướng dẫn và trải nghiệm dự án thực tế. Khóa đào tạo này sẽ giúp bạn hiểu sâu về MSBI và giúp bạn đạt được thành thạo về chủ đề này.

Bạn có một câu hỏi cho chúng tôi? Vui lòng đề cập đến vấn đề này trong phần nhận xét của “Hướng dẫn SSIS” và chúng tôi sẽ liên hệ lại với bạn.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Huyền thoại về hiệu suất:Quá kích thước cột chuỗi

  2. Cách tải và quản lý dữ liệu trong Microsoft Power BI

  3. Khớp Cung với Cầu - Giải pháp, Phần 3

  4. Đừng chỉ tạo ra những chỉ mục bị thiếu một cách mù quáng!

  5. SQL Right Join