Sao chép dữ liệu có nghĩa là sao chép dữ liệu từ nơi này sang nơi khác và thường được thực hiện giữa những người sử dụng cơ sở dữ liệu khác nhau, những người cần chia sẻ cùng một mức thông tin. Việc sao chép cũng có thể liên quan đến các nguồn và mục tiêu dữ liệu khác, đồng thời trở nên phức tạp hơn trong điều kiện chuyển đổi và thời gian.
Đây là bài viết đầu tiên trong số hai bài viết về sao chép cơ sở dữ liệu trong IRI Workbench GUI. IRI Workbench là IDE miễn phí được xây dựng trên Eclipse ™ hỗ trợ tất cả các sản phẩm IRI, bao gồm IRI NextForm (để di chuyển dữ liệu và cơ sở dữ liệu) và IRI Voracity (một nền tảng quản lý dữ liệu tổng thể bao gồm NextForm và cộng sự). IRI Workbench tạo và chạy các công việc sao chép dữ liệu thông qua trình hướng dẫn, tập lệnh và sơ đồ quy trình làm việc.
Dưới đây là một số cách mà sự sao chép xảy ra:
- Dữ liệu trong một cơ sở dữ liệu được sao chép vào một cơ sở dữ liệu khác trên cùng một máy chủ hoặc một máy chủ khác.
- Dữ liệu từ hai hoặc nhiều cơ sở dữ liệu được kết hợp thành một cơ sở dữ liệu duy nhất.
- Người dùng nhận được đầy đủ các bản sao ban đầu của cơ sở dữ liệu và sau đó cập nhật định kỳ khi dữ liệu thay đổi.
- Dữ liệu được trích xuất có chọn lọc từ cơ sở dữ liệu và sao chép trong một tệp bên ngoài.
Sao chép dữ liệu cho phép bạn chỉ sao chép một phần của cơ sở dữ liệu; tức là các bảng, cột và / hoặc hàng đã chọn. Sao chép tất cả các bảng là một phần của sao chép cơ sở dữ liệu. Tuy nhiên, các thay đổi đối với lược đồ, ràng buộc, thủ tục và ủy quyền truy cập không dễ sao chép và có thể liên quan đến các quy trình riêng biệt.
Ví dụ cơ bản trong IRI Workbench
Chúng tôi sẽ sử dụng trình hướng dẫn tạo công việc từ menu NextForm trong thanh công cụ IRI Workbench cho ví dụ sao chép dữ liệu đầu tiên này. Chúng tôi sẽ sao chép dữ liệu từ bảng Oracle vào cả bảng MySQL và tệp phẳng đã sửa đổi. Bài viết thứ hai này minh họa việc sao chép dữ liệu chỉ cập nhật trong bảng bằng cách đánh giá các giá trị cột dấu thời gian.
Menu NextForm chứa ba trình hướng dẫn tạo việc làm:
- Công việc định dạng mới
- Công việc Di chuyển Nguồn Đơn Mới
- Công việc di chuyển nhiều bảng mới
Chúng tôi sẽ sử dụng trình hướng dẫn Công việc Định dạng Mới để thực hiện việc sao chép này. Đối với một công việc phức tạp hơn, chúng tôi sẽ sử dụng trình hướng dẫn NextForm khác hoặc trình hướng dẫn công việc ETL trong menu Voracity (hoặc xây dựng quy trình làm việc mới theo cách thủ công).
Đây là cấu trúc của bảng nguồn và bảng đích:
Bước 1:Chỉ định Tên và Tùy chọn Công việc
Từ menu NextForm trên thanh công cụ trên cùng, hãy chọn trình hướng dẫn Công việc Định dạng Mới. Đối với ví dụ này, hãy nhập tên tệp công việc datareplication . NextForm thêm phần mở rộng .ncl. Bạn cũng có thể thêm bất kỳ thông tin liên quan nào về công việc này sẽ xuất hiện dưới dạng nhận xét trong kịch bản.
Từ danh sách nút radio, hãy để lựa chọn mặc định là Tạo tập lệnh bởi vì đây là một công việc độc lập và không phải là một phần của một dự án hàng loạt hoặc quy trình lớn hơn.
Bước 2:Xác định Nguồn
Trên màn hình tiếp theo, Nguồn dữ liệu, hãy nhấp vào Thêm nguồn dữ liệu . Nguồn trong ví dụ này là cơ sở dữ liệu được kết nối với ODBC, vì vậy hãy chọn ODBC, và sau đó nhấp vào Duyệt qua để chọn tên nguồn dữ liệu (DSN) và bảng.
Bước 3:Chỉ định siêu dữ liệu nguồn
Để phần mềm IRI di chuyển và thao tác dữ liệu trong công cụ của nó (trong trường hợp này là sao chép trong NextForm), bạn cần siêu dữ liệu cho nguồn và mục tiêu được xác định trong tập lệnh công việc, ở định dạng tệp định nghĩa dữ liệu (DDF) của IRI.
Bạn có thể tự động xây dựng các DDF cho bất kỳ nguồn (hoặc đích) nào trong IRI Workbench. Chức năng đó được nhúng ở đây, nơi bạn có thể chọn Khám phá siêu dữ liệu hoặc Thêm siêu dữ liệu hiện có . Trong trường hợp này, chúng tôi sẽ thêm siêu dữ liệu hiện có, được tạo theo một cách khác. Lựa chọn đó và kết quả của nó được hiển thị trong hộp thoại sau:
Nhấp vào Bố cục Trường Nguồn để xem bố cục của dữ liệu.
Nhấp vào OK để đóng Bố cục Trường Nguồn. Sau đó nhấp vào Tiếp theo trên trang Nguồn dữ liệu để mở trang Mục tiêu dữ liệu.
Bước 4:Xác định (các) Mục tiêu
Chúng tôi đang gửi dữ liệu Oracle được sao chép tới hai mục tiêu:một bảng MySQL mà chúng tôi đang đặt tên là customer_out và một tệp có tên là personout.csv .
Thêm bảng mục tiêu
Nhấp vào Thêm mục tiêu dữ liệu . Chọn ODBC và nhấp vào Duyệt qua . Sau đó chọn Tên nguồn dữ liệu (DSN) Oracle và bảng CUSTOMERS_REP . Nhấp vào OK để đóng hộp thoại.
Trên trang Mục tiêu Dữ liệu, đánh dấu tên bảng và nhấp vào Thêm Siêu dữ liệu Hiện có . Chọn cust.ddf (đã được tạo trước đó) và nhấp vào OK .
Chúng tôi muốn giới hạn số lượng bản ghi trong tệp này là 100. Nhấp vào Chỉnh sửa Tùy chọn Mục tiêu để mở trình chỉnh sửa và trong Thu thập trường, nhập 100 và nhấp vào OK .
Thêm tệp đích
Một lần nữa, hãy nhấp vào Thêm mục tiêu dữ liệu . Chọn Tệp và nhập personout.csv và nhấp vào OK . Chúng tôi muốn giới hạn số lượng bản ghi trong tệp không quá 50 và chúng tôi cũng cần thay đổi định dạng thành CSV. Để làm cả hai, hãy nhấp vào Chỉnh sửa Tùy chọn Mục tiêu để mở trình chỉnh sửa. Thay đổi Định dạng trường thành CSV và trong Outcollect trường, nhập 50 và nhấp vào OK .
Thêm một hàm chuỗi vào tệp đích
Chúng tôi cũng sẽ thêm một hàm chuỗi để chỉ hiển thị bốn chữ số cuối cùng của trường SSN. Để thực hiện việc này, hãy nhấp vào Bố cục Trường Mục tiêu, và nhấp vào tab personout.csv.
Chọn trường SSN, nhấp chuột phải và chọn Áp dụng quy tắc > Tạo quy tắc . Trên trang Lựa chọn trình hướng dẫn quy tắc trường mới, hãy chọn Chức năng thao tác chuỗi . Trên trang tiếp theo - Các chức năng thao tác chuỗi - chọn chuỗi con . Trong Bù đắp , nhập 6 cho số ký tự từ bên trái của trường và trong Độ dài , nhập 4 cho độ dài của chuỗi con, sau đó nhấp vào Kết thúc .
Thêm bộ lọc bao gồm
Để tiếp tục sửa đổi tệp CSV, chúng tôi sẽ thêm bộ lọc để giới hạn dữ liệu chỉ bao gồm các bản ghi đó từ CA. Nhấp vào Bộ lọc Bản ghi để tạo bộ lọc. Chọn Bao gồm cho Hành động Bộ lọc và chọn Điều kiện Mới cho loại. Mở Trình tạo biểu thức bằng cách nhấp vào biểu tượng Hàm. Trong Trình tạo biểu thức, chọn danh mục Toán tử quan hệ và mục EQ . Trong Biểu thức ở trên cùng, nhập STATE EQ “CA” bằng các công cụ trên thanh công cụ và nhấp vào Hoàn tất .
Trở lại trang Mục tiêu dữ liệu, chúng tôi quyết định đặt lại vị trí của các trường họ và tên sau trường zip. Chọn LASTNAME và nhấp vào Xuống cho đến khi trường ở cuối danh sách, sau đó chọn FIRSTNAME và làm tương tự.
Khi chúng tôi hoàn tất việc thêm cả hai mục tiêu, các trường và sửa đổi sẽ hiển thị trên trang Mục tiêu dữ liệu.
Nhấp vào Kết thúc để hoàn thành việc xây dựng tập lệnh, được hiển thị bên dưới trong chế độ xem trình chỉnh sửa cú pháp, được mã hóa màu của IRI Workbench:
Kết quả
Chạy tập lệnh công việc bằng cách nhấp chuột phải vào tập lệnh và chọn Chạy dưới dạng> Công việc IRI . Dữ liệu mục tiêu được hiển thị trong các tab mở bên dưới:
Nếu bạn có bất kỳ câu hỏi nào về việc sao chép dữ liệu trong NextForm hoặc Voracity, hãy liên hệ với đại diện IRI của bạn.
- Từ Trình khám phá nguồn dữ liệu, nhấp chuột phải vào bảng, chọn IRI > Tạo DDF . Thao tác này tạo DDF cho bảng trong thư mục dự án đang hoạt động và sẽ được công cụ thao tác dữ liệu của IRI tham chiếu khi chạy.