Database
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Database

RowGen v3 Tự động hóa tạo dữ liệu kiểm tra cơ sở dữ liệu

Giá trị của dữ liệu thử nghiệm tốt đối với DBA đã được biết đến nhiều:

“Việc thử nghiệm các ứng dụng chuyên sâu về cơ sở dữ liệu có những thách thức đặc biệt bắt nguồn từ sự phụ thuộc tiềm ẩn, sự khác biệt nhỏ về ngữ nghĩa dữ liệu, lược đồ cơ sở dữ liệu mục tiêu và các quy tắc nghiệp vụ ngầm. Những thách thức này càng trở nên khó khăn hơn khi ứng dụng liên quan đến cơ sở dữ liệu tích hợp và không đồng nhất hoặc dữ liệu bí mật. Dữ liệu kiểm tra thích hợp mô phỏng các vấn đề dữ liệu trong thế giới thực là rất quan trọng để đạt được các tiêu chuẩn chất lượng hợp lý cho xác thực đầu vào chức năng, tải, hiệu suất và kiểm tra căng thẳng. ”- Ali Raza &Stephen Clyde, tóm tắt từ Tạo tập dữ liệu để kiểm tra cơ sở dữ liệu quan hệ

Kiểm tra các hoạt động cơ sở dữ liệu, kho dữ liệu tạo mẫu và các công việc ETL / ELT, gia công phần mềm và báo cáo một cách an toàn cũng như chạy các điểm chuẩn hiệu suất trên các thiết bị DB, tất cả đều yêu cầu dữ liệu thử nghiệm với giao diện của cơ sở dữ liệu sản xuất để các ứng dụng sử dụng dữ liệu thử nghiệm đó bây giờ sẽ thực hiện thành công với dữ liệu thực sau này. Trong cuốn sách năm 2012 của họ, Raza và Clyde so sánh việc tạo dữ liệu thử nghiệm với việc trích xuất dữ liệu thử nghiệm.

IRI và người dùng của nó biết rằng việc sử dụng dữ liệu thực để thử nghiệm là điều không mong muốn. Lý do rõ ràng nhất hiện nay là dữ liệu thực có nguy cơ lộ thông tin nhận dạng cá nhân (PII) cần được bảo mật. Nhà phát triển hoặc người thử nghiệm không muốn chạy các quy trình hoặc thử nghiệm hệ thống cơ sở dữ liệu và có nguy cơ chia sẻ thông tin khách hàng như số an sinh xã hội, thông tin thẻ tín dụng, ngày sinh, v.v. trong giai đoạn này. Dữ liệu thực hiện có cũng có thể không đủ mạnh hoặc không đủ thực tế để kiểm tra ứng dụng hoặc cơ sở dữ liệu mà sẽ phải xử lý khối lượng và / hoặc phạm vi giá trị lớn hơn.

Thật không may, Raza và Clyde đã viết cuốn sách của họ trước khi RowGen v3 được phát hành, khi họ có thể đã quan sát thấy nó tạo ra dữ liệu thử nghiệm:

1) không tiết lộ PII vì nó chứa các giá trị cột mới hoặc ngẫu nhiên thực
2) duy trì tính toàn vẹn cấu trúc và tham chiếu được xác định trong DDL ban đầu
3) không giới hạn ở khối lượng dữ liệu của cơ sở dữ liệu gốc hoặc phạm vi giá trị
4) có thể được tùy chỉnh thông qua việc tạo tập lệnh để giải quyết các yêu cầu phức tạp.
5) được sắp xếp trước và tự động tải hàng loạt cho tập hợp nhanh nhất có thể. các tập lệnh có tính linh hoạt đa dạng và có thể được xuất, sử dụng lại và sửa đổi khi cần

IRI RowGen v3 là phiên bản mới nhất của trình tạo dữ liệu thử nghiệm khối lượng lớn nhanh nhất và mạnh mẽ nhất trên thế giới dành cho cơ sở dữ liệu quan hệ. RowGen sẽ chạy từ IRI Workbench GUI được xây dựng trên Eclipse, trên dòng lệnh hoặc từ các chương trình hàng loạt, để tạo ra chất lượng và số lượng dữ liệu thử nghiệm cần thiết để phản ánh chính xác phạm vi, bố cục và các mối quan hệ trong cơ sở dữ liệu sản xuất và lần lượt, kho dữ liệu và kho dữ liệu hoạt động.

Trình hướng dẫn Dữ liệu thử nghiệm DB mới của RowGen v3, khi được khởi chạy từ IRI Workbench GUI, hướng dẫn người dùng thông qua đặc điểm kỹ thuật và tự động hóa của:

Phân tích cú pháp - bằng cách chọn lược đồ và bảng để điền, RowGen dịch các mô tả bảng cơ sở dữ liệu và các ràng buộc toàn vẹn thành các tập lệnh .rcl chỉ định cấu trúc nguồn, các tập phụ thuộc và tạo dữ liệu, theo thứ tự cần thiết để điền các bảng ở định dạng phù hợp và với tất cả các khóa chính, chỉ mục duy nhất và các mối quan hệ khóa ngoài được tôn trọng.

Thế hệ - bằng cách xây dựng và chạy các tập lệnh .rcl để tạo một tệp thử nghiệm cho mỗi bảng có thể được tải hàng loạt và / hoặc lưu để sử dụng trong tương lai.

Dân số - bằng cách tải hàng loạt các bảng mục tiêu theo đúng thứ tự với dữ liệu thử nghiệm được sắp xếp trước chính xác về mặt cấu trúc và tham chiếu.

Quá trình này có thể nhanh chóng tải cơ sở dữ liệu thử nghiệm khổng lồ và tuân thủ cả các quy tắc kinh doanh và luật bảo mật dữ liệu. Dữ liệu được tạo ra đủ thực tế và mạnh mẽ để kiểm tra các hoạt động cơ sở dữ liệu và các ứng dụng truy vấn.

RowGen v3 cũng hỗ trợ các tùy chọn dựa trên quy tắc và tập lệnh để kiểm soát các giá trị trường cụ thể và phân phối phạm vi giá trị phù hợp với các ràng buộc cơ sở dữ liệu cụ thể và thể hiện tốt nhất tỷ lệ xuất hiện và xuất hiện của dữ liệu trong quá trình sản xuất. Người dùng cũng có thể vẽ biểu đồ và chứng minh trực quan rằng các giá trị thử nghiệm tuân theo các phân phối tuyến tính, chuẩn hóa, có trọng số hoặc tiêu chuẩn.

Để biết thêm thông tin về RowGen v3, hãy xem www.iri.com/products/rowgen, www.iri.com/products/rowgen/gui hoặc đọc các bài viết khác trong phần Dữ liệu thử nghiệm của blog IRI.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Tiện ích xác minh cụm tạo ra số lượng lớn tệp xml trên hệ thống tệp “/ u01”.

  2. Phân tích cú pháp các giá trị mặc định của tham số bằng PowerShell - Phần 1

  3. Mức cách ly có thể nối tiếp hóa

  4. Các nguyên tắc cơ bản về biểu thức bảng, Phần 6 - CTE đệ quy

  5. Xem thông số, nhúng và các tùy chọn RECOMPILE