Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Cài đặt Trình điều khiển JDBC MySQL trong Tích hợp dữ liệu Pentaho và các công cụ Máy chủ BA

Giới thiệu

Các công cụ Tích hợp Dữ liệu Pentaho và Máy chủ BA đi kèm với nhiều trình điều khiển cơ sở dữ liệu khác nhau. Tuy nhiên, kể từ phiên bản 7 của Community Edition, chúng không đi kèm với trình điều khiển JDBC cho Oracle, SQL Server hoặc MySQL (trong công cụ Tích hợp dữ liệu). Các bước sau đây phác thảo cách thêm trình điều khiển MySQL JDBC vào Pentaho.

Thực hiện theo các hướng dẫn sau về Cài đặt Máy chủ Pentaho BA và Công cụ tích hợp dữ liệu nếu các công cụ này chưa được cài đặt. Sau khi cài đặt các công cụ Pentaho, hãy tắt máy chủ BA và phần mềm Tích hợp dữ liệu.

Lấy trình điều khiển MYSQL JDBC

Trình điều khiển JDBC cho MySQL được gọi là “Connector / J”

Truy cập:https://dev.mysql.com/downloads/connector/j/

Cuộn xuống phần có các tùy chọn tải xuống.

Đảm bảo rằng "Nền tảng độc lập" được chọn

Đối với hệ điều hành Windows, hãy tải xuống ZIP Archive

Đăng nhập bằng tài khoản trang web Oracle của bạn (hoặc tạo một tài khoản miễn phí). Hoặc nhấp vào nút Chỉ bắt đầu tải xuống của tôi liên kết.

Lưu tệp ZIP vào một thư mục:

Giải nén (giải nén) Kho lưu trữ ZIP:

Hướng dẫn sao chép trình điều khiển JDBC vào các thư mục thích hợp trong công cụ Pentaho được mô tả trên trang tiếp theo.

Lưu ý rằng kể từ tháng 11 năm 2019, các công cụ Pentaho phiên bản 8.x sẽ không hoạt động trực tiếp với trình điều khiển MySQL Connector phiên bản 8.x mới hơn. Giải pháp đơn giản nhất là sử dụng trình điều khiển MySQL 5.x Connector. Giải pháp xung quanh là sử dụng Trình điều khiển MySQL phiên bản 8.x nhưng sử dụng Kết nối chung. Một số cuộc thảo luận có thể được tìm thấy tại liên kết này. Một mẹo khác là cài đặt Plugin PDI MySql từ Pentaho Marketplace trong Tích hợp dữ liệu Pentaho.

Sao chép tệp Trình điều khiển JDBC sang thư mục Máy chủ Pentaho BA và Lib Tích hợp dữ liệu

Tìm tệp mysql-connector-java-5.1.41-bin.jar (lưu ý rằng nó có thể có tên hơi khác tùy thuộc vào phiên bản).

Sao chép tệp .jar này vào thư mục LIB thích hợp trong bản phân phối Pentaho Community Edition.

Đối với Tích hợp dữ liệu Pentaho, thư mục đích phải là. \ Pentaho \ data-integration \ lib như được hiển thị bên dưới:

Máy chủ Pentaho BA lưu trữ trình điều khiển của nó trong thư mục. \ Pentaho-server \ tomcat \ lib. Đảm bảo rằng trình điều khiển MySQL JDBC chưa được cài đặt. Nếu vậy, chỉ giữ lại bản sao mới nhất của tệp .jar. Ví dụ:Phiên bản 7.0 của Máy chủ Pentaho bao gồm phiên bản Trình điều khiển JDBC MySQL mysql-connector-java-5.1.17. Tuy nhiên, phiên bản này có một số lỗi nên hãy nhớ xóa tệp mysql-connector-java-5.1.17.jar đó và thay thế bằng tệp mysql-connector-java-5.1.41-bin.jar mới nhất.

Bây giờ các trình điều khiển JDBC đã được sao chép vào các thư mục thích hợp, hãy khởi động lại Máy chủ Pentaho BA (start-pentaho) và khởi chạy các công cụ Tích hợp dữ liệu (Spoon). Hướng dẫn về cách tạo kết nối cơ sở dữ liệu trong Công cụ Tích hợp Dữ liệu Pentaho được cung cấp trên trang tiếp theo.

Thiết lập kết nối MySQL trong Tích hợp dữ liệu Pentaho

Thực hiện theo tập hợp các bước này để tạo kết nối cơ sở dữ liệu mới với MySQL từ các công cụ Tích hợp dữ liệu Pentaho. Trong Tích hợp dữ liệu Pentaho, nhiều bước chuyển đổi gửi dữ liệu đến bảng cơ sở dữ liệu. Có thể tìm thấy một số ví dụ trong hướng dẫn này về Tích hợp dữ liệu Pentaho.

Trước khi bắt đầu, bạn sẽ cần thông tin đăng nhập vào một phiên bản MySQL. Bạn có thể muốn xem hướng dẫn của tôi về cách thiết lập phiên bản MySQL miễn phí trên GearHost hoặc hướng dẫn này về cài đặt MySQL trên Windows.

Trong Tích hợp dữ liệu Pentaho, hãy chọn bất kỳ bước chuyển đổi nào sử dụng cơ sở dữ liệu làm đầu ra, chẳng hạn như bước Tra cứu / Cập nhật thứ nguyên, Chèn / Cập nhật hoặc bước Đầu ra bảng. Nhấp vào Mới bên cạnh tên Kết nối để hiển thị hộp thoại Kết nối Cơ sở dữ liệu như được hiển thị bên dưới.

Đặt tên cho Kết nối rồi chọn MySQL làm Loại kết nối.

Cung cấp Tên máy chủ lưu trữ của máy chủ chạy MySQL. Nếu bạn đã cài đặt MySQL trên PC hoặc máy chủ cục bộ của mình, hãy sử dụng localhost làm Tên máy chủ . Cung cấp Tên cơ sở dữ liệu và sử dụng Số cổng mặc định của 3306. Cuối cùng, cung cấp cho cơ sở dữ liệu MySQL Tên người dùng Mật khẩu .

Nhấp vào Kiểm tra để đảm bảo kết nối cơ sở dữ liệu hoạt động bình thường.

Nếu lỗi sau xuất hiện, hãy đảm bảo rằng tệp .jar của trình điều khiển MySQL JDBC đã được sao chép vào Tích hợp dữ liệu Pentaho lib thư mục (như đã thảo luận ở trang trước của hướng dẫn này). Thoát khỏi công cụ Tích hợp dữ liệu và chạy lại.

Error connecting to database [MySQLConnetion] :
     org.pentaho.di.core.exception.KettleDatabaseException: 
Error occurred while trying to connect to the database
Driver class 'org.gjt.mm.mysql.Driver' could not be found, 
make sure the 'MySQL' driver (jar file) is installed.

Lưu ý rằng kể từ tháng 11 năm 2019, các công cụ Pentaho phiên bản 8.x sẽ không hoạt động trực tiếp với trình điều khiển MySQL Connector phiên bản 8.x mới hơn. Giải pháp đơn giản nhất là sử dụng trình điều khiển MySQL 5.x Connector. Giải pháp xung quanh là sử dụng Trình điều khiển MySQL phiên bản 8.x nhưng sử dụng Kết nối chung. Một số cuộc thảo luận có thể được tìm thấy tại liên kết này. Một mẹo khác là cài đặt Plugin PDI MySql từ Pentaho Marketplace trong Tích hợp dữ liệu Pentaho.

Đảm bảo đặt Lược đồ mục tiêu trong bất kỳ đầu ra cơ sở dữ liệu hoặc các bước tra cứu Thứ nguyên. Trong MySQL, lược đồ có thể được để trống để sử dụng cơ sở dữ liệu MySQL mặc định.

Nếu bạn đã thực hành chạy chuyển đổi dựa trên cơ sở dữ liệu H2 làm mục tiêu, bạn đã từng đặt PUBLIC thành lược đồ mục tiêu. đối với MySQL, chỉ cần để trống lược đồ mục tiêu để mặc định sẽ được sử dụng.

Trang tiếp theo trình bày cách thiết lập Kết nối cơ sở dữ liệu mới và nguồn dữ liệu Mondrian trong Máy chủ Pentaho BA.

Thiết lập Nguồn dữ liệu MySQL trong Máy chủ Pentaho BA

Từ Trang chủ của Bảng điều khiển người dùng Pentaho, nhấp vào Quản lý nguồn dữ liệu để hiển thị màn hình Quản lý nguồn dữ liệu. Bước đầu tiên từ thời điểm này sẽ là tạo một Kết nối cơ sở dữ liệu mới với Cơ sở dữ liệu MySQL.

Nhấp vào biểu tượng Bánh răng để mở trình đơn và sau đó nhấp vào Kết nối mới… mục menu như được hiển thị bên dưới.

Cung cấp tên cho Kết nối Cơ sở dữ liệu mới. Chọn MySQL làm Loại cơ sở dữ liệu và sau đó nhấp vào tùy chọn Gốc (JDBC) trong tùy chọn Truy cập: tiêu đề. Điền vào Tên máy chủ lưu trữ , Tên cơ sở dữ liệu , Số cổng , Tên người dùng Mật khẩu cho cơ sở dữ liệu MySQL của bạn. Nếu MySQL được cài đặt trên PC hoặc máy chủ cục bộ của bạn, hãy sử dụng localhost làm Tên máy chủ .

Khi hoàn tất, hãy nhấp vào nút Kiểm tra màu xanh lam nút để kiểm tra Kết nối Cơ sở dữ liệu

Nếu có bất kỳ lỗi nào, hãy kiểm tra thông tin kết nối (tên máy chủ, tên người dùng, mật khẩu, v.v.) và sau đó lặp lại kiểm tra.

Nếu bạn gặp lỗi liên quan đến kết nối SSL (kết nối của bạn có thể hết sau vài phút), hãy thêm thông số useSSL với giá trị false như được hiển thị bên dưới.

Khi hoàn tất, hãy nhấp vào nút OK để lưu Kết nối cơ sở dữ liệu mới. Kết nối Cơ sở dữ liệu mới bây giờ sẽ xuất hiện trong danh sách:

Bây giờ kết nối đã được tạo và kiểm tra, có thể tạo Nguồn dữ liệu Mondrian. Các hướng dẫn này được cung cấp trên trang tiếp theo.

Tạo nguồn dữ liệu mới trong Máy chủ Pentaho BA

Trong Máy chủ Pentaho BA, Nguồn dữ liệu đại diện cho một lược đồ cơ sở dữ liệu Đa chiều Mondrian nằm trên đầu kho dữ liệu Đa chiều hoặc cơ sở dữ liệu quan hệ. Nguồn Dữ liệu yêu cầu kết nối với cơ sở dữ liệu bên dưới và Mô hình Dữ liệu Mondrian phải được xây dựng trên nó. Mô hình Dữ liệu Mondrian bao gồm các Thứ nguyên và Phép đo. Thứ nguyên chứa các trường được xếp chồng lên nhau trong một hệ thống phân cấp. Có thể có một số Mô hình Dữ liệu khác nhau được xây dựng trên cùng một nguồn dữ liệu cơ bản.

Để bắt đầu tạo nguồn dữ liệu mới, hãy nhấp vào Nguồn dữ liệu mới màu xanh lam cái nút. Trình hướng dẫn nguồn dữ liệu sẽ khởi chạy.

Điền tên mới cho Nguồn dữ liệu và chọn Kết nối cơ sở dữ liệu . Chọn (các) Bảng cơ sở dữ liệu làm Nguồn Gõ phím. Đối với ví dụ này, chúng tôi sẽ làm việc với Giản đồ hình sao, vì vậy chúng tôi chọn tùy chọn cho Báo cáo và phân tích .

Nhấp vào Tiếp theo và máy chủ Pentaho BA sẽ truy vấn giản đồ của cơ sở dữ liệu cơ bản cho Kết nối cơ sở dữ liệu

Màn hình tiếp theo trong trình hướng dẫn sẽ hiển thị danh sách các bảng được tìm thấy trong lược đồ từ Kết nối Cơ sở dữ liệu.

Nhấp vào một trong các Bảng có sẵn và sau đó nhấp vào nút mũi tên phải để di chuyển nó đến Bảng đã chọn bên. Lặp lại điều này cho từng bảng sẽ được bao gồm trong Nguồn dữ liệu.

Vì ví dụ này sử dụng tùy chọn "Báo cáo và phân tích", một trong các bảng cơ sở dữ liệu sẽ cần được chọn làm Bảng dữ kiện . Khi những thay đổi này đã được thực hiện, hãy nhấp vào nút Tiếp theo để chuyển sang bước cuối cùng để xác định các phép nối.

Lưu ý:Nếu không có khóa ngoại nào xuất hiện, hãy đảm bảo rằng bạn đang làm việc với trình điều khiển MySQL JDBC mới nhất vì nó sửa được một số lỗi. mysql-connector-java-5.1.17 là phiên bản cũ hơn đi kèm với Pentaho Server 7.0. Nếu bạn cập nhật trình điều khiển JDBC, hãy đảm bảo khởi động lại Máy chủ Pentaho BA.

Đối với mỗi cặp bảng, hãy nhấp vào Trường khóa trong Bảng bên trái và Trường khóa được liên kết trong Bảng bên phải. Sau đó, nhấp vào nút Tạo tham gia liên kết. Trong ví dụ bên dưới, một phép nối đã được tạo giữa bảng sales_fact và sau đó là bảng customer_dim bằng cách sử dụng khóa chung customer_dim_id.

Lặp lại điều này cho từng cặp phím. Trong ví dụ này, có một bảng dữ kiện và 5 bảng thứ nguyên dẫn đến việc tạo ra 5 phép nối. Nếu bạn mắc lỗi, hãy đánh dấu tham gia và nhấp vào Xóa tham gia liên kết.

Khi hoàn tất, hãy nhấp vào nút Hoàn tất nút.

Nhấp vào nút OK để quay lại nút Quản lý nguồn dữ liệu màn hình.

Nguồn dữ liệu mới hiện đã được tạo với Mô hình dữ liệu mặc định. Tuy nhiên, mô hình dữ liệu này sẽ cần một số chỉnh sửa. Hướng dẫn về Chỉnh sửa Mô hình Dữ liệu Mondrian được cung cấp trên trang tiếp theo.

Chỉnh sửa Mô hình Dữ liệu Mondrian để Xác định Thứ nguyên và Phép đo

Đánh dấu Nguồn dữ liệu, kéo xuống biểu tượng bánh răng và chọn Chỉnh sửa . Thao tác này sẽ mở Trình chỉnh sửa mô hình nguồn dữ liệu . Mô hình mặc định sao chép trên tất cả các cột từ lược đồ dưới dạng Thứ nguyên và Phép đo. Tuy nhiên, mô hình mặc định này có thể sẽ không hoạt động vì hệ thống phân cấp vẫn chưa được xác định.

Xóa Mô hình Dữ liệu hiện có

Nhấp vào nút được hiển thị bên dưới để Xóa Mô hình hiện tại.

Khi được nhắc xác nhận, hãy nhấp vào để xóa mô hình

Giờ đây, mô hình sẽ bị xóa và các Số đo và Kích thước sẽ hiển thị cảnh báo vì không có nội dung nào.

Tạo biện pháp mới

Tạo một Phép đo mới bằng cách kéo và thả Thông tin bán hàng từ Có sẵn bên cạnh Biện pháp mục nhập trong Phân tích tab.

Xóa từng id thứ nguyên và ID ĐẶT HÀNG khỏi các thước đo vì chúng không thực sự là thước đo (chúng là khóa ngoại). Nhấp vào Id mờ của khách hàng và sau đó nhấp vào X màu xanh lam Để loại bỏ nó. Lặp lại cho id thứ nguyên khác.

Tạo thứ nguyên KHÁCH HÀNG

Với các Phép đo tại chỗ, Kích thước có thể được tạo. Nhấp vào Thứ nguyên và sau đó nhấp vào Thêm thứ nguyên như hình dưới đây.

Đặt tên cho thứ nguyên mới này là CUSTOMER (Đảm bảo sử dụng tên không phải số nhiều cho thứ nguyên) và nhấp vào nút OK nút.

KHÁCH HÀNG thứ nguyên sẽ được tạo với Hệ thống phân cấp KHÁCH HÀNG bên dưới:

Mở Customer Dim trên bảng Có sẵn. Kéo trường COUNTRY_NAME và thả trường đó vào Hệ thống phân cấp CUSTOMER như hình bên dưới. Có thể mất một vài lần thử để điều này đến đúng chỗ.

Kết quả sẽ hiển thị TÊN QUỐC GIA xuất hiện trong Phân cấp KHÁCH HÀNG.

Lặp lại các bước trên để thêm STATE_PROVINCE và CITY vào Hệ thống phân cấp KHÁCH HÀNG. Đối với mỗi trường trong Hệ thống phân cấp KHÁCH HÀNG, hãy thay đổi loại Địa lý cho phù hợp. Ví dụ:COUNTRY_NAME phải có loại Địa lý là “Quốc gia” và STATE_PROVINCE phải có Loại địa lý “Tiểu bang”.

Tạo thứ nguyên ngày

Nhấp vào mục nhập DIMENSIONS và sau đó nhấp vào Thêm thứ nguyên cái nút. Đặt tên cho thứ nguyên mới là DATE. Nhấp vào tên của thứ nguyên DATE và chọn hộp cho "Thứ nguyên thời gian":

Kéo và thả Năm bán hàng, Quý bán hàng, Tên tháng bán hàng, Ngày bán hàng trong năm và Ngày bán hàng vào NGÀY
Thứ bậc . Đối với mỗi trường, hãy chọn Loại mức thời gian thích hợp và Định dạng cột nguồn .

Thứ nguyên DATE đã hoàn thành sẽ trông giống như sau:

Tạo thứ nguyên SẢN PHẨM

Nhấp vào Thứ nguyên và sau đó nhấp vào Thêm thứ nguyên cái nút. Đặt tên cho thứ nguyên mới là PRODUCT. Kéo và thả CATEGORY_NAME, SUB_CATEGORY_NAME và PRODUCT_NAME trong PRODUCT Phân cấp .

Nhấp vào nút OK để đóng Trình chỉnh sửa mô hình nguồn dữ liệu.

Đăng xuất khỏi Bảng điều khiển người dùng Pentaho, tắt máy chủ Pentaho bằng cách sử dụng tập lệnh stop-pentaho, sau đó khởi động lại Máy chủ Pentaho.

Giờ đây, Mô hình dữ liệu Mondrian đã được tạo, Nguồn dữ liệu mới đã sẵn sàng được sử dụng để tạo hình ảnh trực quan trên trang tổng quan hoặc cho mục đích báo cáo.

Tạo một biểu đồ đơn giản bằng Trình hướng dẫn Biểu đồ OLAP

Tạo Trang tổng quan mới (hoặc chỉnh sửa Trang tổng quan hiện có) và sử dụng Trình hướng dẫn OLAP để tạo biểu đồ mới

Dưới đây là Truy vấn MDX được tạo tự động bởi Trình hướng dẫn OLAP:

select NON EMPTY({Descendants([CUSTOMER].[All CUSTOMERs] ,[CUSTOMER].[CITY])}) on ROWS, 
 NON EMPTY({Descendants([PRODUCT].[All PRODUCTs] ,[PRODUCT].[SUB CATEGORY NAME])}) on Columns 
 from [Customer_Sales]


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Truy cập cơ sở dữ liệu từ xa mysql từ dòng lệnh

  2. Cách tính Tổng tích lũy trong MySQL

  3. Truy xuất id được chèn lần cuối bằng Mysql

  4. Làm thế nào để biết MySQLnd có phải là trình điều khiển đang hoạt động hay không?

  5. Chuyển mảng đến quy trình lưu trữ MySQL