Trong hướng dẫn trước đó, “Hợp nhất các tệp dữ liệu với Statistica, Phần 1”, chúng tôi đã giới thiệu cách sử dụng Statistica để hợp nhất các bảng tính. Chúng tôi đã thảo luận về chế độ hợp nhất nối. Trong hướng dẫn này, chúng ta sẽ thảo luận về hai chế độ khác:sử dụng tên trường hợp và tên biến. Hướng dẫn này có các phần sau:
- Sử dụng tên trường hợp để hợp nhất các tệp dữ liệu
- Sử dụng tên biến để hợp nhất các tệp dữ liệu
- Kết luận
Sử dụng tên trường hợp để hợp nhất các tệp dữ liệu
Tiếp theo, chúng tôi sẽ hợp nhất các tệp dữ liệu (bảng tính) bằng cách khớp các hàng (còn được gọi là trường hợp ). Nếu các hàng có tên chữ hoa giống nhau, dữ liệu trong các hàng từ hai tệp dữ liệu sẽ được hợp nhất. Các tệp dữ liệu ví dụ mà chúng tôi đã sử dụng trong bài viết trước không bao gồm tên trường hợp. Tên trường hợp được chỉ định trong 1 cột, cột trước các cột dữ liệu. Sử dụng dữ liệu tương tự như để nối các tệp dữ liệu, hãy thêm tên trường hợp ( log1 đến log6 ) đến các hàng trong wlslog1.sta bảng tính, như trong Hình 1.
Hình 1: Bảng tính wlslog1
Tương tự, thêm tên trường hợp ( log1 đến log6 ) đến từng hàng trong wlslog2.sta , như trong Hình 2.
Hình 2: Bảng tính wlslog2
Chọn Dữ liệu> Hợp nhất và trong Tùy chọn hợp nhất , chọn Chế độ dưới dạng Đối sánh tên chữ hoa với nhau , như trong Hình 3. Nhấp vào OK .
Hình 3: Hợp nhất wlslog1 và wlslog2
Dữ liệu trong wlslog1.sta bảng tính được hợp nhất với dữ liệu trong wlslog2.sta bảng tính, như được hiển thị trong bảng tính kết quả trong Hình 4.
Hình 4: Tệp được Hợp nhất
Khi hợp nhất bằng cách ghép các tên chữ hoa, mỗi tệp dữ liệu để hợp nhất phải bao gồm tên chữ hoa, nếu không sẽ hiển thị lỗi như trong Hình 5.
Hình 5: Tên trường hợp là bắt buộc khi hợp nhất bằng cách trùng khớp với tên trường hợp
Một bảng tính có thể có nhiều trường hợp (hoặc hàng) hơn bảng tính kia. Ví dụ:thêm một hàng 7 vào wlslog1.sta (xem Hình 6). Nhấp vào Hợp nhất để hợp nhất các bảng tính.
Hình 6: Hợp nhất với Hàng thứ 7 trong wlslog1.sta
Hợp nhất bằng cách khớp các tên với wlslog2.sta , giống như trước đây với 6 trường hợp (hàng), như trong Hình 28. Các bảng tính để hợp nhất có các trường hợp không khớp (một bảng tính có nhiều trường hợp hơn bảng tính kia). Các trường hợp chưa khớp được hợp nhất bằng cách điền vào dữ liệu bị thiếu theo mặc định, có nghĩa là các giá trị dữ liệu trống. Bảng tính kết quả có dữ liệu bị thiếu trống cho các trường hợp chưa khớp, như thể hiện trong Hình 7.
Hình 7: Bảng tính kết quả có dữ liệu bị thiếu trống
Tùy chọn hợp nhất cung cấp một số tùy chọn cho Các trường hợp chưa được so khớp khác với việc điền vào các dữ liệu bị thiếu. Để chứng minh, hãy sử dụng bảng tính, wlslog1.sta , với một hàng thừa và tên trường hợp trùng lặp ( log2 ), như trong Hình 8.
Hình 8: Bảng tính có tên trường hợp trùng lặp
Có thể xóa các trường hợp chưa khớp bằng cách chọn Xóa các trường hợp trong Tệp 1 Các trường hợp chưa khớp , như trong Hình 9. Nhiều trường hợp được khắc phục bằng cách chọn “bội số của Drop File 1”. Với Chế độ hợp nhất dưới dạng Khớp tên chữ hoa , nhấp vào OK .
Hình 9: Tệp 1 Các trường hợp chưa khớp>
Xóa các trường hợp
Bảng tính kết quả đã được khắc phục cả hai vấn đề. Trường hợp chưa khớp sẽ bị xóa và trường hợp trùng lặp bị loại bỏ, như trong Hình 10.
Hình 10: Bảng tính kết quả với trường hợp chưa khớp đã bị xóa và trường hợp trùng lặp bị loại bỏ
Sử dụng tên biến để hợp nhất các tệp dữ liệu
Tiếp theo, chúng ta sẽ hợp nhất các bảng tính bằng cách khớp các tên biến. Bắt đầu với hai bảng tính, wlslog1.sta và wlslog2.sta , mỗi tên cột được hiển thị trong Hình 11.
Hình 11: Cột Tên trong wlslog1 và wlslog2
Thêm dữ liệu sau vào wlslog1.sta .
4-8-2014-7:06:16,Notice,WebLogicServer,AdminServer,BEA-000365, STANDBY 4-8-2014-7:06:17,Notice,WebLogicServer,AdminServer,BEA-000365, RESUMING 4-8-2014-7:06:18,Notice,WebLogicServer,AdminServer,BEA-000365, ADMIN
wlslog1.sta bảng tính được hiển thị trong Hình 12.
Hình 12: Bảng tính wlslog1.sta
Thêm dữ liệu sau vào wlslog2.sta .
4-8-2014-7:06:20,Notice,WebLogicServer,AdminServer,BEA-000331, STARTING 4-8-2014-7:06:21,Notice,WebLogicServer,AdminServer,BEA-000365, STARTED 4-8-2014-7:06:22,Notice,WebLogicServer,AdminServer,BEA-000360, RUNNING
wlslog2.sta được hiển thị trong Hình 13. Chọn Dữ liệu> Hợp nhất như trước đây.
Hình 13: Bảng tính wlslog2.sta
Trong Tùy chọn hợp nhất , chọn Chế độ dưới dạng Biến đối sánh , như trong Hình 14. Chọn Tệp 1 dưới dạng wlslog1.sta và Tệp 2 dưới dạng wlslog2.sta . Thứ tự quan trọng vì bảng tính được thêm vào cuối bảng tính kia phải là Tệp 2 . Giữ Tiêu chí đối sánh dưới dạng Bằng tự động , tự động chọn tiêu chí hợp nhất thích hợp nhất. Các tùy chọn khác cho Tiêu chí Đối sánh là Theo Văn bản , so sánh dữ liệu bằng cách so sánh văn bản; và Bằng số , so sánh dữ liệu bằng cách so sánh các giá trị số. Tiếp theo, nhấp vào Chọn để chọn các biến cho phù hợp.
Hình 14: Chế độ hợp nhất dưới dạng các biến đối sánh
Đầu tiên, chọn các biến phù hợp cho tệp hiện tại (Tệp 1). Nhấp vào Chọn tất cả và bấm OK, như trong Hình 15.
Hình 15: Chọn các biến trong tệp hiện tại
Tương tự, chọn tất cả các biến cho tệp hợp nhất (Tệp 2) và bấm OK (xem Hình 16).
Hình 16: Chọn biến trong tệp hợp nhất
Nhấp vào OK trong Tùy chọn Hợp nhất, như thể hiện trong Hình 17.
Hình 17: Hợp nhất với Chế độ làm Biến đối sánh
Hai bảng tính được hợp nhất bằng cách khớp các tên biến, như trong Hình 18.
Hình 18: Bảng tính kết quả từ việc hợp nhất bằng cách so khớp các tên biến
Khi hợp nhất các bảng tính bằng cách khớp với các tên biến, các giá trị dữ liệu được sắp xếp theo số và văn bản. Ví dụ:hợp nhất hai bảng tính với 1 bảng tính, được hiển thị trong Hình 19.
Hình 19: Bảng tính đầu tiên cần hợp nhất
Bảng tính thứ 2 được hiển thị trong Hình 20. Một sửa đổi được thêm vào là tên biến đã được sửa đổi một chút trong Tệp 1:“ServerType” thay vì “servername”, “MessageCode” thay vì “code” và “Message” thay vì “ tin nhắn ”.
Hình 20: Bảng tính thứ hai để hợp nhất
Nhấp vào Chọn để chọn các biến được sử dụng để đối sánh. Trong Tệp 1, chọn tất cả các biến (xem Hình 21).
Hình 21: Chọn các biến phù hợp cho tệp hiện tại
Trong Tệp 2, cũng chọn tất cả các biến, như trong Hình 22.
Hình 22: Chọn Biến Đối sánh để Hợp nhất tệp
Hợp nhất hai bảng tính như trước. “Tên máy chủ” hoặc “Loại máy chủ” giống nhau đối với tất cả các hàng và không góp phần vào việc sắp xếp dữ liệu trong bảng tính kết quả. Giá trị dữ liệu cột “mã” hoặc “Mã thông báo” được sắp xếp thành Văn bản không phân biệt chữ hoa chữ thường; BEA-000331 được sắp xếp trước BEA-000360, được sắp xếp trước BEA-000365. Đối với cùng một giá trị cho mã BEA-000365, dữ liệu cột “tin nhắn” hoặc “Tin nhắn” cũng được sắp xếp theo Văn bản — QUẢN TRỊ-> TIẾP TỤC-> STANDBY> BẮT ĐẦU — như trong Hình 23.
Hình 23: Bảng tính kết quả
Các điều kiện nhất định phải được áp dụng khi chọn biến. Ít nhất một biến phải được chọn để đối sánh, nếu không sẽ tạo ra lỗi hiển thị trong Hình 24.
Hình 24: Phải chọn tối thiểu 1 Biến
Số lượng biến được chọn phải giống nhau trong Tệp 1 và Tệp 2, nếu không sẽ tạo ra lỗi hiển thị trong Hình 25.
Hình 25: Phải chọn cùng một số lượng biến trong Bảng tính để hợp nhất
Kiểu dữ liệu của các biến được chọn phải giống nhau đối với các biến đã chọn. Ví dụ:các biến “servername” và “ServerType” trong Tệp 1 và Tệp 2 tương ứng phải có cùng kiểu dữ liệu, nếu không sẽ tạo ra lỗi hiển thị trong Hình 26.
Hình 26: Các loại biến phải giống nhau khi hợp nhất bằng cách phù hợp với các biến
Kết luận
Trong hướng dẫn này, chúng tôi đã thảo luận về việc hợp nhất các tệp dữ liệu (còn được gọi là bảng tính) trong Nền tảng Statistica bằng cách sử dụng các chế độ:Khớp tên chữ và Khớp các biến.