Để tham khảo, Power BI là phần mềm phân tích và trực quan hóa dữ liệu do Microsoft phát triển. Power BI có thể được sử dụng để trực quan hóa dữ liệu tĩnh cũng như tương tác. Trước khi có thể tạo hình ảnh trực quan thực tế với Power BI, bạn có thể thực hiện xử lý trước dữ liệu bằng trình chỉnh sửa Truy vấn Power BI.
Với trình chỉnh sửa truy vấn, bạn có thể thực hiện các tác vụ chuyển đổi dữ liệu khác nhau, chẳng hạn như thay đổi loại cột, xử lý các giá trị bị thiếu, xóa hàng và cột, xoay và hủy chia cột, chia cột, v.v.
Trong bài viết này, bạn sẽ thấy cách xoay, bỏ chia và chia cột bằng trình chỉnh sửa Truy vấn Power BI.
Nhập Tập dữ liệu vào Trình chỉnh sửa truy vấn
Tập dữ liệu được sử dụng làm ví dụ trong bài viết này ở định dạng tệp CSV có thể được tải xuống bằng liên kết kaggle này. Tải xuống tệp CSV vào hệ thống tệp cục bộ của bạn.
Tiếp theo, mở Power BI Desktop, nhấp vào nút “Get Data” từ menu trên cùng. Từ danh sách thả xuống, hãy chọn “Văn bản / CSV” như được hiển thị bên dưới.
Power BI sẽ mất một khoảng thời gian để nhập dữ liệu. Sau khi tải xong dữ liệu, bạn sẽ thấy cửa sổ bên dưới.
Tập dữ liệu chứa thông tin về Dân số, Diện tích, Tỷ lệ sinh, Tỷ lệ tử vong, Mật độ dân số, GDP bình quân đầu người, Điện thoại trên 1000 người, v.v. cho tất cả các quốc gia trên thế giới. Để tải dữ liệu vào trình chỉnh sửa truy vấn, hãy nhấp vào nút "Chuyển đổi dữ liệu".
Trình chỉnh sửa truy vấn trông giống như sau:
Trong trình chỉnh sửa truy vấn, bạn có thể thực hiện nhiều quá trình xử lý trước khác nhau như xoay vòng, hủy chia và tách cột.
Lý thuyết xoay vòng và mở rộng
Trước khi chúng tôi thực sự đi xuống các cột xoay vòng và giải nén bằng trình chỉnh sửa truy vấn Power BI. Hãy xem xét một ví dụ rất cơ bản về việc bỏ chia sẻ.
Giải nén
Giả sử bạn có một tập dữ liệu chứa thông tin sau. Các hàng trong bảng sau tương ứng với các quốc gia, trong khi các cột hiển thị thông tin về GDP trên mỗi Capita và Tỷ lệ biết đọc biết viết cho các quốc gia tương ứng trong các hàng. (Lưu ý:Đây chỉ là giá trị giả, không phải giá trị thực)
Country | GDP trên mỗi Capita | Tỷ lệ biết chữ |
Pháp | 30.000 | 95% |
Đức | 25.000 | 96% |
Nếu bạn bỏ chia một cột, ví dụ:GDP Per Capita, thì tập dữ liệu có cột không được chia sẽ trông như thế này.
Country | Thuộc tính | Giá trị | Khả năng đọc viết |
Pháp | GDP trên mỗi Capita | 30.000 | 95% |
Đức | GDP trên mỗi Capita | 25.000 | 96% |
Bạn có thể thấy rằng cột GDP trên mỗi Capita đã được thay thế bằng hai cột, tức là Thuộc tính và Giá trị. Các giá trị trong cột "Thuộc tính" tương ứng với tên cột được bỏ phân chia, trong khi cột "Giá trị" chứa các giá trị đã tồn tại trước đó trong cột không được phân chia. Vì chỉ một cột duy nhất không được phân chia nên các giá trị trong cột "Thuộc tính" sẽ luôn giống nhau. Ngoài ra, số hàng trong tập dữ liệu có một cột không được phân chia sẽ vẫn giữ nguyên.
Bây giờ chúng ta hãy thử xem điều gì sẽ xảy ra khi chúng ta bỏ chia hai cột. Chúng tôi sẽ bỏ chia cả hai cột GDP Per Capita và Tỷ lệ biết đọc biết viết trong tập dữ liệu gốc. Tập dữ liệu có hai cột không được phân chia sẽ trông như thế này.
Country | Thuộc tính | Giá trị |
Pháp | GDP trên mỗi Capita | 30.000 |
Pháp | Tỷ lệ biết chữ | 95% |
Đức | GDP trên mỗi Capita | 25.000 |
Đức | Tỷ lệ biết chữ | 96% |
Trong tập dữ liệu trên, bạn có thể thấy rằng đối với mỗi tên quốc gia, cột "Thuộc tính" hiện chứa hai giá trị duy nhất:GDP trên mỗi Capita và Tỷ lệ biết đọc biết viết. Cột "Giá trị" chứa các giá trị tương ứng cho các Thuộc tính. Chú ý rằng số hàng đã tăng gấp đôi. Tương tự, nếu bạn bỏ chia ba cột, số hàng trong tập dữ liệu sẽ tăng lên ba lần.
Xoay vòng
Pivoting, như tên cho thấy, đề cập đến quá trình được sử dụng để đảo ngược một tập dữ liệu chưa được chia thành dạng ban đầu của nó. Ví dụ:trong việc xoay vòng bảng đầu vào trông giống như sau:
Country | Thuộc tính | Giá trị |
Pháp | GDP trên mỗi Capita | 30.000 |
Pháp | Tỷ lệ biết chữ | 95% |
Đức | GDP trên mỗi Capita | 25.000 |
Đức | Tỷ lệ biết chữ | 96% |
Sau khi áp dụng xoay vòng trên cột "Thuộc tính" và "Giá trị", tập dữ liệu có dạng sau:
Country | GDP trên mỗi Capita | Tỷ lệ biết chữ |
Pháp | 30.000 | 95% |
Đức | 25.000 | 96% |
Bây giờ chúng ta đã biết xoay vòng và hủy phân chia là gì, hãy xem cách triển khai chúng với Power BI.
Pivoting và Unpoting với Power BI
Trước tiên, hãy xem ví dụ về cách bỏ chia một cột bằng trình chỉnh sửa truy vấn Power BI. Nếu bạn nhìn vào tập dữ liệu, nó chứa một cột có tên là “Dân số”. Để bỏ chia cột "Dân số", hãy nhấp vào tiêu đề cột và sau đó chọn tùy chọn "Chuyển đổi" từ menu trên cùng. Bạn sẽ thấy một menu mới với một số tùy chọn xuất hiện ở trên cùng, hãy nhấp vào tùy chọn “Bỏ chia cột” từ menu và sau đó nhấp vào “Bỏ chia cột” từ danh sách thả xuống, như được hiển thị bên dưới:
Cột "Dân số" sẽ được thay thế bằng cột "Thuộc tính" và "Giá trị", như được hiển thị bên dưới:
Bây giờ, để xoay một cột, bạn có hai tùy chọn. Bạn có thể nhấp vào tùy chọn “x Cột không phân chia” từ cửa sổ “Các bước được áp dụng”, như được hiển thị trong ảnh chụp màn hình sau.
Tùy chọn khác là chọn một cột và sau đó chọn “Chuyển đổi -> Cột xoay” từ menu trên cùng, như được hiển thị bên dưới.
Trong khi xoay vòng một cột, bạn phải chỉ định cột chứa các giá trị cho cột không được phân chia. Trong trường hợp của chúng tôi, cột "Giá trị" chứa các giá trị cho cột "Thuộc tính" chưa được chia. Hãy xem ảnh chụp màn hình sau để tham khảo.
Cột “Dân số” được xoay vòng trông giống như sau:
Di chuyển cột “Dân số” ngay bên cạnh “Cửa sổ bật lên. Mật độ (mỗi dặm vuông) ”bằng cách nhấp vào tiêu đề cột“ Dân số ”và kéo, như được hiển thị trong ảnh chụp màn hình sau.
Tiếp theo, chúng tôi sẽ bỏ chia hai cột, tức là "Dân số" và "Phổ biến. Mật độ (trên mi vuông) ”. Chọn cả hai tiêu đề cột và sau đó bỏ chia chúng, như được hiển thị bên dưới:
Sau khi giải nén, bạn sẽ thấy hai cột sau được tạo trong tập dữ liệu. Bạn có thể thấy rằng cột "Thuộc tính" hiện chứa thông tin về "Dân số" và "Phổ biến. Mật độ (mỗi dặm vuông) ”.
Chọn cả hai tiêu đề cột (CTRL + Nhấp chuột) và sau đó kéo các cột ngay bên cạnh cột “Quốc gia”, như được hiển thị bên dưới.
Giờ đây, bạn có thể thấy tên "Quốc gia", tổng dân số và mật độ dân số trên một dặm vuông của họ. Hãy thay đổi tên của cột "Thuộc tính" thành "Loại dân số" vì cột "Thuộc tính" hiển thị hai loại dân số:tổng dân số và mật độ dân số trên một dặm vuông. Tập dữ liệu có tên tiêu đề cột được cập nhật trông giống như sau:
Tách các cột
Trước khi tách cột, chúng tôi sẽ thay thế một số giá trị trong cột "Loại dân số".
Giá trị "Dân số" trong cột "Loại dân số" đề cập đến tổng dân số. Chúng tôi sẽ thay thế giá trị “Dân số” bằng “Dân số”. Total ”để nó có cùng kiểu với“ Pop. Mật độ (trên mi vuông) ”. Để thay thế các giá trị trong các cột, hãy chuyển đến “Chuyển đổi -> Thay thế Giá trị”, như được hiển thị trong ảnh chụp màn hình sau.
Sau khi thay thế các giá trị, tập dữ liệu trông như thế này.
Bây giờ, chúng tôi sẽ chia cột "Loại dân số" thành hai. Năm ký tự đầu tiên của nó sẽ được thêm vào cột đầu tiên, trong khi các ký tự còn lại sẽ được thêm vào cột khác. Để tách cột, hãy chuyển đến “Chuyển đổi -> Chia cột”. Chúng tôi sẽ chia theo năm ký tự đầu tiên, do đó, hãy chọn tùy chọn “Chia theo số ký tự” từ menu thả xuống. Chúng tôi sẽ chia cột theo 5 ký tự đầu tiên ngoài cùng bên trái. Để tham khảo, hãy xem ảnh chụp màn hình sau.
Sau khi các cột được tách ra, bạn sẽ thấy hai cột sau.
Chúng tôi chỉ cần cột “Loại dân số 2” vì cột này chứa thông tin về loại hoặc quy mô dân số. Nhấp vào cột “Loại dân số 1” và sau đó chọn “Xóa”.
Cuối cùng, bạn có thể đổi tên cột “Loại dân số 2” thành “Loại dân số” như được hiển thị bên dưới.
Từ hình sau, bạn có thể thấy rằng có hai loại giá trị dân số khác nhau cho mỗi quốc gia. Giá trị "Tổng" trong cột "Loại dân số" đề cập đến tổng dân số của quốc gia. Giá trị thực tế cho tổng dân số được lưu trữ trong cột "Giá trị dân số". Tương tự, giá trị “Mật độ (mỗi dặm vuông)” cho thấy rằng giá trị dân số này đề cập đến mật độ dân số.
Kết luận
Tóm lại, bài viết hướng dẫn bạn cách thực hiện xoay và hủy chia trong trình chỉnh sửa truy vấn Power BI. Ngoài ra, nó bao gồm lý thuyết cơ bản đằng sau các cột xoay vòng và không phân chia được minh họa bằng các ví dụ rõ ràng. Cuối cùng, bài viết giải thích cách thực hiện quá trình tách cột trong trình chỉnh sửa truy vấn Power BI.