Power Query – Cách nhập và chuẩn hoá dữ liệu từ nhiều file excel từ folder chứa file hỗn tạp (P2)
Chào các bạn, tiếp nối phần 1 hướng dẫn nhập và chuẩn hóa dữ liệu từ nhiều file excel ở tuần trước, trong phần này, dataMAKER tiếp tục hướng dẫn các bạn cách đọc file tổng hợp từ những file đã được nhập. Vui lòng xem P1 trước khi xem bài viết này.
Sau khi nhập các file theo hướng dẫn ở phần trước như ảnh sau:
Để lấy được thông tin của file này bạn thực hiện các bước như sau.
Bước 1: Tạo cột với hàm Excel.Workbook():
Bạn tạo một cột bằng cách thao tác: Add Column > Custom Column. Xuất hiện hộp thoại và nhập Excel.Workbook([Content],true) như ảnh sau:
Tiếp theo, bạn giữ lại 2 Cột là Name và Datas và xoá các cột còn lại như ảnh sau:
Bước 2: Đọc thông tin file
Bạn nhấn vào icon Expand tại cột Datas như ảnh sau:
Xuất hiện cửa sổ như ảnh sau:
Bạn nhấn OK để được kết quả như hình bên dưới:
Bước 3: Lọc và bỏ cột thừa:
Cột Datas.Kind, bạn chỉ tick chọn Sheet như ảnh sau, sau đó nhấn Ok:
Tại cột Datas.Name, bạn di con trỏ chuột đến “Text Filters” và chọn “Does Not Begin With…” như ảnh bên dưới:
Một cửa sổ Filter Rows sẽ xuất hiện, tại ô thứ 2 dưới mục “Keep rows where ‘Datas.Name'”, bạn gõ “Sheet” vào như ảnh sau:
Sau khi nhấn Ok, bạn sẽ thu được kết quả:
Bước 4: Lấy thông tin từ các Sheet trong file.
Tiếp theo bạn nhấn vào icon expand được phóng to trong ảnh:
Sau khi cửa sổ mới xuất hiện, bạn xem những thông tin nào không cần thiết thì bỏ tích.
Sau đó nhấn OK, bạn sẽ thu được kết quả sau:
Cuối cùng, các bạn xoá cột không dùng đến, đổi tên cột như bạn muốn là hoàn thành. Chúc bạn thành công!
Qua bài viết này, các bạn đã phần nào biết cách nhập và chuẩn hoá nhiều file excel trong thư mục.
dataMaker sẽ thực hiện một vài các Tips & tricks về xử lý dữ liệu bằng Power Query, mời các bạn cùng đón đọc thêm ở các bài viết tiếp theo.