Skip to content

CyberSoft Data Analyst 08 - EDA Advanced

Notifications You must be signed in to change notification settings

Tynab/EDA-Advanced

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

BÀI TẬP

Sử dụng Pandas và Seaborn thực hiện phân tích EDA cho dữ liệu bán hàng (supermarket_sales_vn.csv)

  • Đơn biến (phân tích trên 1 cột):
    • Số đơn: so sánh tổng đơn theo chi nhánh, nhóm hàng, giới tính khách hàng, phương thức thanh toán (cột Payment).
    • Mỗi đơn hàng có một số mặt hàng, vẽ phân bố số lượng đơn theo số mặt hàng (chẳng hạn các đơn hàng có 1, 2, 3, ... mặt hàng có số đơn là bao nhiêu?).
    • Thời gian: ngày nào bận rộn nhất tuần? thời điểm nào bận rộn nhất trong ngày?
  • Đa biến (cần kết hợp 2 hay nhiều cột):
    • Doanh thu: tỷ lệ tổng doanh thu theo chi nhánh, nhóm hàng, giới tính khách hàng.
    • Thuế: tương tự doanh thu.
    • Rating: so sánh rating giữa các nhóm hàng, giữa các ngày trong tuần, giới tính.
    • Xem xét mối tương quan giữa các biến dạng số.