(+84) 236.3827111 ex. 402

Phân cụn dữ liệu


Phân cụn dữ liệu là gì?

• Phân tập DL thànhcác cụm, và chỉ cần lưu trữ đại diện của cụm

• Có thể rất hiệu quả nếu DL là được phân cụm mà không chứa dữ liệu “bẩn”
• Có thể phân cụm phân cấp và được lưu trữ trong cấu trúc cây chỉ số đa chiều
• Tồn tài nhiều lựa chọn cho xác định phân cụm và thuật toán phân cụm

Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Các thuật toán phân cụm (Clustering Algorithms) đều sinh ra các cụm (clusters). Tuy nhiên, không có tiêu chí nào là được xem là tốt nhất để đánh hiệu của của phân tích phân cụm, điều này phụ thuộc vào mục đích của phân cụm như: data reduction, “natural clusters”, “useful” clusters, outlier detection

Files đính kèm