Thuật toán K-Means với bài toán phân cụm dữ liệu
Phân cụm là kỹ thuật rất quan trọng trong khai phá dữ liệu, nó thuộc lớp các phương pháp Unsupervised Learning trong Machine Learning. Có rất nhiều định nghĩa khác nhau về kỹ thuật này, nhưng về bản chất ta có thể hiểu phân cụm là các qui trình tìm cách nhóm các đối tượng đã cho vào các cụm (clusters), sao cho các đối tượng trong cùng 1 cụm tương tự (similar) nhau và các đối tượng khác cụm thì không tương tự (Dissimilar) nhau.
Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Các thuật toán phân cụm (Clustering Algorithms) đều sinh ra các cụm (clusters). Tuy nhiên, không có tiêu chí nào là được xem là tốt nhất để đánh hiệu của của phân tích phân cụm, điều này phụ thuộc vào mục đích của phân cụm như: data reduction, “natural clusters”, “useful” clusters, outlier detection
- Multimodal AI – Bước tiến mới giúp Trí tuệ nhân tạo “hiểu” thế giới như con người
- World Models – Bước tiến mới hướng tới Trí tuệ nhân tạo có khả năng hiểu thế giới
- AI Agents – Thế hệ Trí tuệ nhân tạo có khả năng hành động và tự ra quyết định
- RAG – Công nghệ giúp AI “hiểu đúng tài liệu” và trả lời chính xác hơn
- Naive Bayes Classifier (NBC) là gì? Ứng dụng và lý do mô hình này vẫn được dùng rất nhiều