(+84) 236.3827111 ex. 402

Cây quyết đinh


Chủ đề 3. Cây quyết định

Bài tập 2. Xây dựng cây quyết định cho bộ dữ liệu sau

Trời

Nhiệt độ

Gió

Đi chơi

Nắng

Cao

Không

Nắng

Cao

Không

âm u

Cao

Mưa

Vừa

Không

Mưa

Thấp

Không

Bài tập 3. Xây dụng cây quyết định về 3 loại trái cây, xác định 1 điểm dữ liệu mới là cam, táo hay chanh?

from sklearn import tree

import matplotlib.pyplot as plt

# Dữ liệu đầu vào: [trọng lượng (grams), vỏ: 0=nhẵn, 1=sần sùi]

features = [

[150, 0], # táo

[130, 0], # táo

[180, 1], # cam

[160, 1], # cam

[120, 1], # chanh

[100, 1], # chanh

]

# Nhãn tương ứng

labels = ['táo', 'táo', 'cam', 'cam', 'chanh', 'chanh']

# Khởi tạo mô hình

clf = tree.DecisionTreeClassifier()

clf = clf.fit(features, labels)

# Vẽ cây quyết định

plt.figure(figsize=(6,6))

tree.plot_tree(clf, feature_names=['Trọng lượng', 'Vỏ (0=nhẵn,1=sần sùi)'], class_names=clf.classes_, filled=True)

plt.show()