18/12/2021 10:48:18 PM

Quan hệ doanh nghiệp

Các bước triển khai thuật toán Q_Learning

Các bước thực hiện thuật toán Q_Leaning

1. Khởi tạo bảng giá trị Q, Q(s,a).

2. Quan sát trạng thái hiện tại s.

3. Lựa chọn hành động a cho trạng thái dựa vào một trong các chiến lược lựa chọn hành động (ε-soft, ε-greedy hoặc softmax).

4. Thực hiện hành động và quan sát giá trị r cũng như trạng thái mới s’.

5. Cập nhật giá trị Q cho trạng thái sử dụng giá trị tăng cường được quan sát và giá trị tăng cường lớn nhất có thể cho trạng thái tiếp theo. Việc thực hiện được cập nhật dựa theo công thức mô tả ở trên.

6. Thiết lập trạng thái đến trạng thái mới và lặp lại quá trình này đến tận khi gặp được trạng thái kết thúc.

» Các tin khác:

Tuyển thực tập sinh Game - Công ty Ubisoft (29/01/2021)
Cuộc thi "Awaken your Inner Fire 2020" (10/12/2020)
Thông báo tổ chức tuyển Internship và Fresher công ty DAC Tech ngày 28/5 (15/05/2020)
THÔNG BÁO XÉT TUYỂN CHƯƠNG TRÌNH KỸ SƯ CNTT VIỆT - NHẬT DO CÔNG TY RIKKEISOFT TÀI TRỢ. (02/11/2019)
THÔNG BÁO VỀ VIỆC THAM DỰ SEMINAR HỌC BỔNG CỦA VNPT (01/11/2019)
Seminar AI-Machine Learning- STEM (20/03/2019)
Kế hoạch tổ chức Company visit tháng 1/2019 (Công ty Framgia) dành cho các em sinh viên năm 3 K22 (CNTT) (05/01/2019)
Gameloft Đà Nẵng tổ chức Cuộc thi “Asphalt Contest 2019” (24/12/2018)
Hội thảo tuyển dụng thực tập tại Duy Tân với công ty Gameloft (11/11/2018)
[Gameloft] - AI CONTEST 2018 (10/07/2018)

Hôm nay, ngày

25/08/2025

Tuần học:

Sinh viên tiêu biểu

video

Số lượt truy cập: 10283845