Reinforcement Learning

Reinforcement Learning (Học tăng cường) là một loại học máy trong đó một tác nhân học cách tương tác với một môi trường để tối đa hóa phần thưởng tích lũy. Tác nhân học bằng cách thử và sai, nhận phần thưởng cho các hành động tốt và hình phạt cho các hành động xấu. Reinforcement Learning được sử dụng trong nhiều ứng dụng, bao gồm robot, trò chơi và lái xe tự động. Nó cũng được áp dụng trong việc huấn luyện LLM để đánh giá các câu trả lời và chọn ra câu trả lời đúng, hay và chính xác, để mô hình tự cải thiện dần theo thời gian.

Các thuật ngữ liên quan

Facebook Messenger

fb.com/toidicodedao

Email Support

[email protected]

Telegram

t.me/hoccodeai