Reinforcement Learning
Reinforcement Learning (Học tăng cường) là một loại học máy trong đó một tác nhân học cách tương tác với một môi trường để tối đa hóa phần thưởng tích lũy. Tác nhân học bằng cách thử và sai, nhận phần thưởng cho các hành động tốt và hình phạt cho các hành động xấu. Reinforcement Learning được sử dụng trong nhiều ứng dụng, bao gồm robot, trò chơi và lái xe tự động. Nó cũng được áp dụng trong việc huấn luyện LLM để đánh giá các câu trả lời và chọn ra câu trả lời đúng, hay và chính xác, để mô hình tự cải thiện dần theo thời gian.
Các thuật ngữ liên quan
Chào mừng bạn đến với HocCodeAI 👋
Bài viết này là một phần của Danh sách thuật ngữ HocCodeAI.
Hãy ghé thăm trang chủ hoccodeai.com để khám phá thêm nhiều bài viết hữu ích.
Nhớ xem thử khóa học Generative AI của bọn mình để nâng cao kỹ năng của bạn nhé!
Hãy ghé thăm trang chủ hoccodeai.com để khám phá thêm nhiều bài viết hữu ích.
Nhớ xem thử khóa học Generative AI của bọn mình để nâng cao kỹ năng của bạn nhé!