GGML là gì - Thuật ngữ Generative AI tiếng Việt

GGML

GGML là một định dạng được tối ưu hóa để chạy LLM trên GPU và CPU, sử dụng llama.cpp. Định dạng này cho phép chạy hoàn toàn trên RAM mà không cần GPU (nhưng rất chậm), hoặc tải một phần của mô hình lên VRAM và RAM để chạy các mô hình lớn khi card yếu. Có nhiều lựa chọn về kích thước và độ chính xác, từ 8bit chất lượng tốt nhất đến Q4_0 hoặc Q4_K_M tiết kiệm RAM hơn. Tuy nhiên, GGUF là phiên bản cải tiến của GGML, ra mắt vào 21/8/2023 và được sử dụng phổ biến hơn hiện nay. Khóa học này sẽ giúp bạn hiểu rõ hơn về GGML và GGUF.

Các thuật ngữ liên quan

Large Language Model

GGUF

Checkpoint

Chào mừng bạn đến với HocCodeAI 👋

Bài viết này là một phần của Danh sách thuật ngữ HocCodeAI.
Hãy ghé thăm trang chủ hoccodeai.com để khám phá thêm nhiều bài viết hữu ích.
Nhớ xem thử khóa học Generative AI của bọn mình để nâng cao kỹ năng của bạn nhé!