11 thuật ngữ phổ biến về Generative AI và định nghĩa

Ở bài viết trước, chúng ta đã cùng nhau tìm hiểu về Generative AI là gì và có tầm quan trọng như thế nào trong thực tiễn. Tuy nhiên, nếu chỉ dừng lại ở khái niệm thì chúng ta sẽ khó có thể hiểu về bản chất, cách thức vận hành cũng như ứng dụng thực tiễn của lĩnh vực này. Vậy nên, hôm nay cùng nhau tìm hiểu thêm về những thuật ngữ liên quan đến AI tạo sinh hay trí tuệ nhân tạo tạo sinh nhé!

Hiểu về các thuật ngữ phổ biến trong Generative AI
Các thuật ngữ phổ biến về Generative AI và định nghĩa
- Xử lý ngôn ngữ tự nhiên - Natural Language Processing (NLP): Được xem là một nhánh quan trọng của AI, nó cho phép máy tính hiểu, phân tích và tạo lập ra ngôn ngữ của con người. Điều này nhằm mục đích hiểu và xử lý thông tin trong các ngôn ngữ mà con người sử dụng hàng ngày một cách dễ dàng và hiệu quả hơn.

Natural Language Processing là gì?
- Transformer: được ra mắt bởi một nhóm tác giả của một nhóm tác giả tại Google Brain vào năm 2017, là kiến trúc mạng thần kinh có thể đào tạo các mô hình lớn hơn đáng kể trên các tập dữ liệu lớn hơn bao giờ hết so với ngày trước. Nó cho phép sự xuất hiện của các LLM (Large Language Model - mô hình ngôn ngữ với khả năng tạo ngôn ngữ và các tác vụ xử lý ngôn ngữ tự nhiên) để xử lý các chuỗi từ, nhận ra các mẫu và mối quan hệ trong văn bản. Transformer được dùng chủ yếu ở lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) và thị giác máy tính (CV).
- Mô hình ngôn ngữ lớn (LLM): Một mô hình chuyên sâu về tạo văn bản và các tác vụ về xử lý ngôn ngữ tự nhiên. Hiện nay hầu hết tất cả những mô hình này đều dựa trên kiến trúc máy biến áp (với các biến thể so với kiến trúc ban đầu).
Ví dụ:
+ Các mô hình nguồn đóng: PaLM của GCP, GPT3/3.5/4 của OpenAI, Bedrock của AWS, Claude của Anthropic,...
+ Các mô hình nguồn mở: Google FLAN-T5 & FLAN-UL2, Falcon, MPT-7B,...
- Mô hình được đào tạo trước/Mô hình nền tảng (Pre-trained Model/Foundational Model): là mô hình học máy được đào tạo trên một tập dữ liệu lớn và có thể tinh chỉnh cho từng nhiệm vụ cụ thể khác nhau. Các mô hình được đào tạo trước thường được sử dụng làm điểm khởi đầu để phát triển các mô hình ML. Bởi vì chúng cung cấp một tập hợp các trọng số và độ lệch ban đầu có thể tinh chỉnh được cho từng nhiệm vụ cụ thể.

Fine-tuning
- Tinh chỉnh - Fine-tuning: Quá trình lấy một mô hình và điều chỉnh nó cho phù hợp với một nhiệm vụ, công việc cụ thể như tạo văn bản, tóm tắt văn bản hay trả lời câu hỏi,... bằng cách đào tạo mô hình đó theo cách có giám sát. So với quá trình tạo mô hình ban đầu thì tinh chỉnh yêu cầu ít dữ liệu và tính toán hơn nhiều nhưng vẫn đảm bảo hoạt động tốt và tối ưu.
- Ảo giác - Hallucination: Ảo giác trong AI là tình huống xảy ra khi mô hình AI sinh ra một kết quả sai lệch hoặc gây hiểu lầm. Và chủ yếu nguyên nhân cốt lõi là vì nó sử dụng “kiến thức” nội bộ (những gì nó đã được đào tạo) nhưng kiến thức đó không áp dụng được cho truy vấn của người dùng.
- AI đa phương thức - Multi-modal AI: Có nghĩa là thay vì một loại AI chỉ có khả năng xử lý và hiểu từ một loại đầu vào riêng biệt thì chúng có thể xử lý các loại đầu vào khác nhau như văn bản, lời nói, hình ảnh và video,...
- Mô hình truy xuất - Retrieval Model: một hệ thống được sử dụng để truy xuất dữ liệu từ nguồn thông tin được cung cấp. Trong trường hợp nếu kết hợp các mô hình truy xuất với các mô hình ngôn ngữ lớn sẽ giúp giải quyết một phần vấn đề ảo giác bằng cách neo LLM vào một kho dữ liệu đã biết.
- Cửa hàng Vector - Vector Store: là một loại kho lưu trữ dữ liệu chuyên quản lý các biểu diễn vectơ của tài liệu (được gọi là phần nhúng). Các kho này dều được tối ưu hóa để tìm thấy các lân cận gần nhất một cách hiệu quả (theo các số liệu khoảng cách khác nhau) và đồng thời cũng là các phần kiến trúc trung tâm của nền tảng Generative AI.

Enterprise AI
- AI doanh nghiệp - Enterprise AI: Là một dạng trí tuệ nhân tạo cung cấp cho người dùng những hiểu biết mang tính dự đoán để cải thiện hiệu suất của các quy trình cũng như hệ thống doanh nghiệp của họ.
- Generative AI dành cho tìm kiếm doanh nghiệp - Generative AI for Enterprise Search: Giúp truy cập thông tin chi tiết mang tính dự đoán và những dữ liệu cơ bản của các ứng dụng AI doanh nghiệp - Enterprise AI. Điều này giúp hỗ trợ cải thiện khả năng ra quyết định cho tất cả người dùng doanh nghiệp.
