Bài gốc | Odaily Planet Daily(@OdailyChina)
Tác giả | Golem(@web 3_golem)
Hiện nay, nếu dân crypto không quan tâm đến AI, rất dễ bị chế giễu (đúng vậy, bạn của tôi, hãy nghĩ xem tại sao bạn lại click vào đây).
Bạn có hoàn toàn không hiểu các khái niệm cơ bản về AI, phải hỏi Doubao ý nghĩa của từng chữ viết tắt trong mỗi câu không? Bạn có cảm thấy bối rối trước các thuật ngữ chuyên ngữ trong các sự kiện offline về AI, và phải giả vờ như mình vẫn online không?
Mặc dù việc bước chân vào ngành AI trong thời gian ngắn là không thực tế, nhưng biết các từ vựng cơ bản tần suất cao trong ngành AI thì không bao giờ thiệt. May mắn thay, bài viết tiếp theo đây là dành cho bạn↓ Thành thật khuyên bạn nên đọc kỹ và lưu lại.
Từ vựng cơ bản (12)
LLM (Mô hình ngôn ngữ lớn)
LLM cốt lõi là mô hình học sâu được huấn luyện từ dữ liệu khổng lồ, giỏi hiểu và tạo ngôn ngữ, nó có thể xử lý văn bản, và ngày càng xử lý được các loại nội dung khác.
Đối lập với nó là SLM (Mô hình ngôn ngữ nhỏ) - thường nhấn mạnh mô hình ngôn ngữ chi phí thấp hơn, triển khai nhẹ hơn, thuận tiện hơn cho việc local hóa.
AI Agent (Tác nhân thông minh AI)
AI Agent không chỉ là "mô hình biết trò chuyện", mà là một hệ thống có thể hiểu mục tiêu, gọi công cụ, thực thi nhiệm vụ theo từng bước, và khi cần thiết còn có thể lập kế hoạch và xác minh. Google định nghĩa agent là phần mềm có thể lập luận dựa trên đầu vào đa phương thức và thực hiện hành động thay người dùng.
Multimodal (Đa phương thức)
Mô hình AI không chỉ đọc chữ, mà có thể đồng thời xử lý nhiều dạng thức đầu vào và đầu ra như văn bản, hình ảnh, âm thanh, video. Google xác định rõ đa phương thức là khả năng xử lý và tạo ra các loại nội dung khác nhau.
Prompt (Từ gợi ý)
Lệnh người dùng nhập vào cho mô hình, là cách thức tương tác cơ bản nhất giữa người và máy.
Generative AI (AI tạo sinh / AIGC)
Nhấn mạnh AI "tạo ra" thay vì chỉ phân loại hoặc dự đoán, mô hình tạo sinh có thể tạo văn bản, mã code, hình ảnh, meme, video, v.v. dựa trên prompt.
Token (Mã thông báo)
Đây là một trong những khái niệm giống "đơn vị Gas" nhất trong giới AI. Mô hình không hiểu nội dung theo "số chữ", mà xử lý đầu vào đầu ra theo token, việc tính phí, độ dài ngữ cảnh, tốc độ phản hồi thường liên quan chặt chẽ đến token.
Context Window (Cửa sổ ngữ cảnh / Độ dài ngữ cảnh)
Chỉ tổng số token mà mô hình có thể "thấy" và sử dụng một lần, cũng có thể gọi là số token mà mô hình có thể xem xét hoặc "nhớ" được khi xử lý đơn lần.
Memory (Bộ nhớ)
Cho phép mô hình hoặc Agent lưu lại sở thích người dùng, ngữ cảnh tác vụ, trạng thái lịch sử.
Training (Huấn luyện)
Quá trình mô hình học các tham số từ dữ liệu.
Inference (Suy luận / Thực thi suy luận)
Trái ngược với huấn luyện, chỉ quá trình mô hình nhận đầu vào và tạo đầu ra sau khi đã triển khai. Trong ngành thường nói "huấn luyện đắt, suy luận còn tốn kém hơn", vì nhiều chi phí trong giai đoạn thương mại hóa thực tế xảy ra ở inference. Việc phân biệt huấn luyện/suy luận liên quan cũng là khung cơ bản khi các nhà cung cấp chính thảo luận về chi phí triển khai.
Tool Use / Tool Calling (Gọi công cụ)
Ý chỉ mô hình không chỉ xuất văn bản, mà có thể đi gọi các công cụ như tìm kiếm, thực thi mã, cơ sở dữ liệu, API bên ngoài, v.v. Điều này đã được coi là một trong những khả năng then chốt của Agent.
API (Giao diện lập trình ứng dụng)
Cơ sở hạ tầng khi sản phẩm, ứng dụng, Agent AI kết nối với dịch vụ của bên thứ ba.
Từ vựng nâng cao (18)
transformer (Kiến trúc Transformer)
Một kiến trúc mô hình giúp AI giỏi hiểu mối quan hệ ngữ cảnh hơn, cũng là nền tảng kỹ thuật của hầu hết các mô hình ngôn ngữ lớn ngày nay, đặc điểm lớn nhất là có thể đồng thời xem mối quan hệ giữa mỗi từ với các từ khác trong cả đoạn nội dung.
Attention (Cơ chế chú ý)
Nó là cơ chế cốt lõi quan trọng nhất của Transformer, tác dụng là để mô hình khi đọc một câu, tự động phán đoán "những từ nào đáng xem trọng điểm nhất".
Agentic / Agentic Workflow (Dạng tác nhân / Quy trình làm việc Agent hóa)
Đây là cách nói rất hot gần đây, ý chỉ một hệ thống không còn là "hỏi một đáp một", mà mang tính tự chủ nhất định để phân giải nhiệm vụ, quyết định bước tiếp theo, gọi khả năng bên ngoài. Nhiều nhà sản xuất coi nó là dấu hiệu "từ Chatbot tiến tới hệ thống có thể thực thi".
Subagents (Tác nhân con)
Một Agent lại tách ra nhiều Agent con chuyên trách để xử lý nhiệm vụ con.
Skills (Mô-đun năng lực có thể tái sử dụng)
Theo sự bùng nổ của OpenClaw, từ này gần đây trở nên phổ biến rõ rệt, đây là đơn vị năng lực/hướng dẫn vận hành có thể cài đặt, tái sử dụng, kết hợp cho AI Agent, nhưng cũng đặc biệt nhắc nhở có nguy cơ lạm dụng công cụ và lộ dữ liệu.
Hallucination (Ảo giác máy móc)
Ý chỉ mô hình nói sai một cách nghiêm túc, "cảm nhận được các mô hình không tồn tại" từ đó tạo ra đầu ra sai hoặc vô lý, đây là đầu ra của mô hình có vẻ hợp lý nhưng thực ra sai, quá tự tin.
Latency (Độ trễ)
Thời gian mô hình mất từ khi nhận yêu cầu đến khi xuất kết quả, thuộc một trong những thuật ngữ kỹ thuật phổ biến nhất, cứ nói đến triển khai và sản phẩm hóa là sẽ xuất hiện thường xuyên.
Guardrails (Lan can)
Dùng để giới hạn mô hình/Agent có thể làm gì, khi nào dừng, nội dung gì không được xuất ra.
Vibe Coding (Lập trình theo cảm giác)
Từ này cũng là thuật ngữ AI hot nhất hiện nay, ý chỉ người dùng trực tiếp thông qua hội thoại để biểu đạt nhu cầu, AI viết code, mà người dùng không cần hiểu cụ thể cách viết code.
Parameters (Tham số)
Quy mô số bên trong mô hình dùng để lưu trữ năng lực và kiến thức, thường được dùng để đo lường một cách thô bạo quy mô mô hình, "trăm tỷ tham số", "nghìn tỷ tham số" đều là cách nói hù dọa phổ biến nhất trong giới AI.
Reasoning Model (Mô hình suy luận mạnh)
Nó thường chỉ các mô hình giỏi suy luận nhiều bước, lập kế hoạch, xác minh, thực thi nhiệm vụ phức tạp hơn.
MCP (Giao thức ngữ cảnh mô hình)
Đây là thuật ngữ mới rất hot trong năm gần đây, tác dụng tương tự như thiết lập giao diện chung giữa mô hình và công cụ/nguồn dữ liệu bên ngoài.
Fine-tuning / Tuning (Tinh chỉnh)
Là tiếp tục huấn luyện trên mô hình cơ sở, làm cho nó thích ứng hơn với nhiệm vụ, phong cách hoặc lĩnh vực cụ thể. Bảng thuật ngữ của Google trực tiếp coi tuning và fine-tuning là các khái niệm liên quan.
Distillation (Chưng cất)
Nén khả năng của mô hình lớn cho mô hình nhỏ nhất có thể, giống như để "thầy" dạy "học trò".
RAG (Tạo sinh tăng cường truy xuất)
Điều này gần như đã trở thành cấu hình cơ bản của AI doanh nghiệp. Microsoft định nghĩa nó là mô hình "tìm kiếm + LLM", sử dụng dữ liệu bên ngoài để grounding cho câu trả lời, giải quyết vấn đề dữ liệu huấn luyện mô hình lỗi thời, không hiểu biết cơ sở kiến thức riêng tư. Mục đích là xây dựng câu trả lời dựa trên tài liệu thực và kiến thức riêng tư, thay vì chỉ dựa vào trí nhớ tham số của mô hình để "tự do phát huy".
Grounding (Căn chỉnh sự thật)
Thường xuất hiện cùng RAG, ý chỉ việc để câu trả lời của mô hình được xây dựng dựa trên các căn cứ bên ngoài như tài liệu, cơ sở dữ liệu, trang web, v.v., thay vì chỉ dựa vào trí nhớ tham số để "tự do phát huy". Microsoft trong tài liệu về RAG đã xác định rõ grounding là giá trị cốt lõi.
Embedding (Vector nhúng / Vector ngữ nghĩa)
Là mã hóa nội dung như văn bản, hình ảnh, âm thanh, v.v. thành vector số chiều cao, để tính toán độ tương đồng ngữ nghĩa.
Benchmark (Kiểm tra điểm chuẩn)
Cách đánh giá sử dụng một bộ tiêu chuẩn thống nhất để kiểm tra năng lực mô hình, cũng là ngôn ngữ bảng xếp hạng mà các hãng mô hình thích dùng nhất để "chứng minh mình mạnh".







