Năm Mô Hình Lõi của AI Agent Theo Góc Nhìn Của Y Combinator

marsbitXuất bản vào 2026-05-20Cập nhật gần nhất vào 2026-05-20

Tóm tắt

Biên tập viên: Khi AI Agent phát triển từ các lệnh prompt đơn lẻ và vibe coding sang giai đoạn quy trình làm việc phức tạp hơn, câu hỏi quan trọng không còn là "mô hình có thể hoàn thành nhiệm vụ không", mà là "có thể biến khả năng AI thành tài sổi quy trình có thể tái sử dụng và tích lũy được không". Bài viết, dựa trên GBrain của Garry Tan, tổng kết năm hình thái cốt lõi mà nhiều người dùng các công cụ Agent như Codex, Claude Code, Hermes đang hướng tới: 1. **Kỹ năng (Skills) có thể tham số hóa:** Giống như một lệnh gọi hàm, cùng một quy trình có thể xử lý một loạt vấn đề nhờ thay đổi tham số đầu vào, thay vì chỉ một nhiệm vụ cụ thể như SOP truyền thống. 2. **Khung thực thi nhẹ (Thin Harness):** Đóng vai trò là "tay chân" cho mô hình AI, thực thi tác vụ, quản lý ngữ cảnh với code cốt lõi chỉ khoảng 200 dòng. Lỗi phổ biến là làm "phình to" Harness với quá nhiều công cụ, dẫn đến "thối rữa ngữ cảnh". 3. **Bộ định tuyến (Resolvers):** Giải quyết vấn đề "thối rữa ngữ cảnh" bằng cách lập bảng định tuyến rõ ràng, ánh xạ loại nhiệm vụ với Skill cần gọi, đảm bảo đầu ra ổn định, đúng vị trí. 4. **Tách biệt Tiềm ẩn & Xác định (Latent vs. Deterministic):** Giao công việc đòi hỏi phán đoán, tổng hợp cho LLM; còn các tác vụ cần độ chính xác, lặp lại (như tính toán) thì giao cho hệ thống mã code xác định. 5. **Bộ nhớ (Memory):** Yếu tố then chốt để hệ thống có thể tích lũy. Có thể là thư mục markdown với các trang cho từng đối tượng, kết hợp cơ chế cập nhật, bổ sung tự động (như "dre...

Lời biên tập: Khi AI Agent tiến từ việc sử dụng Prompt một lần và vibe coding, bước vào giai đoạn quy trình làm việc phức tạp hơn, vấn đề thực sự quan trọng không còn là "mô hình có thể hoàn thành nhiệm vụ không" nữa, mà là "có thể kết tủa khả năng AI thành tài sản quy trình có thể tái sử dụng, có thể tích lũy được hay không".

Bài viết này xuất phát từ GBrain của Garry Tan, tổng kết năm mô hình lõi mà nhiều người đang dần hội tụ khi sử dụng các công cụ Agent như Codex, Claude Code, Hermes: Kỹ năng (Skills) có thể tham số hóa, khung thực thi nhẹ (Thin Harness), công cụ định tuyến (Resolvers), tầng thực thi phân biệt phán đoán mô hình và mã code xác định, cùng với Bộ nhớ (Memory) dùng để tích lũy ngữ cảnh lâu dài.

Sự kết hợp của các mô-đun này hướng tới một loại "năng lực quá trình" mới: viết kinh nghiệm thành quy trình, trừu tượng hóa nhiệm vụ thành tham số, giao quy tắc ổn định cho mã code, giao việc phán đoán và tổng hợp cho mô hình, rồi thông qua tầng bộ nhớ để tích lũy liên tục. So với các ứng dụng hoặc lời nhắc (prompt) được tạo ra một lần, hệ thống kiểu này khó sao chép hơn, và cũng có nhiều khả năng trở thành nền tảng giúp cá nhân, nhóm nhỏ hay công ty hình thành lợi thế cạnh tranh lâu dài trong thời đại AI.

Dưới đây là bài viết gốc:

Tôi đã dành một chút thời gian nghiên cứu GBrain của Garry Tan. Là một người không có nền tảng kỹ thuật, cũng không làm việc trong ngành đầu tư mạo hiểm, tôi muốn đúc kết một số cấu trúc hình thái phổ biến mà tôi thấy ở đây, cùng với điểm thực sự thú vị của nó.

Tôi cho rằng, nhiều người đang dần hội tụ về cùng một nhóm cấu trúc lõi. Chúng có thể được tóm tắt thành khoảng 5 hình thái, và cũng đại diện cho hướng phát triển tự nhiên trong cách sử dụng các công cụ AI dạng Agent như Codex, Claude Code, Hermes, OpenClaw.

Bài liên quan: "Thin Harness, Fat Skill: Nguồn gốc thực sự của năng suất AI gấp 100 lần"

Skills: Từ SOP đến "Lệnh gọi phương thức"

Skills gần như là điểm khởi đầu tự nhiên nhất của mọi người. Ngay cả khi không có ai nhắc nhở, người dùng cũng sẽ vô thức xây dựng nó, vì hình thái của nó rất quen thuộc. Ban đầu, tôi hiểu nó như một loại SOP, tức là quy trình vận hành tiêu chuẩn để hoàn thành một việc nào đó. Người dùng cung cấp "việc cần làm", Skill cung cấp "cách làm".

Cách hiểu của Tan là, Skill giống một "lệnh gọi phương thức" hơn. Trong lập trình, lệnh gọi phương thức đề cập đến việc sử dụng các tham số để gọi một quy trình chương trình. Cùng một đoạn mã sẽ chạy mỗi lần, thay đổi là các tham số: dữ liệu gì, vấn đề gì, mục tiêu gì. Ví dụ, cùng một hàm process_invoice có thể xử lý mọi hóa đơn trong hệ thống, không chỉ riêng hóa đơn ban đầu nó được viết ra để xử lý.

Skill cũng có cấu trúc tương tự. Một Skill có tên /investigate có thể chứa bảy bước cố định, và bảy bước này không thay đổi. Cái thay đổi là các tham số: TARGET (đối tượng điều tra là ai hoặc là gì), QUESTION (bạn muốn làm rõ điều gì), DATASET (tìm thông tin ở đâu). Chỉ nó đến một vụ việc tố cáo trong ngành y tế, nó hoạt động như một nhà nghiên cứu phân tích; chỉ nó đến các tài liệu đăng ký SEC, nó hoạt động như một điều tra viên pháp lý. Cùng một tệp, cùng bảy bước, sự khác biệt do thế giới bên ngoài cung cấp.

Điều này khác với SOP truyền thống. Hầu hết SOP được viết cho một vị trí hoặc nhiệm vụ cụ thể, như "xử lý khoản phải trả". Mỗi tình huống sử dụng ứng với một bộ quy trình. Trong khi đó, Skill có mức độ trừu tượng cao hơn, cùng một bộ quy trình có thể xử lý một loại vấn đề. Một Skill được thiết kế tốt có thể hoàn thành công việc của hàng chục SOP, vì thông tin của trường hợp cụ thể được tách ra khỏi tài liệu, chuyển sang các tham số. Cụ thể trong sử dụng thực tế, một số Skill gần với SOP hơn, một số khác thì gần với lệnh gọi phương thức hơn.

Thin Harness: Mô hình là trí thông minh, Harness là tay chân

Mô hình, như Opus, GPT-5.5, là trí thông minh thô; Harness, như Claude Code, Codex CLI, Hermes, OpenClaw, là khung thực thi thực sự giúp mô hình "có tay có chân". Chúng chịu trách nhiệm thực thi vòng lặp, đọc ghi tệp, quản lý ngữ cảnh, thực thi ràng buộc bảo mật. Mã lõi của chúng chỉ khoảng 200 dòng.

Garry đề cập, một sai lầm mà hầu hết mọi người mắc phải là không ngừng nhồi nhét thêm thứ vào Harness, bản thân tôi cũng vậy. Cuối cùng tôi tích lũy được 100 định nghĩa công cụ, cùng một loạt máy chủ MCP. Kết quả là, cửa sổ ngữ cảnh bị chiếm đầy bởi các mô tả công cụ mà nhiệm vụ hiện tại không cần. Mô hình bắt đầu nhầm lẫn nên dùng công cụ nào, độ trễ tăng, độ chính xác giảm, cuối cùng hình thành cái gọi là "suy thoái ngữ cảnh".

Resolvers: Dùng bảng định tuyến giải quyết suy thoái ngữ cảnh

Phương pháp giải quyết suy thoái ngữ cảnh là thiết lập một bảng định tuyến. Tác dụng của Resolver là ánh xạ rõ ràng "loại nhiệm vụ X vừa mới vào" tới "nên gọi Skill Y". Khi bạn chỉ có 5 Skill, bạn không cần Resolver; nhưng khi bạn có 100 Skill, các mô tả sẽ trở nên mơ hồ, mô hình rất dễ không thể gọi đúng Skill vào đúng thời điểm. Resolver dùng quy tắc rõ ràng thay thế cho việc khớp mẫu mơ hồ.

Tan cũng chạy một cơ chế tương tự Resolver cho tệp: một bảng định tuyến độc lập, dùng để quyết định đầu ra của một Skill nào đó nên được đặt vào vị trí nào trong hệ thống tệp. Đây là cùng một cấu trúc "kiểm tra - định tuyến", được áp dụng cho một vấn đề khác. Bằng cách này, đầu ra sẽ ổn định đi vào đúng thư mục, thay vì được đặt vào vị trí mô hình đoán tạm thời.

Skillify là một ý tưởng hỗ trợ khác của anh ấy: đó là một vòng lặp chất lượng, dùng để biến Skill dùng một lần thành cơ sở hạ tầng có thể tái sử dụng lâu dài. Quy trình 10 bước mà Tan mô tả bao gồm: định nghĩa hợp đồng, sử dụng mã code xác định ở nơi phù hợp, kiểm thử đơn vị, kiểm thử tích hợp, đánh giá LLM-as-judge, mục Resolver, script kiểm tra, kiểm tra những Skill nào không có đường dẫn gọi, và kiểm thử khói đầu cuối. Tiêu chuẩn kiểm tra rất đơn giản: nếu bạn phải hỏi mô hình cùng một câu hỏi hai lần, đó là thất bại.

Tiềm ẩn vs. Xác định: Giao phán đoán cho mô hình, giao nhiệm vụ xác định cho mã code

Cần phân biệt cẩn thận công việc nào nên giao cho LLM, công việc nào nên giao cho hệ thống xác định. LLM giỏi phán đoán, tổng hợp, nhận diện mẫu và đọc hiểu hàm ý; nhưng nó không giỏi tính toán số học, tối ưu hóa tổ hợp, cũng không phù hợp xử lý bất kỳ nhiệm vụ nào cần đưa ra cùng một câu trả lời mỗi lần. Về bản chất, LLM mang tính xác suất, khi giải pháp xác định có thể giải quyết vấn đề, thì không nên dùng LLM.

Hầu hết những người không có nền tảng kỹ thuật thường đánh giá thấp giá trị của tầng xác định. Phản ứng mặc định của mọi người là ném mọi thứ cho mô hình. Nhưng nếu một việc có thể hoàn thành bằng cách xác định, thì gần như nên làm như vậy. Và bạn không cần phải là lập trình viên, vì mô hình có thể viết mã code thay bạn. Điều thực sự cần rèn luyện là một kỷ luật: mỗi lần đều tự hỏi, việc này có thể hoàn thành một cách ổn định, chi phí thấp bằng mã code không? Nếu câu trả lời là có, hãy để mô hình viết đoạn mã đó ra.

Memory: Khiến hệ thống thực sự có thể tích lũy

Để hệ thống trở nên hữu ích, nó phải có một dạng bộ nhớ nào đó. Tôi chưa chắc hình thái chính xác nhất là gì, hiện nay nhiều người cũng đang xây dựng bằng các cách khác nhau: embedding vector, độ tương tự ngữ nghĩa, đồ thị tri thức, lưu trữ hỗn hợp... Cách làm của Tan giống tôi: chỉ là một thư mục markdown.

Cấu trúc của anh ấy là: mỗi người một trang, mỗi công ty một trang, mỗi khái niệm một trang. Mỗi trang, phần trên cùng là "Kết luận đáng tin cậy hiện tại", tức là phán đoán tổng hợp được viết lại và cập nhật liên tục cùng với bằng chứng mới; phần dưới cùng là một dòng thời gian chỉ ghi thêm, không ghi đè.

Lựa chọn markdown mang lại một vài kết quả. Thứ nhất, bản thân tệp chính là bản ghi chính của hệ thống, chứ không phải là một kết quả xuất ra nào đó. Bạn có thể mở nó trong VS Code, chỉnh sửa thủ công, Agent sẽ tự động đọc những thay đổi này. Thứ hai, các quan hệ có kiểu, như works_at, invested_in, founded, attended, advises, sẽ được tự động trích xuất thông qua biểu thức chính quy mỗi lần ghi, do đó đồ thị tri thức có thể tự kết nối mà không tiêu hao token. Lược đồ cụ thể này rất phù hợp với công việc của anh ấy, nhưng đối với người khác, có thể cần tùy chỉnh lại dựa trên nghề nghiệp và bối cảnh kinh doanh của mình.

Ngoài ra, còn có một máy dò tín hiệu chạy ở chế độ nền. Một người được đề cập một lần, sẽ tạo ra một trang stub; nếu anh ta được đề cập ba lần trong nhiều nguồn, sẽ kích hoạt việc bổ sung thông tin trang web; sau khi một cuộc họp kết thúc, sẽ chạy quy trình đầy đủ. Vòng lặp "dream cycle" ban đêm sẽ quét các cuộc trò chuyện, bổ sung thông tin thực thể lỗi thời, và sửa các tham chiếu bị hỏng. Tầng cơ sở là văn bản, tất cả mọi thứ trên đó đều rẻ, có thể kết hợp.

Tất nhiên ở tầng dưới còn có nhiều chi tiết hơn, nhưng tôi cho rằng, đây chính là những nét phác thảo quan trọng nhất trong đó, và chúng có tính phổ biến khá lớn.

Bản thân tôi thực ra đã xây dựng được khoảng một nửa kiến trúc như vậy. Trước đây chưa đạt đến quy mô phải giới thiệu Resolver thực sự, nhưng bây giờ đã đến giai đoạn đó, nên tôi vừa thực hiện một đợt tái cấu trúc nhỏ, khiến hệ thống của mình trở nên độc lập với mô hình, và tích hợp sẵn Resolver. Hiện tại phần then chốt tôi chưa xây dựng, là máy dò tín hiệu chạy tự động nền và vòng lặp dream cycle ban đêm, tức là cơ chế tự động bổ sung và tổ chức thông tin, đây là phần tôi muốn thử thêm vào tiếp theo.

Tôi nghi ngờ, việc những người xây dựng khác nhau đang hội tụ về cấu trúc tương tự, bản thân nó đã là một tín hiệu: hình thái này mặc dù chưa chắc áp dụng cho tất cả mọi người, nhưng nhìn chung có khả năng hữu ích. Ngay cả khi chi tiết triển khai cụ thể sẽ có sự khác biệt quan trọng, nhưng cấu trúc tổng thể này, đang được ngày càng nhiều người tự mình mò mẫm ra một cách độc lập.

Câu hỏi tôi vẫn luôn tự hỏi gần đây là: Làm thế nào để dùng AI thiết lập lợi thế cạnh tranh bền vững?

Mọi người đều rất hào hứng với các ứng dụng vibe-coded và prompt dùng một lần, điều đó tất nhiên rất tuyệt. Bản thân tôi ban đầu cũng bắt đầu bằng cách chơi như vậy, và vì thế mà đam mê. Nhưng bất cứ thứ gì có thể xây dựng thông qua prompt một lần, giá cân bằng cuối cùng của nó sẽ giảm xuống đến chi phí token cần thiết để xây dựng nó, tức là vài xu.

Ví dụ, ai đó sao chép MyFitnessPal, bán với một nửa giá và kiếm được 1 triệu USD, điều đó tất nhiên rất ấn tượng. Nhưng chẳng mấy chốc sẽ có người khác sao chép nó, và bán với giá thấp hơn. Vòng lặp này sẽ tiếp tục mãi, cho đến khi không gian lợi nhuận bị nén hoàn toàn.

Thứ thực sự bền vững, là một loại "năng lực quy trình". Dùng khuôn khổ "7 Powers" của Hamilton Helmer, kiến trúc trên ngầm ẩn chứa chính là sức mạnh quy trình (process power).

"7 Powers" đề xuất, lý do doanh nghiệp có thể duy trì tỷ suất lợi nhuận cao hơn mức trung bình thị trường trong thời gian dài, là vì nó sở hữu một trong bảy loại sức mạnh cấu trúc này. Bất kỳ lợi thế nào không bắt rễ từ những sức mạnh này, cuối cùng đều sẽ bị cạnh tranh xói mòn.

Đối với các doanh nghiệp vừa và nhỏ cùng công ty giai đoạn đầu, trong bảy sức mạnh của Helmer, có năm loại cơ bản là những cánh cửa đóng kín. Kinh tế theo quy mô cần quy mô; hiệu ứng mạng và chi phí chuyển đổi có thể xây dựng, nhưng cần tích lũy cơ sở người dùng khổng lồ trước; tài nguyên độc quyền thường có nghĩa là bằng sáng chế hoặc tài sản tương tự, đây không phải thứ mà đa số công ty có thể sở hữu; thương hiệu thường cần mười năm tích lũy, không thể đi tắt.

Hai loại còn lại, là định vị ngược (counter-positioning) và năng lực quy trình.

Định vị ngược chỉ một mô hình kinh doanh mà các gã khổng lồ hiện có không thể bắt chước, vì một khi bắt chước, sẽ làm tổn thương chính hoạt động kinh doanh vốn có của họ. Cơ hội này đôi khi tồn tại, nhưng không phải lúc nào cũng có được.

Như vậy, con đường thực tế nhất còn lại là năng lực quy trình. Và một hệ thống AI được thiết kế tốt, chính là công cụ có thể tạo ra năng lực quy trình.

Điều này về bản chất cùng một loại công việc với việc thiết lập SOP chất lượng cao hoặc phát triển phần mềm độc quyền nội bộ: quy trình được mã hóa, trường hợp được tham số hóa, hệ thống xác định tầng dưới nhanh chóng và đáng tin cậy, tầng bộ nhớ thì liên tục tiếp nhận những điều đã học được trong quá khứ. Nó khiến "dịch vụ hóa sản phẩm" được khuếch đại thêm: bạn có thể cung cấp một loại dịch vụ hoặc sản phẩm nào đó với chi phí thấp hơn hoặc chất lượng cao hơn, vì toàn bộ công việc đã được cấu trúc hóa.

Hãy tưởng tượng một kế toán viên xây dựng một hệ thống như vậy. Tầng bộ nhớ là một thư mục, mỗi khách hàng có một tệp markdown, bên trong bao gồm kết luận đáng tin cậy hiện tại, như cấu trúc pháp nhân, lập trường thuế hàng năm, cuộc kiểm toán đang tiến hành, cùng một dòng thời gian, ghi lại các cuộc họp, quyết định và những thay đổi xảy ra.

Cô ấy có một số Skill, như /year-end-review, /quarterly-estimate, /audit-prep. Cùng một bộ quy trình có thể được thực thi tham số hóa cho các khách hàng khác nhau.

Cô ấy còn có một tầng xác định, bao gồm biểu mẫu thuế, bảng khấu hao, tài liệu IRS, biểu mẫu thuế lịch sử của khách hàng...

Cộng thêm một cơ chế tương tự như tổ chức nhật ký hoặc dream cycle. Ví dụ, hệ thống tự động phát hiện vào ban đêm rằng phân bổ K-1 của một đối tác nào đó giảm 40% mà không có thay đổi chiến lược; hoặc nhận thấy cấu trúc khấu trừ văn phòng gia đình của một khách hàng nào đó, có thể di chuyển sang một khách hàng khác, cấu trúc có thể tái sử dụng, nhưng danh tính và quyền riêng tư vẫn ở nguyên chỗ cũ.

Bằng cách này, cô ấy có thể thu một khoản phí bảo hiểm nhỏ, phục vụ nhiều khách hàng hơn mỗi năm, trong khi đối thủ cạnh tranh khó sao chép, vì cấu trúc này không phải xuất hiện từ trên trời rơi xuống sau khi cô ấy thành công, mà đã tích lũy liên tục ngay từ đầu.

Nhìn bề ngoài, công cụ này chỉ là một thư mục markdown. Nhưng mỗi dòng trong mỗi tệp, đằng sau đều đến từ rất nhiều thử nghiệm, xây dựng và lặp lại có ý thức. Thứ thực sự tạo thành rào cản cạnh tranh, không phải bản thân các tệp, mà là năng lực quy trình mà những tệp này mang theo.

Câu hỏi Liên quan

QTheo bài viết, năm hình thái cốt lõi của AI Agent mà YC nhận diện là gì?

ANăm hình thái cốt lõi được nhận diện là: 1. Skills có thể tham số hóa. 2. Khung thực thi nhẹ Thin Harness. 3. Bộ định tuyến Resolvers. 4. Tầng thực thi phân biệt phán đoán mô hình với mã xác định (Deterministic code). 5. Bộ nhớ Memory để tích lũy ngữ cảnh lâu dài.

QSkill trong hệ thống AI Agent được định nghĩa như thế nào và khác với SOP truyền thống ra sao?

ASkill được định nghĩa giống như một lần 'gọi phương thức' trong lập trình, nơi một quy trình cố định được thực thi với các tham số đầu vào khác nhau cho từng trường hợp. Nó khác với SOP truyền thống (thường gắn với một nhiệm vụ hoặc vị trí cụ thể) ở chỗ có tính trừu tượng cao hơn, một Skill được thiết kế tốt có thể xử lý một loạt vấn đề cùng thể loại thay vì chỉ một nhiệm vụ đơn lẻ, nhờ việc tách biệt thông tin cụ thể ra thành tham số.

QVấn đề 'Context Rottenness' (Thối rữa ngữ cảnh) là gì và Resolver giải quyết nó như thế nào?

A'Context Rottenness' xảy ra khi khung thực thi (Harness) chứa quá nhiều định nghĩa công cụ và mô tả không cần thiết cho tác vụ hiện tại, làm đầy cửa sổ ngữ cảnh, khiến mô hình bối rối, giảm độ chính xác và tăng độ trễ. Resolver giải quyết vấn đề này bằng cách hoạt động như một bảng định tuyến, ánh xạ rõ ràng 'loại tác vụ X vừa nhận được' tới 'Skill Y cần gọi' dựa trên các quy tắc minh bạch, thay vì để mô hình tự đoán mò một cách mơ hồ.

QTại sao việc phân biệt công việc giữa lớp tiềm ẩn (Latent - dùng LLM) và lớp xác định (Deterministic - dùng code) lại quan trọng?

AViệc phân biệt này quan trọng vì LLM và mã code có thế mạnh khác nhau. LLM giỏi phán đoán, tổng hợp, nhận diện mẫu và hiểu ẩn ý, nhưng kém ở các tác vụ tính toán, tối ưu hóa tổ hợp hay đòi hỏi kết quả cố định lặp lại. Ngược lại, mã code xác định rất phù hợp cho những tác vụ cần sự ổn định, chính xác và chi phí thấp. Nguyên tắc là: nếu một việc có thể được giải quyết một cách xác định (deterministic), thì nên dùng code. Kỷ luật này giúp hệ thống hiệu quả, đáng tin cậy và tiết kiệm chi phí hơn.

QTheo tác giả, 'Năng lực Quy trình' (Process Power) từ hệ thống AI có thể tạo ra lợi thế cạnh tranh bền vững như thế nào?

A'Năng lực Quy trình' đề cập đến khả năng mã hóa kinh nghiệm thành quy trình, tham số hóa nhiệm vụ, giao công việc xác định cho mã code, giao phán đoán cho mô hình và tích lũy liên tục qua lớp bộ nhớ. Một hệ thống AI được thiết kế tốt sẽ tạo ra năng lực này, cho phép cá nhân hoặc tổ chức cung cấp dịch vụ/sản phẩm với chi phí thấp hơn hoặc chất lượng cao hơn một cách có cấu trúc. Đối thủ khó sao chép vì lợi thế không nằm ở sản phẩm cuối cùng (có thể là một thư mục markdown) mà nằm ở toàn bộ quá trình xây dựng, thử nghiệm và lặp lại đằng sau nó, được tích lũy từ từ. Đây là một trong số ít con đường thực tế để các công ty nhỏ tạo ra lợi thế cạnh tranh lâu dài.

Nội dung Liên quan

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit5 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit5 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ khi các model năm 2025 giành huy chương IMO. 3. **Nơi nắm giữ giá trị:** Dự đoán giá trị sẽ thuộc về tầng ứng dụng, còn các công ty làm model cơ bản có thể không sinh lời, đã không tính đến sự thống trị và lợi nhuận khổng lồ của NVIDIA ở tầng phần cứng tính toán. 4. **Bản quyền:** Nhận định AI có thể "né tránh" vi phạm bản quyền là sai, khi thực tế đã có những vụ kiện và dàn xếp bồi thường lớn nhất lịch sử liên quan đến dữ liệu huấn luyện. **Bài học rút ra sau 3 năm:** * **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể.** * Xu hướng chung: **Đánh giá quá lạc quan về tốc độ, nhưng lại đánh giá thấp mức độ phát triển** về lâu dài. * Sai lầm tinh vi thường nằm ở **sự phân bổ** (ví dụ: tác động việc làm lên nhóm người lao động trẻ), chứ không phải tổng thể. * **Những nhận định có giới hạn, điều kiện đi kèm thường chính xác hơn** những phát biểu tuyệt đối. * Một số câu hỏi lớn vẫn chưa có câu trả lời cuối cùng sau 3 năm. Bản tổng kết này không chỉ chấm điểm cho quá khứ, mà còn đặt ra những quy tắc cho việc dự đoán trong tương lai.

链捕手7 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手7 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

Bài viết cảnh báo về bong bóng đầu tư AI khi phân tích chỉ ra rằng hầu hết các gã khổng lồ công nghệ như Microsoft, Alphabet, Meta, Oracle (trừ Amazon) có thể nhận tỷ suất lợi nhuận âm từ các khoản đầu tư hàng nghìn tỷ USD vào trung tâm dữ liệu AI. Dựa trên kỳ vọng của nhà phân tích về doanh thu và chi tiêu vốn giai đoạn 2025-2030, tốc độ tăng đầu tư (~20%/năm) vượt xa tốc độ tăng doanh thu dự kiến (~15%/năm). Tác giả nhấn mạnh, đầu tư công nghệ hiện giải thích 93% tăng trưởng GDP Mỹ. Nếu các công ty cắt giảm chi tiêu, không chỉ chuỗi cung ứng (Nvidia, TSMC, ASML) bị ảnh hưởng mà nền kinh tế Mỹ có thể suy thoái, kéo theo thị trường chứng khoán lao dốc. Các IPO của OpenAI, Anthropic được xem như cách chuyển giao rủi ro từ nhà đầu tư ban đầu sang các nhà đầu tư tổ chức và cá nhân. Dù cơn sốt có thể kéo dài đến 2026 nhờ IPO, nhưng thực tế toán học khắc nghiệt (cần thêm 2-5 nghìn tỷ USD doanh thu để đạt lợi nhuận 10%) khiến việc điều chỉnh là không tránh khỏi vào 2027-2028, tương tự bong bóng dot-com những năm 2000. Câu hỏi then chốt: ai sẽ trả giá cho cuộc chạy đua cơ sở hạ tầng đắt đỏ này?

marsbit8 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

marsbit8 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

Từ công cụ thành "công nhân": AI đang trở thành lực lượng lao động máy móc Bài viết phân tích sự chuyển dịch trong thị trường AI: từ việc bán token hay giờ GPU đơn thuần, sang một thị trường "lao động máy móc" mới, nơi chính công việc được hoàn thành bởi phần mềm trở thành đối tượng được định giá và giao dịch. Tác giả dự đoán cơ chế định giá AI sẽ phát triển qua bốn giai đoạn: token thô -> thị trường năng lực LLM tiêu chuẩn hóa -> thị trường lao động theo ngành -> thị trường kết quả có thể lập trình. Trong tương lai, doanh nghiệp có thể không còn quan tâm công việc do model hay GPU cụ thể nào thực hiện, mà chỉ quan tâm liệu nó có được giao đúng tiêu chuẩn về độ trễ, độ chính xác, độ tin cậy và chi phí hay không. Điều này cũng làm thay đổi vai trò của con người, chuyển sang giám sát, chịu trách nhiệm, quản lý ngữ cảnh và đưa ra phán quyết cuối cùng - những yếu tố có thể trở nên có giá trị hơn. Bài viết nhấn mạnh AI không chỉ đơn thuần thay thế lao động mà mở rộng thị trường tổng thể. Khi chi phí công việc giảm, nhu cầu có thể tăng lên, tạo ra những loại hình công việc và dịch vụ mới khả thi về mặt kinh tế. Thị trường lao động máy móc sẽ bắt đầu từ những công việc có thể được xác định rõ ràng và đo lường được, hướng tới việc biến lao động máy móc thành một yếu tố sản xuất mới có thể được thu mua, thanh toán và giao dịch.

marsbit8 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

marsbit8 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

Trong bài viết, tác giả phân tích động thái giảm giá API lên tới 99% cho dòng MiMo-V2.5 của Xiaomi và phản bác các ý kiến cho rằng đây chỉ là chiến lược marketing hay "bán lỗ cướp thị trường". Lộ Phúc Lợi, người đứng đầu MiMo, đã công bố một blog kỹ thuật dài 5000 chữ để giải thích cơ sở kỹ thuật của mức giá mới. Bài viết mô tả sáu trụ cột công nghệ chính cho phép mức giảm giá này: 1. **Kiến trúc Hybrid SWA (Sliding Window Attention):** Giảm dung lượng bộ nhớ tạm (KVCache) xuống còn 1/7 so với Full Attention truyền thống. 2. **Quản lý KVCache hai bể riêng biệt:** Tối ưu hóa việc phân bổ bộ nhớ để triệt để tận dụng lợi thế của SWA, tăng gấp 5 lần số lượng người dùng đồng thời. 3. **Hệ thống tiền tố cache được cải tiến:** Đảm bảo an toàn và nâng cao tỷ lệ trúng cache lên tới 93-95%, khiến phần lớn yêu cầu đọc lặp lại hầu như không cần tính toán lại. 4. **Hệ thống lưu trữ phân tán GCache:** Triển khai trực tiếp trên ổ SSD của máy GPU, giảm chi phí lưu trữ xuống gần bằng 0. 5. **Hệ thống điều phối LLM-Router:** Tối ưu định tuyến và lập lịch, ưu tiên các yêu cầu có cache, tăng hiệu suất tổng thể. 6. **Dự đoán đa token (MTP):** Giảm chi phí tạo văn bản (output), hoàn thiện vòng tròn giảm chi phí cho toàn bộ quá trình xử lý. Những cải tiến này, khi kết hợp, tạo ra một chuỗi tối ưu toàn diện làm giảm đáng kể chi phí tính toán và lưu trữ cho mỗi yêu cầu. Bài viết kết luận rằng mức giảm 99% không phải là con số tiếp thị, mà là kết quả có thể chứng minh của một hệ thống kỹ thuật hoàn chỉnh, một phương pháp giảm chi phí đáng để ngành tham khảo.

marsbit10 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

marsbit10 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua CORE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua CORE (CORE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua CORE (CORE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ CORE (CORE) của BạnSau khi mua CORE (CORE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch CORE (CORE)Giao dịch CORE (CORE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 371Xuất bản vào 2024.12.13Cập nhật vào 2025.03.21

Làm thế nào để Mua CORE

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của CORE (CORE) được trình bày dưới đây.

活动图片