Năm Mô Hình Lõi của AI Agent Theo Góc Nhìn Của Y Combinator

marsbitXuất bản vào 2026-05-20Cập nhật gần nhất vào 2026-05-20

Tóm tắt

Biên tập viên: Khi AI Agent phát triển từ các lệnh prompt đơn lẻ và vibe coding sang giai đoạn quy trình làm việc phức tạp hơn, câu hỏi quan trọng không còn là "mô hình có thể hoàn thành nhiệm vụ không", mà là "có thể biến khả năng AI thành tài sổi quy trình có thể tái sử dụng và tích lũy được không". Bài viết, dựa trên GBrain của Garry Tan, tổng kết năm hình thái cốt lõi mà nhiều người dùng các công cụ Agent như Codex, Claude Code, Hermes đang hướng tới: 1. **Kỹ năng (Skills) có thể tham số hóa:** Giống như một lệnh gọi hàm, cùng một quy trình có thể xử lý một loạt vấn đề nhờ thay đổi tham số đầu vào, thay vì chỉ một nhiệm vụ cụ thể như SOP truyền thống. 2. **Khung thực thi nhẹ (Thin Harness):** Đóng vai trò là "tay chân" cho mô hình AI, thực thi tác vụ, quản lý ngữ cảnh với code cốt lõi chỉ khoảng 200 dòng. Lỗi phổ biến là làm "phình to" Harness với quá nhiều công cụ, dẫn đến "thối rữa ngữ cảnh". 3. **Bộ định tuyến (Resolvers):** Giải quyết vấn đề "thối rữa ngữ cảnh" bằng cách lập bảng định tuyến rõ ràng, ánh xạ loại nhiệm vụ với Skill cần gọi, đảm bảo đầu ra ổn định, đúng vị trí. 4. **Tách biệt Tiềm ẩn & Xác định (Latent vs. Deterministic):** Giao công việc đòi hỏi phán đoán, tổng hợp cho LLM; còn các tác vụ cần độ chính xác, lặp lại (như tính toán) thì giao cho hệ thống mã code xác định. 5. **Bộ nhớ (Memory):** Yếu tố then chốt để hệ thống có thể tích lũy. Có thể là thư mục markdown với các trang cho từng đối tượng, kết hợp cơ chế cập nhật, bổ sung tự động (như "dre...

Lời biên tập: Khi AI Agent tiến từ việc sử dụng Prompt một lần và vibe coding, bước vào giai đoạn quy trình làm việc phức tạp hơn, vấn đề thực sự quan trọng không còn là "mô hình có thể hoàn thành nhiệm vụ không" nữa, mà là "có thể kết tủa khả năng AI thành tài sản quy trình có thể tái sử dụng, có thể tích lũy được hay không".

Bài viết này xuất phát từ GBrain của Garry Tan, tổng kết năm mô hình lõi mà nhiều người đang dần hội tụ khi sử dụng các công cụ Agent như Codex, Claude Code, Hermes: Kỹ năng (Skills) có thể tham số hóa, khung thực thi nhẹ (Thin Harness), công cụ định tuyến (Resolvers), tầng thực thi phân biệt phán đoán mô hình và mã code xác định, cùng với Bộ nhớ (Memory) dùng để tích lũy ngữ cảnh lâu dài.

Sự kết hợp của các mô-đun này hướng tới một loại "năng lực quá trình" mới: viết kinh nghiệm thành quy trình, trừu tượng hóa nhiệm vụ thành tham số, giao quy tắc ổn định cho mã code, giao việc phán đoán và tổng hợp cho mô hình, rồi thông qua tầng bộ nhớ để tích lũy liên tục. So với các ứng dụng hoặc lời nhắc (prompt) được tạo ra một lần, hệ thống kiểu này khó sao chép hơn, và cũng có nhiều khả năng trở thành nền tảng giúp cá nhân, nhóm nhỏ hay công ty hình thành lợi thế cạnh tranh lâu dài trong thời đại AI.

Dưới đây là bài viết gốc:

Tôi đã dành một chút thời gian nghiên cứu GBrain của Garry Tan. Là một người không có nền tảng kỹ thuật, cũng không làm việc trong ngành đầu tư mạo hiểm, tôi muốn đúc kết một số cấu trúc hình thái phổ biến mà tôi thấy ở đây, cùng với điểm thực sự thú vị của nó.

Tôi cho rằng, nhiều người đang dần hội tụ về cùng một nhóm cấu trúc lõi. Chúng có thể được tóm tắt thành khoảng 5 hình thái, và cũng đại diện cho hướng phát triển tự nhiên trong cách sử dụng các công cụ AI dạng Agent như Codex, Claude Code, Hermes, OpenClaw.

Bài liên quan: "Thin Harness, Fat Skill: Nguồn gốc thực sự của năng suất AI gấp 100 lần"

Skills: Từ SOP đến "Lệnh gọi phương thức"

Skills gần như là điểm khởi đầu tự nhiên nhất của mọi người. Ngay cả khi không có ai nhắc nhở, người dùng cũng sẽ vô thức xây dựng nó, vì hình thái của nó rất quen thuộc. Ban đầu, tôi hiểu nó như một loại SOP, tức là quy trình vận hành tiêu chuẩn để hoàn thành một việc nào đó. Người dùng cung cấp "việc cần làm", Skill cung cấp "cách làm".

Cách hiểu của Tan là, Skill giống một "lệnh gọi phương thức" hơn. Trong lập trình, lệnh gọi phương thức đề cập đến việc sử dụng các tham số để gọi một quy trình chương trình. Cùng một đoạn mã sẽ chạy mỗi lần, thay đổi là các tham số: dữ liệu gì, vấn đề gì, mục tiêu gì. Ví dụ, cùng một hàm process_invoice có thể xử lý mọi hóa đơn trong hệ thống, không chỉ riêng hóa đơn ban đầu nó được viết ra để xử lý.

Skill cũng có cấu trúc tương tự. Một Skill có tên /investigate có thể chứa bảy bước cố định, và bảy bước này không thay đổi. Cái thay đổi là các tham số: TARGET (đối tượng điều tra là ai hoặc là gì), QUESTION (bạn muốn làm rõ điều gì), DATASET (tìm thông tin ở đâu). Chỉ nó đến một vụ việc tố cáo trong ngành y tế, nó hoạt động như một nhà nghiên cứu phân tích; chỉ nó đến các tài liệu đăng ký SEC, nó hoạt động như một điều tra viên pháp lý. Cùng một tệp, cùng bảy bước, sự khác biệt do thế giới bên ngoài cung cấp.

Điều này khác với SOP truyền thống. Hầu hết SOP được viết cho một vị trí hoặc nhiệm vụ cụ thể, như "xử lý khoản phải trả". Mỗi tình huống sử dụng ứng với một bộ quy trình. Trong khi đó, Skill có mức độ trừu tượng cao hơn, cùng một bộ quy trình có thể xử lý một loại vấn đề. Một Skill được thiết kế tốt có thể hoàn thành công việc của hàng chục SOP, vì thông tin của trường hợp cụ thể được tách ra khỏi tài liệu, chuyển sang các tham số. Cụ thể trong sử dụng thực tế, một số Skill gần với SOP hơn, một số khác thì gần với lệnh gọi phương thức hơn.

Thin Harness: Mô hình là trí thông minh, Harness là tay chân

Mô hình, như Opus, GPT-5.5, là trí thông minh thô; Harness, như Claude Code, Codex CLI, Hermes, OpenClaw, là khung thực thi thực sự giúp mô hình "có tay có chân". Chúng chịu trách nhiệm thực thi vòng lặp, đọc ghi tệp, quản lý ngữ cảnh, thực thi ràng buộc bảo mật. Mã lõi của chúng chỉ khoảng 200 dòng.

Garry đề cập, một sai lầm mà hầu hết mọi người mắc phải là không ngừng nhồi nhét thêm thứ vào Harness, bản thân tôi cũng vậy. Cuối cùng tôi tích lũy được 100 định nghĩa công cụ, cùng một loạt máy chủ MCP. Kết quả là, cửa sổ ngữ cảnh bị chiếm đầy bởi các mô tả công cụ mà nhiệm vụ hiện tại không cần. Mô hình bắt đầu nhầm lẫn nên dùng công cụ nào, độ trễ tăng, độ chính xác giảm, cuối cùng hình thành cái gọi là "suy thoái ngữ cảnh".

Resolvers: Dùng bảng định tuyến giải quyết suy thoái ngữ cảnh

Phương pháp giải quyết suy thoái ngữ cảnh là thiết lập một bảng định tuyến. Tác dụng của Resolver là ánh xạ rõ ràng "loại nhiệm vụ X vừa mới vào" tới "nên gọi Skill Y". Khi bạn chỉ có 5 Skill, bạn không cần Resolver; nhưng khi bạn có 100 Skill, các mô tả sẽ trở nên mơ hồ, mô hình rất dễ không thể gọi đúng Skill vào đúng thời điểm. Resolver dùng quy tắc rõ ràng thay thế cho việc khớp mẫu mơ hồ.

Tan cũng chạy một cơ chế tương tự Resolver cho tệp: một bảng định tuyến độc lập, dùng để quyết định đầu ra của một Skill nào đó nên được đặt vào vị trí nào trong hệ thống tệp. Đây là cùng một cấu trúc "kiểm tra - định tuyến", được áp dụng cho một vấn đề khác. Bằng cách này, đầu ra sẽ ổn định đi vào đúng thư mục, thay vì được đặt vào vị trí mô hình đoán tạm thời.

Skillify là một ý tưởng hỗ trợ khác của anh ấy: đó là một vòng lặp chất lượng, dùng để biến Skill dùng một lần thành cơ sở hạ tầng có thể tái sử dụng lâu dài. Quy trình 10 bước mà Tan mô tả bao gồm: định nghĩa hợp đồng, sử dụng mã code xác định ở nơi phù hợp, kiểm thử đơn vị, kiểm thử tích hợp, đánh giá LLM-as-judge, mục Resolver, script kiểm tra, kiểm tra những Skill nào không có đường dẫn gọi, và kiểm thử khói đầu cuối. Tiêu chuẩn kiểm tra rất đơn giản: nếu bạn phải hỏi mô hình cùng một câu hỏi hai lần, đó là thất bại.

Tiềm ẩn vs. Xác định: Giao phán đoán cho mô hình, giao nhiệm vụ xác định cho mã code

Cần phân biệt cẩn thận công việc nào nên giao cho LLM, công việc nào nên giao cho hệ thống xác định. LLM giỏi phán đoán, tổng hợp, nhận diện mẫu và đọc hiểu hàm ý; nhưng nó không giỏi tính toán số học, tối ưu hóa tổ hợp, cũng không phù hợp xử lý bất kỳ nhiệm vụ nào cần đưa ra cùng một câu trả lời mỗi lần. Về bản chất, LLM mang tính xác suất, khi giải pháp xác định có thể giải quyết vấn đề, thì không nên dùng LLM.

Hầu hết những người không có nền tảng kỹ thuật thường đánh giá thấp giá trị của tầng xác định. Phản ứng mặc định của mọi người là ném mọi thứ cho mô hình. Nhưng nếu một việc có thể hoàn thành bằng cách xác định, thì gần như nên làm như vậy. Và bạn không cần phải là lập trình viên, vì mô hình có thể viết mã code thay bạn. Điều thực sự cần rèn luyện là một kỷ luật: mỗi lần đều tự hỏi, việc này có thể hoàn thành một cách ổn định, chi phí thấp bằng mã code không? Nếu câu trả lời là có, hãy để mô hình viết đoạn mã đó ra.

Memory: Khiến hệ thống thực sự có thể tích lũy

Để hệ thống trở nên hữu ích, nó phải có một dạng bộ nhớ nào đó. Tôi chưa chắc hình thái chính xác nhất là gì, hiện nay nhiều người cũng đang xây dựng bằng các cách khác nhau: embedding vector, độ tương tự ngữ nghĩa, đồ thị tri thức, lưu trữ hỗn hợp... Cách làm của Tan giống tôi: chỉ là một thư mục markdown.

Cấu trúc của anh ấy là: mỗi người một trang, mỗi công ty một trang, mỗi khái niệm một trang. Mỗi trang, phần trên cùng là "Kết luận đáng tin cậy hiện tại", tức là phán đoán tổng hợp được viết lại và cập nhật liên tục cùng với bằng chứng mới; phần dưới cùng là một dòng thời gian chỉ ghi thêm, không ghi đè.

Lựa chọn markdown mang lại một vài kết quả. Thứ nhất, bản thân tệp chính là bản ghi chính của hệ thống, chứ không phải là một kết quả xuất ra nào đó. Bạn có thể mở nó trong VS Code, chỉnh sửa thủ công, Agent sẽ tự động đọc những thay đổi này. Thứ hai, các quan hệ có kiểu, như works_at, invested_in, founded, attended, advises, sẽ được tự động trích xuất thông qua biểu thức chính quy mỗi lần ghi, do đó đồ thị tri thức có thể tự kết nối mà không tiêu hao token. Lược đồ cụ thể này rất phù hợp với công việc của anh ấy, nhưng đối với người khác, có thể cần tùy chỉnh lại dựa trên nghề nghiệp và bối cảnh kinh doanh của mình.

Ngoài ra, còn có một máy dò tín hiệu chạy ở chế độ nền. Một người được đề cập một lần, sẽ tạo ra một trang stub; nếu anh ta được đề cập ba lần trong nhiều nguồn, sẽ kích hoạt việc bổ sung thông tin trang web; sau khi một cuộc họp kết thúc, sẽ chạy quy trình đầy đủ. Vòng lặp "dream cycle" ban đêm sẽ quét các cuộc trò chuyện, bổ sung thông tin thực thể lỗi thời, và sửa các tham chiếu bị hỏng. Tầng cơ sở là văn bản, tất cả mọi thứ trên đó đều rẻ, có thể kết hợp.

Tất nhiên ở tầng dưới còn có nhiều chi tiết hơn, nhưng tôi cho rằng, đây chính là những nét phác thảo quan trọng nhất trong đó, và chúng có tính phổ biến khá lớn.

Bản thân tôi thực ra đã xây dựng được khoảng một nửa kiến trúc như vậy. Trước đây chưa đạt đến quy mô phải giới thiệu Resolver thực sự, nhưng bây giờ đã đến giai đoạn đó, nên tôi vừa thực hiện một đợt tái cấu trúc nhỏ, khiến hệ thống của mình trở nên độc lập với mô hình, và tích hợp sẵn Resolver. Hiện tại phần then chốt tôi chưa xây dựng, là máy dò tín hiệu chạy tự động nền và vòng lặp dream cycle ban đêm, tức là cơ chế tự động bổ sung và tổ chức thông tin, đây là phần tôi muốn thử thêm vào tiếp theo.

Tôi nghi ngờ, việc những người xây dựng khác nhau đang hội tụ về cấu trúc tương tự, bản thân nó đã là một tín hiệu: hình thái này mặc dù chưa chắc áp dụng cho tất cả mọi người, nhưng nhìn chung có khả năng hữu ích. Ngay cả khi chi tiết triển khai cụ thể sẽ có sự khác biệt quan trọng, nhưng cấu trúc tổng thể này, đang được ngày càng nhiều người tự mình mò mẫm ra một cách độc lập.

Câu hỏi tôi vẫn luôn tự hỏi gần đây là: Làm thế nào để dùng AI thiết lập lợi thế cạnh tranh bền vững?

Mọi người đều rất hào hứng với các ứng dụng vibe-coded và prompt dùng một lần, điều đó tất nhiên rất tuyệt. Bản thân tôi ban đầu cũng bắt đầu bằng cách chơi như vậy, và vì thế mà đam mê. Nhưng bất cứ thứ gì có thể xây dựng thông qua prompt một lần, giá cân bằng cuối cùng của nó sẽ giảm xuống đến chi phí token cần thiết để xây dựng nó, tức là vài xu.

Ví dụ, ai đó sao chép MyFitnessPal, bán với một nửa giá và kiếm được 1 triệu USD, điều đó tất nhiên rất ấn tượng. Nhưng chẳng mấy chốc sẽ có người khác sao chép nó, và bán với giá thấp hơn. Vòng lặp này sẽ tiếp tục mãi, cho đến khi không gian lợi nhuận bị nén hoàn toàn.

Thứ thực sự bền vững, là một loại "năng lực quy trình". Dùng khuôn khổ "7 Powers" của Hamilton Helmer, kiến trúc trên ngầm ẩn chứa chính là sức mạnh quy trình (process power).

"7 Powers" đề xuất, lý do doanh nghiệp có thể duy trì tỷ suất lợi nhuận cao hơn mức trung bình thị trường trong thời gian dài, là vì nó sở hữu một trong bảy loại sức mạnh cấu trúc này. Bất kỳ lợi thế nào không bắt rễ từ những sức mạnh này, cuối cùng đều sẽ bị cạnh tranh xói mòn.

Đối với các doanh nghiệp vừa và nhỏ cùng công ty giai đoạn đầu, trong bảy sức mạnh của Helmer, có năm loại cơ bản là những cánh cửa đóng kín. Kinh tế theo quy mô cần quy mô; hiệu ứng mạng và chi phí chuyển đổi có thể xây dựng, nhưng cần tích lũy cơ sở người dùng khổng lồ trước; tài nguyên độc quyền thường có nghĩa là bằng sáng chế hoặc tài sản tương tự, đây không phải thứ mà đa số công ty có thể sở hữu; thương hiệu thường cần mười năm tích lũy, không thể đi tắt.

Hai loại còn lại, là định vị ngược (counter-positioning) và năng lực quy trình.

Định vị ngược chỉ một mô hình kinh doanh mà các gã khổng lồ hiện có không thể bắt chước, vì một khi bắt chước, sẽ làm tổn thương chính hoạt động kinh doanh vốn có của họ. Cơ hội này đôi khi tồn tại, nhưng không phải lúc nào cũng có được.

Như vậy, con đường thực tế nhất còn lại là năng lực quy trình. Và một hệ thống AI được thiết kế tốt, chính là công cụ có thể tạo ra năng lực quy trình.

Điều này về bản chất cùng một loại công việc với việc thiết lập SOP chất lượng cao hoặc phát triển phần mềm độc quyền nội bộ: quy trình được mã hóa, trường hợp được tham số hóa, hệ thống xác định tầng dưới nhanh chóng và đáng tin cậy, tầng bộ nhớ thì liên tục tiếp nhận những điều đã học được trong quá khứ. Nó khiến "dịch vụ hóa sản phẩm" được khuếch đại thêm: bạn có thể cung cấp một loại dịch vụ hoặc sản phẩm nào đó với chi phí thấp hơn hoặc chất lượng cao hơn, vì toàn bộ công việc đã được cấu trúc hóa.

Hãy tưởng tượng một kế toán viên xây dựng một hệ thống như vậy. Tầng bộ nhớ là một thư mục, mỗi khách hàng có một tệp markdown, bên trong bao gồm kết luận đáng tin cậy hiện tại, như cấu trúc pháp nhân, lập trường thuế hàng năm, cuộc kiểm toán đang tiến hành, cùng một dòng thời gian, ghi lại các cuộc họp, quyết định và những thay đổi xảy ra.

Cô ấy có một số Skill, như /year-end-review, /quarterly-estimate, /audit-prep. Cùng một bộ quy trình có thể được thực thi tham số hóa cho các khách hàng khác nhau.

Cô ấy còn có một tầng xác định, bao gồm biểu mẫu thuế, bảng khấu hao, tài liệu IRS, biểu mẫu thuế lịch sử của khách hàng...

Cộng thêm một cơ chế tương tự như tổ chức nhật ký hoặc dream cycle. Ví dụ, hệ thống tự động phát hiện vào ban đêm rằng phân bổ K-1 của một đối tác nào đó giảm 40% mà không có thay đổi chiến lược; hoặc nhận thấy cấu trúc khấu trừ văn phòng gia đình của một khách hàng nào đó, có thể di chuyển sang một khách hàng khác, cấu trúc có thể tái sử dụng, nhưng danh tính và quyền riêng tư vẫn ở nguyên chỗ cũ.

Bằng cách này, cô ấy có thể thu một khoản phí bảo hiểm nhỏ, phục vụ nhiều khách hàng hơn mỗi năm, trong khi đối thủ cạnh tranh khó sao chép, vì cấu trúc này không phải xuất hiện từ trên trời rơi xuống sau khi cô ấy thành công, mà đã tích lũy liên tục ngay từ đầu.

Nhìn bề ngoài, công cụ này chỉ là một thư mục markdown. Nhưng mỗi dòng trong mỗi tệp, đằng sau đều đến từ rất nhiều thử nghiệm, xây dựng và lặp lại có ý thức. Thứ thực sự tạo thành rào cản cạnh tranh, không phải bản thân các tệp, mà là năng lực quy trình mà những tệp này mang theo.

Câu hỏi Liên quan

QTheo bài viết, năm hình thái cốt lõi của AI Agent mà YC nhận diện là gì?

ANăm hình thái cốt lõi được nhận diện là: 1. Skills có thể tham số hóa. 2. Khung thực thi nhẹ Thin Harness. 3. Bộ định tuyến Resolvers. 4. Tầng thực thi phân biệt phán đoán mô hình với mã xác định (Deterministic code). 5. Bộ nhớ Memory để tích lũy ngữ cảnh lâu dài.

QSkill trong hệ thống AI Agent được định nghĩa như thế nào và khác với SOP truyền thống ra sao?

ASkill được định nghĩa giống như một lần 'gọi phương thức' trong lập trình, nơi một quy trình cố định được thực thi với các tham số đầu vào khác nhau cho từng trường hợp. Nó khác với SOP truyền thống (thường gắn với một nhiệm vụ hoặc vị trí cụ thể) ở chỗ có tính trừu tượng cao hơn, một Skill được thiết kế tốt có thể xử lý một loạt vấn đề cùng thể loại thay vì chỉ một nhiệm vụ đơn lẻ, nhờ việc tách biệt thông tin cụ thể ra thành tham số.

QVấn đề 'Context Rottenness' (Thối rữa ngữ cảnh) là gì và Resolver giải quyết nó như thế nào?

A'Context Rottenness' xảy ra khi khung thực thi (Harness) chứa quá nhiều định nghĩa công cụ và mô tả không cần thiết cho tác vụ hiện tại, làm đầy cửa sổ ngữ cảnh, khiến mô hình bối rối, giảm độ chính xác và tăng độ trễ. Resolver giải quyết vấn đề này bằng cách hoạt động như một bảng định tuyến, ánh xạ rõ ràng 'loại tác vụ X vừa nhận được' tới 'Skill Y cần gọi' dựa trên các quy tắc minh bạch, thay vì để mô hình tự đoán mò một cách mơ hồ.

QTại sao việc phân biệt công việc giữa lớp tiềm ẩn (Latent - dùng LLM) và lớp xác định (Deterministic - dùng code) lại quan trọng?

AViệc phân biệt này quan trọng vì LLM và mã code có thế mạnh khác nhau. LLM giỏi phán đoán, tổng hợp, nhận diện mẫu và hiểu ẩn ý, nhưng kém ở các tác vụ tính toán, tối ưu hóa tổ hợp hay đòi hỏi kết quả cố định lặp lại. Ngược lại, mã code xác định rất phù hợp cho những tác vụ cần sự ổn định, chính xác và chi phí thấp. Nguyên tắc là: nếu một việc có thể được giải quyết một cách xác định (deterministic), thì nên dùng code. Kỷ luật này giúp hệ thống hiệu quả, đáng tin cậy và tiết kiệm chi phí hơn.

QTheo tác giả, 'Năng lực Quy trình' (Process Power) từ hệ thống AI có thể tạo ra lợi thế cạnh tranh bền vững như thế nào?

A'Năng lực Quy trình' đề cập đến khả năng mã hóa kinh nghiệm thành quy trình, tham số hóa nhiệm vụ, giao công việc xác định cho mã code, giao phán đoán cho mô hình và tích lũy liên tục qua lớp bộ nhớ. Một hệ thống AI được thiết kế tốt sẽ tạo ra năng lực này, cho phép cá nhân hoặc tổ chức cung cấp dịch vụ/sản phẩm với chi phí thấp hơn hoặc chất lượng cao hơn một cách có cấu trúc. Đối thủ khó sao chép vì lợi thế không nằm ở sản phẩm cuối cùng (có thể là một thư mục markdown) mà nằm ở toàn bộ quá trình xây dựng, thử nghiệm và lặp lại đằng sau nó, được tích lũy từ từ. Đây là một trong số ít con đường thực tế để các công ty nhỏ tạo ra lợi thế cạnh tranh lâu dài.

Nội dung Liên quan

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

Bản tóm tắt sự kiện Web3 đáng chú ý tháng 6: Thị trường tiền mã hóa tháng 6 tập trung vào các yếu tố chính: dữ liệu kinh tế vĩ mô của Mỹ (như CPI, phi nông nghiệp), quyết định lãi suất từ Cục Dự trữ Liên bang Mỹ (FOMC), Ngân hàng Trung ương Châu Âu và Ngân hàng Nhật Bản, tiếp tục ảnh hưởng đến kỳ vọng thanh khoản và tâm lý thị trường. Một số dự án như SUI, ENA sẽ có đợt mở khóa token, cần lưu ý rủi ro tiềm ẩn. Về tin tức sản phẩm, Coinbase dự kiến ra mắt hợp đồng tương lai chỉ số chứng khoán, trong khi CME Group lên kế hoạch cho hợp đồng tương lai chỉ số tiền mã hóa Nasdaq. Tình trạng thanh lý dự án vẫn tiếp diễn, với các dịch vụ như trình duyệt Bitcoin Ordinals (Ord.io) ngừng hoạt động, người dùng cần chú ý đến việc rút và di chuyển tài sản. Các sự kiện công nghệ và truyền thống đáng chú ý khác bao gồm World Cup, Hội nghị Nhà phát triển Toàn cầu của Apple (WWDC26), SpaceX lên sàn chứng khoán, và thượng hội IPO của công ty robot Unitree. Tóm lại, tháng 6 hứa hẹn tiếp tục là giai đoạn thị trường tìm kiếm phương hướng mới dưới tác động của kỳ vọng thanh khoản, biến động chính sách và sự luân chuyển trong hệ sinh thái.

marsbit46 phút trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

marsbit46 phút trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

Tuần cuối tháng 5, hai sự kiện AI liền kề đã phơi bày hai cách tiếp cận khác biệt của các gã khổng lồ công nghệ Trung Quốc. Alibaba tập trung vào tích hợp và thương mại hóa AI. Họ kết nối ứng dụng Qwen với Taobao, cho phép mua sắm và sử dụng các tính năng AI như thử đồ, so giá. Tổ chức được tái cấu trúc để tập trung vào AI, với động lực rõ ràng từ thị trường vốn. Doanh thu bên ngoài của Alibaba Cloud tăng 40%, cho thấy chiến lược "lắp AI vào quầy thu ngân" đang tạo ra dòng tiền. Tuy nhiên, cách tiếp cận thực dụng này có thể đi kèm rủi ro nếu có sự chênh lệch lớn về năng lực mô hình nền trong tương lai. Ngược lại, ByteDance theo đuổi giới hạn công nghệ thông qua bộ phận Seed. Họ đạt được thành tích đỉnh cao với mô hình tạo video Seedance 2.0 và đầu tư mạnh vào nghiên cứu cơ bản, thu hút nhân tài với các mục tiêu thuần túy học thuật. Ngân sách vốn (capex) của ByteDance được báo cáo là tăng vọt, lên tới 4700 tỷ NDT vào năm 2026, được tài trợ chủ yếu từ lợi nhuận. Lợi thế lớn của họ là không bị áp lực thị trường công khai, cho phép tập trung vào nghiên cứu dài hạn. Bài viết chỉ ra rằng sự khác biệt chiến lược này không chỉ là triết lý, mà chủ yếu bị chi phối bởi việc công ty có niêm yết hay không. Các công ty đại chúng như Alibaba chịu áp lực phải thể hiện kết quả tài chính ngắn hạn, dẫn đến chiến lược "bán AI". Các công ty chưa niêm yết như ByteDance có "sự xa xỉ" để "làm AI" và tập trung vào đột phá công nghệ. Tương lai của con đường nghiên cứu dài hạn tại ByteDance có thể được kiểm chứng nếu công ty này tiến hành IPO.

marsbit54 phút trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

marsbit54 phút trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit2 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit2 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit8 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit8 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua CORE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua CORE (CORE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua CORE (CORE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ CORE (CORE) của BạnSau khi mua CORE (CORE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch CORE (CORE)Giao dịch CORE (CORE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 371Xuất bản vào 2024.12.13Cập nhật vào 2025.03.21

Làm thế nào để Mua CORE

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của CORE (CORE) được trình bày dưới đây.

活动图片