Cuộc Chiến Ngân Sách Token: AI Doanh Nghiệp Bước Vào Thời Kỳ 'Tính Toán Chi Phí'

marsbitXuất bản vào 2026-05-28Cập nhật gần nhất vào 2026-05-28

Tóm tắt

Chiến tranh ngân sách Token: AI doanh nghiệp bước vào 'Kỷ nguyên tính toán' Doanh nghiệp đang chuyển từ việc quyết định "có nên dùng AI" sang "phân bổ ngân sách AI thế nào". Khi chi phí suy luận AI từ ngân sách thử nghiệm trở thành chi phí vận hành liên tục, các CEO và CFO đặt câu hỏi then chốt: AI thực sự tạo ra giá trị gì? Mỗi đô la chi cho token mang lại kết quả gì? Cuộc chiến ngân sách token không chỉ là cắt giảm hóa đơn, mà là đánh giá lại hoạt động nào xứng đáng đầu tư nhiều tài nguyên tính toán, nhiệm vụ nào nên chuyển sang mô hình rẻ hơn, và quy trình nào chỉ là lãng phí. Bài học quan trọng: Lượng dùng AI không bằng giá trị. Trong kỷ nguyên SaaS, mức độ sử dụng thường cho thấy phần mềm được ứng dụng; nhưng với AI, việc tiêu thụ token chỉ cho thấy "đồng hồ tính tiền đang chạy". Cùng một quy trình công việc có thể có chi phí chênh lệch gấp nhiều lần do prompt, ngữ cảnh, lựa chọn mô hình và số lần thử lại. Hóa đơn tăng có thể do AI đang làm việc hiệu quả, hoặc cũng có thể do hệ thống đang hoạt động kém. Giai đoạn tiếp theo của AI doanh nghiệp không chỉ là năng lực mô hình, mà là khả năng liên kết chi phí token với kết quả kinh doanh. Giai đoạn đầu chứng minh AI có thể hoàn thành công việc; giai đoạn hai phải trả lời: Những công việc đó có đáng để trả tiền không? Ba yếu tố chính khiến việc đo lường giá trị token trở nên khó khăn: (1) Đuôi dài của việc thử lại, (2) Sự phình to ngữ cảnh làm tăng chi phí theo cấp số nhân, và (3) Định tuyến không hiệu quả khi luôn dùng mô...

Tiêu đề gốc:Token Budget Wars

Tác giả gốc:Jaya Gupta

Biên dịch gốc:Peggy

Lời giới thiệu của biên tập viên: AI doanh nghiệp đang chuyển từ giai đoạn "có nên áp dụng hay không" sang giai đoạn "tính toán chi phí như thế nào".

Hai năm qua, nhiều công ty thúc đẩy nhân viên sử dụng AI, chủ yếu để theo kịp xu hướng công nghệ và áp lực cạnh tranh. Nhưng khi chi phí suy luận AI từ ngân sách thử nghiệm trở thành chi phí hoạt động liên tục, CEO và CFO bắt đầu đặt ra một câu hỏi thực tế hơn: AI thực sự tạo ra giá trị gì? Mỗi đô la chi phí token đổi lại được kết quả thực tế nào?

Đây chính xác là cốt lõi của "Cuộc Chiến Ngân Sách Token". Chiến tranh ngân sách token không chỉ đơn thuần là việc doanh nghiệp muốn giảm hóa đơn AI, mà còn là việc đánh giá lại nghiệp vụ nào đáng đầu tư nhiều sức mạnh tính toán hơn, tác vụ nào nên chuyển sang mô hình rẻ hơn, quy trình nào có thể thay thế bằng thuê ngoài hoặc lao động thủ công, và phần nào chỉ là tiêu hao vô ích.

Điều đáng chú ý nhất trong bài viết là, mức độ sử dụng AI không tương đương với giá trị. Thời kỳ SaaS, mức độ sử dụng thường đồng nghĩa với phần mềm được áp dụng; nhưng trong thời đại AI, mức tiêu thụ token chỉ có thể cho thấy "đồng hồ tính tiền đang chạy". Cùng một quy trình công việc, có thể tạo ra sự chênh lệch chi phí gấp nhiều lần do sự khác biệt về lời nhắc, ngữ cảnh, lựa chọn mô hình và số lần thử lại. Hóa đơn tăng cao, có thể do AI đang thực sự làm việc, cũng có thể do hệ thống đang xoay sở vô ích.

Vì vậy, giai đoạn tiếp theo của AI doanh nghiệp, chìa khóa không chỉ nằm ở năng lực mô hình, mà còn ở khả năng tương ứng hóa chi phí token với kết quả kinh doanh. Giai đoạn đầu đã chứng minh AI có thể hoàn thành công việc; giai đoạn thứ hai phải trả lời câu hỏi: Những công việc này có thực sự đáng để trả phí không.

Dưới đây là bài viết gốc:

AI Doanh Nghiệp Đã Chuyển Từ "Có Áp Dụng Hay Không" Sang "Phân Bổ Như Thế Nào".

Tại cấp cao trong công ty, "đồng tiền" mới là khả năng định lượng ROI cho đầu tư AI. Mỗi bộ phận chức năng đều được hỏi cùng một câu hỏi: Bạn đã tạo ra sản phẩm gì? Chi phí là bao nhiêu? Hai năm qua, các CEO vừa thức dậy sáng sớm xem Jim Cramer (#bearish) trên CNBC, vừa nhìn đối thủ cạnh tranh công bố tăng năng suất, rồi yêu cầu toàn công ty sử dụng AI. Giờ đây, điều thực sự tạo áp lực, là câu hỏi tiếp theo đó: Hãy chứng minh giá trị cho tôi xem.

Claude được phát hành vào tháng 11 năm 2025, trong khi đó ngân sách năm 2026 của hầu hết doanh nghiệp đã được khóa. Đến quý đầu tiên, mức sử dụng thực tế của doanh nghiệp đã vượt xa kế hoạch ban đầu. Chi phí suy luận không còn chỉ là một hạng mục ngân sách dùng cho thử nghiệm, mà đã trở thành chi phí hoạt động phát sinh liên tục. Đi theo đó, là một câu hỏi mới: AI thực sự đang tạo giá trị ở đâu?

Câu hỏi này rất khó trả lời, vì hiệu quả của token không được định lượng. Hóa đơn không thể cho bạn biết, khoản chi này rốt cuộc là thay thế lao động thủ công, tạo ra doanh thu, giảm thiểu rủi ro, tăng tốc quy trình, hay chỉ là một nhóm kỹ sư cuồng token để lên bảng xếp hạng (#metamates). Khi chi tiêu chỉ vài trăm nghìn đô la, nó vẫn trông giống một thí nghiệm. Nhưng vượt qua một ngưỡng nhất định, chẳng hạn lên đến bảy con số, nó sẽ trở thành hạ tầng. Sự khác biệt kỹ thuật bắt đầu tác động thực chất đến báo cáo lỗ lãi: cùng một quy trình công việc, cùng một đầu vào, chi phí token của hai lần chạy có thể chênh lệch gấp 5 đến 10 lần, trong khi bề ngoài trông chẳng có vấn đề gì. Ở quy mô thử nghiệm, sự dao động này đã khá tốn kém; nhưng một khi bước vào quy mô hạ tầng, nó trở thành con số mà CFO phải giải thích cho CEO.

Có thể gọi nó là "hiệu quả biên của token": giá trị thương mại được tạo ra bởi mỗi đô la chi phí suy luận thêm. Đây là con số thực sự quan trọng ở giai đoạn mở rộng quy mô, và cũng là con số mà hầu hết công ty hiện tại không nhìn thấy.

Câu hỏi trong hội đồng quản trị đang chuyển từ "AI có hữu ích không" sang "AI thực sự tạo đòn bẩy ở đâu". Cũng chính vì vậy, cái gọi là cuộc chiến ngân sách token, bản chất là cuộc chiến giành quyền phân bổ token.

Mà cuộc tranh giành về quyền sở hữu token đang nhanh chóng nóng lên, vì nó đang đụng độ với bản năng điều hành đã kéo dài ba mươi năm: đội ngũ lớn đồng nghĩa với vị trí lớn, phạm vi trách nhiệm lớn và quyền lực lớn hơn. Trước đây, dấu hiệu hữu hình cho sự thành công của nhà quản lý cấp cao, là quy mô đội ngũ họ quản lý - cấp dưới trực tiếp, cấp dưới gián tiếp, và số người trong cơ cấu tổ chức.

Nhưng khi trí tuệ trở thành tài nguyên khan hiếm, dấu hiệu mới là: Bạn có thể điều động bao nhiêu trí tuệ.

Chi tiêu AI về bản chất đang cạnh tranh với chi phí nhân công.

Hầu hết đề xuất ngân sách AI, bản chất là một trong ba loại đề xuất: thay thế lao động thuê ngoài, thay thế lao động nội bộ, hoặc tạo ra doanh thu mới.

Một nhân viên có lương. Một hợp đồng BPO (Thuê ngoài quy trình kinh doanh) có giá định theo đơn hàng, khiếu nại, hóa đơn hoặc đánh giá. Con người có thể hiểu các đơn vị đo lường này. Nhưng chi phí suy luận phức tạp hơn, vì chi phí cuối cùng để hoàn thành một nhiệm vụ, phụ thuộc vào cách hệ thống vận hành trong quá trình thực thi. Một nhiệm vụ khiếu nại cần ba lần thử lại, chỉnh sửa thủ công và gọi mô hình tiên phong, có thể đắt hơn cả nguồn nhân lực thuê ngoài mà nó dự định thay thế. Cũng chính vì vậy, thảo luận đang chuyển hướng: Chi phí để hoàn thành một kết quả là bao nhiêu? Ví dụ: chi phí cho mỗi phiếu hỗ trợ đã giải quyết, mỗi khiếu nại đã xử lý, mỗi hợp đồng đã rà soát, mỗi hóa đơn đã hoàn thành, mỗi vị trí tuyển dụng mới tránh được, mỗi khách hàng giữ lại, hoặc chi phí cho mỗi đô la doanh thu chuyển đổi.

Các nhà điều hành đã nhận ra, BPO là nơi dễ nhất để thiết lập chuẩn mực, vì công việc này vốn đã được định giá theo đơn vị "hoàn thành". Ngược lại, so sánh giữa nhân viên nội bộ với AI khó khăn hơn nhiều, vì nhân viên làm nhiều việc mỗi ngày, kể cả lướt TikTok vào giờ nghỉ trưa; tăng năng suất thường thể hiện qua việc tránh tuyển dụng hoặc giải phóng công suất phân tán; và các nhà quản lý cũng sẽ kháng cự việc cắt giảm quy mô đội ngũ chỉ dựa trên tự động hóa một phần. BPO cung cấp cho các nhóm nghiệp vụ một đường cơ sở có thể định lượng.

Điều này khác với logic của SaaS. SaaS từng huấn luyện doanh nghiệp coi mức độ sử dụng là chỉ số đại diện cho giá trị.

Nhưng AI phá vỡ điều này. Cùng một quy trình công việc tiêu tốn bao nhiêu tài nguyên suy luận, có thể khác biệt lớn do lời nhắc, ngữ cảnh truy xuất được, mô hình được chọn, công cụ được gọi, số lần thử lại, và việc tác nhân có bị kẹt hay không.

Nói chính xác hơn: tín hiệu và nhiễu sử dụng cùng một đơn vị đo lường. Hóa đơn token tăng lên, có thể nghĩa là công việc thực sự đang được hoàn thành; nhưng cũng có thể nghĩa là sức mạnh tính toán đang bị lãng phí vào lời nhắc kém, ngữ cảnh không liên quan, lời gọi công cụ không cần thiết, suy luận lặp lại và mô hình thừa năng lực. Hóa đơn token của hai doanh nghiệp có thể hoàn toàn giống nhau, nhưng hoạt động nghiệp vụ bên dưới hoàn toàn khác biệt: một bên đang chuyển hóa suy luận thành kết quả, bên kia đang trả tiền cho sự xoay sở vô ích, và hai tình huống này trông hoàn toàn giống nhau trên mục hóa đơn.

Mức độ sử dụng SaaS cho bạn biết: phần mềm đã được áp dụng. Mức độ sử dụng AI chỉ có thể cho bạn biết: đồng hồ tính tiền đang chạy. Nó không thể cho bạn biết, công ty có thực sự vận hành hay không.

Tại Sao Hiệu Quả Biên Của Token Khó Thấy?

Chủ yếu có ba điểm.

Thứ nhất là đuôi dài của lần thử lại. Nếu xác suất một tác nhân hoàn thành đúng quy trình công việc ngay lần đầu tiên là p, thì mức tiêu thụ token dự kiến cho mỗi quy trình công việc đã giải quyết sẽ mở rộng theo tỷ lệ T/p, trong đó T là chi phí cơ bản. Nếu tỷ lệ hoàn thành giảm từ 90% xuống 70%, chi phí hiệu quả cho mỗi lần giải quyết vấn đề sẽ tăng khoảng 28%, chứ không phải 20%, vì thất bại tạo ra hiệu ứng kép. Trong quy trình công việc doanh nghiệp, đầu vào thường lộn xộn, và các tình huống ngoại lệ cũng quan trọng. Thất bại không chỉ làm giảm độ chính xác, mà còn thay đổi bài toán kinh tế.

Thứ hai là sự bành trướng ngữ cảnh. Đối với các thao tác phụ thuộc nhiều vào cơ chế chú ý, chi phí suy luận sẽ tăng lên theo O(n2) với chiều dài ngữ cảnh. Vì vậy, chiều dài ngữ cảnh tăng gấp đôi, chi phí suy luận sẽ tăng gần gấp bốn. Mọi người đều muốn mô hình nắm đủ thông tin, nên hệ thống có xu hướng cung cấp quá mức: vốn chỉ cần năm tài liệu, việc truy xuất lại lấy năm mươi tài liệu; bộ kết nối đổ nguyên chuỗi email vào; tác nhân mang theo lịch sử hội thoại đã lỗi thời tiếp tục chạy.

Thứ ba là định tuyến. Khi đội ngũ không biết mô hình nào là "đủ tốt", họ sẽ mặc định sử dụng mô hình mạnh nhất. Một tác vụ phân loại cơ bản, có thể chạy trên cùng một mô hình vốn dùng cho suy luận phức tạp. Khi số lần gọi lên đến hàng triệu, việc giao tác vụ đơn giản cho mô hình nhỏ, hay giao mọi tác vụ cho mô hình tiên phong, thường là ranh giới giữa hóa đơn có thể kiểm soát và vấn đề cấp hội đồng quản trị.

Ngành công nghiệp phi phần mềm sẽ cảm nhận nỗi đau này dưới dạng một "chuyển đổi". Công ty phần mềm sẽ thấy vấn đề này đầu tiên, vì công việc được tối ưu hóa vốn đã được đo lường đầy đủ. Nhóm kỹ thuật có PR, commit, triển khai, sự cố, thời gian chu kỳ, MTTR (thời gian sửa chữa trung bình) và các chỉ số khác, và những chỉ số này kết nối với sản phẩm. Mặc dù không hoàn hảo, nhưng loại công việc này dễ đo lường hơn.

Doanh nghiệp phi phần mềm sẽ cảm nhận vấn đề này sâu sắc hơn, vì công việc của họ mang tính vận hành. Ví dụ: khiếu nại, bảo hiểm, phiếu hỗ trợ khách hàng, rà soát tuân thủ, bất thường chuỗi cung ứng, tranh chấp thanh toán. Hoặc, những công ty sở hữu tài sản thế giới thực cũng sẽ đối mặt vấn đề tương tự. Các quy trình công việc này trước đây thường được đo lường bằng lao động thủ công, thời gian chu kỳ, tỷ lệ đạt SLA và tỷ lệ sai sót, và thường có yêu cầu cao hơn, cần phải đứng vững trong kiểm toán, không chỉ đơn thuần là đúng trên trung bình. Đơn vị công việc và đơn vị chi phí không sử dụng cùng một ngôn ngữ, cũng không ở cùng một tổ chức. Nhóm kỹ thuật có thể thấy mức tiêu thụ token, bộ phận nghiệp vụ có thể thấy thay đổi quy trình công việc, nhưng để kết nối hai bên, cần nhiều nhóm nhất trí về "đang đo lường cái gì".

Tôi cho rằng, công ty phần mềm sẽ trải nghiệm cuộc chiến ngân sách token như một vấn đề đo lường năng suất, điều này cũng tương ứng với nhiều vụ "cắt giảm nhân sự AI" trước đây; còn doanh nghiệp phi phần mềm sẽ trải nghiệm nó như một vấn đề chuyển đổi.

Lớp thiếu sót, là quy kết từ token đến kết quả. Doanh nghiệp cần một lớp chuyển đổi, kết nối chi tiêu suy luận với công việc đã hoàn thành, kết quả kinh doanh đã tạo ra. Lớp này phải trả lời ba câu hỏi: Chi phí thực tế của quy trình công việc này là bao nhiêu, bao gồm cả thử lại và chỉnh sửa? Trong đường đi thực thi của tác nhân, phần nào thực sự quan trọng, phần nào chỉ là xoay sở vô ích? Công việc này có thay đổi mô hình vận hành không - ví dụ mỗi nhân viên hỗ trợ khách hàng xử lý ít phiếu hơn, chu kỳ khiếu nại ngắn hơn, ngân sách BPO nhỏ hơn, tuyển dụng bị hoãn lại? Lớp tiếp theo, là quy kết kết quả bằng ngôn ngữ nghiệp vụ. Không đơn giản nói "quy trình công việc này tốn 2.13 đô la", mà phải nói: Loại khiếu nại này do tác nhân xử lý rẻ hơn BPO, nhưng nếu hợp đồng yêu cầu tệp ngoại lệ bổ sung, đuôi dài của lần thử lại sẽ phá hủy tính kinh tế.

Đo lường sẽ trở thành ghi nhớ. Để kết nối một token với một kết quả, doanh nghiệp phải nắm bắt mọi thứ ở giữa xảy ra: tác nhân thấy gì, truy xuất gì, gọi công cụ nào, bỏ qua gì, thử lại ở đâu, khi nào bị ghi đè thủ công, quy tắc ngoại lệ nào được áp dụng, tiền lệ nào có tác dụng, và tại sao một đường đi thành công còn đường kia thất bại. Lớp đo lường phải ghi lại đường đi quyết định, và đây chính xác là thứ doanh nghiệp trước đây hầu như chưa từng thực sự sở hữu. Hệ thống ghi chép có thể nắm bắt chuyện gì đã xảy ra, nhưng hiếm khi nắm bắt được tại sao. Ví dụ, CRM có thể cho bạn biết một giao dịch bị trì hoãn, nhưng không thể cho bạn biết những phán đoán đằng sau dự báo bán hàng chưa được ghi lại.

Lý do quyết định là một trong những tài sản dễ hư hỏng, dễ biến mất nhất trong công ty, vì nó tồn tại trong luồng Slack, chuỗi email, cuộc họp cấp cao và trong đầu người. Nhưng vấn đề là, người ta sẽ rời đi, và quy trình cũng thay đổi.

AI thay đổi điều này, vì tác nhân sẽ tạo ra đường đi. Mỗi lần truy xuất, gọi công cụ, thử lại, nâng cấp, chỉnh sửa thủ công và quyết định cuối cùng, sẽ trở thành một phần của đường đi từ ngữ cảnh đến hành động rồi đến kết quả. Ban đầu, công ty nắm bắt các đường đi này, là để chứng minh tính hợp lý của chi tiêu. Nhưng một khi các đường đi này được nắm bắt, chúng sẽ có giá trị hơn chính báo cáo chi phí, vì chúng sẽ trở thành một bản ghi bền vững, ghi lại cách tổ chức thực sự ra quyết định. (À, đồ thị ngữ cảnh, mặc dù gần đây tôi thực sự đã chán nghe từ này.)

Lớp phân bổ mới là phần thưởng thực sự. Nếu suy luận trở thành một tài nguyên tính phí theo lượng trong mô hình vận hành khách hàng, thì mỗi đô la phải chứng minh mình đáng tiêu. Nhà cung cấp nào có thể giải thích token khi nào chuyển hóa thành kết quả, khi nào không, và tại sao?

Doanh nghiệp sẽ không tự mình khám phá hoàn toàn việc này. Họ sẽ mua nó như một cuộc chuyển đổi. Các công ty Fortune 500 trước đây đã nhiều lần diễn lại kịch bản này: thắt chặt dây an toàn, thuê McKinsey, tuyển mọi cựu nhân viên Palantir trên thị trường, rồi để CEO thúc đẩy thay đổi từ trên xuống. Việc quy kết từ token đến kết quả cũng sẽ xuất hiện theo cách tương tự như ERP, BI và chuyển đổi số: đến như một "dự án" được hậu thuẫn bởi lãnh đạo cấp cao, kèm theo một bộ hạ tầng hỗ trợ bên dưới, và cuối cùng trở thành nguồn dữ liệu thực tế mới. Những nhà sáng lập có thể làm được điều này, sẽ xây dựng các loại đội ngũ sáng lập khác nhau, bản thân họ cũng sẽ khác với nguyên mẫu nhà khởi nghiệp truyền thống.

Ai nắm được việc quy kết từ token đến kết quả, người đó sẽ đưa ra quyết định phân bổ: quy trình công việc nào đáng có thêm sức mạnh tính toán, quy trình nào nên đặt giới hạn, quy trình nào nên chuyển sang mô hình rẻ hơn, quy trình nào tiếp tục do con người hoàn thành, quy trình nào có thể thay thế BPO. Và một khi bạn có thể đưa ra các quyết định này, bạn kiểm soát dòng chi tiêu AI trong nội bộ doanh nghiệp, và giành được sự tin tưởng cần thiết để phân bổ nguồn lực này.

Giai đoạn đầu tiên của AI doanh nghiệp đã chứng minh: mô hình có thể hoàn thành công việc. Giai đoạn tiếp theo sẽ quyết định: Những công việc này rốt cuộc có bao nhiêu phần đáng để trả phí. Như Charlie Munger đã nói: Cho tôi xem động lực, tôi sẽ cho bạn biết kết quả.

Liên kết bài viết gốc

Câu hỏi Liên quan

QBài viết nêu ra vấn đề chính gì về việc sử dụng AI trong doanh nghiệp hiện nay?

ABài viết nêu ra rằng các doanh nghiệp đang chuyển từ giai đoạn xem xét "có nên sử dụng AI" sang giai đoạn "tính toán chi phí và giá trị" của AI, được gọi là "Cuộc chiến Ngân sách Token". Vấn đề chính là CEO và CFO hiện nay đang đặt câu hỏi về giá trị thực sự mà AI tạo ra: mỗi đô la chi phí token mang lại kết quả kinh doanh cụ thể nào, và liệu chi phí đó có đáng hay không.

QTại sao việc đo lường 'mức độ hữu ích cận biên của token' (marginal token utility) lại quan trọng đối với doanh nghiệp?

AViệc đo lường 'mức độ hữu ích cận biên của token' (giá trị kinh doanh được tạo ra cho mỗi đô la chi phí suy luận bổ sung) là rất quan trọng vì khi chi phí AI từ ngân sách thử nghiệm trở thành chi phí vận hành liên tục ở quy mô lớn, doanh nghiệp cần biết chính xác phần đầu tư nào tạo ra giá trị. Nó giúp phân bổ token hiệu quả, quyết định quy trình nào đáng dùng nhiều sức mạnh tính toán, quy trình nào nên chuyển sang mô hình rẻ hơn hoặc con người.

QBài viết chỉ ra ba yếu tố chính nào khiến việc xác định giá trị thực của token chi tiêu trở nên khó khăn?

ABa yếu tố chính là: 1. **Đuôi dài của việc thử lại (Retry long tail)**: Tỷ lệ thành công của agent ảnh hưởng theo cấp số nhân đến chi phí token hiệu quả cho mỗi công việc hoàn thành. 2. **Sự phình to ngữ cảnh (Context inflation)**: Chi phí suy luận tăng theo cấp số nhân (O(n²)) khi độ dài ngữ cảnh tăng, và các hệ thống thường cung cấp quá mức thông tin không cần thiết. 3. **Định tuyến không tối ưu (Routing)**: Xu hướng mặc định sử dụng mô hình mạnh nhất cho mọi tác vụ, ngay cả những việc đơn giản, dẫn đến lãng phí tài nguyên nghiêm trọng khi khối lượng công việc lớn.

QSự khác biệt cơ bản giữa cách đo lường giá trị trong thời đại SaaS và thời đại AI là gì theo bài viết?

ATrong thời đại SaaS, mức độ sử dụng (usage) thường là đại diện cho giá trị, cho thấy phần mềm đang được áp dụng. Trong thời đại AI, hóa đơn token (mức độ sử dụng) chỉ cho biết 'đồng hồ tính tiền đang chạy', nhưng không phân biệt được giữa 'công việc thực sự đang được hoàn thành' và 'sự lãng phí vô ích' (như prompt kém, ngữ cảnh thừa, định tuyến sai). Hai công ty có hóa đơn token giống nhau có thể có hiệu quả kinh doanh hoàn toàn khác nhau.

QTheo bài viết, 'lớp phân bổ' (allocation layer) có tầm quan trọng như thế nào đối với tương lai của AI doanh nghiệp?

A'Lớp phân bổ' được coi là phần thưởng thực sự. Đó là khả năng quy nguồn chi phí token về kết quả kinh doanh cụ thể. Ai nắm được khả năng này sẽ kiểm soát được dòng chi tiêu AI trong nội bộ doanh nghiệp, có thể ra quyết định phân bổ: quy trình công việc nào đáng đầu tư nhiều token hơn, quy trình nào nên giới hạn, chuyển sang mô hình rẻ hơn, để con người xử lý hay thay thế dịch vụ BPO. Điều này mang lại sự tin tưởng để kiểm soát nguồn lực AI và tối ưu hóa ROI.

Nội dung Liên quan

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit1 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit1 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit7 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit7 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ khi các model năm 2025 giành huy chương IMO. 3. **Nơi nắm giữ giá trị:** Dự đoán giá trị sẽ thuộc về tầng ứng dụng, còn các công ty làm model cơ bản có thể không sinh lời, đã không tính đến sự thống trị và lợi nhuận khổng lồ của NVIDIA ở tầng phần cứng tính toán. 4. **Bản quyền:** Nhận định AI có thể "né tránh" vi phạm bản quyền là sai, khi thực tế đã có những vụ kiện và dàn xếp bồi thường lớn nhất lịch sử liên quan đến dữ liệu huấn luyện. **Bài học rút ra sau 3 năm:** * **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể.** * Xu hướng chung: **Đánh giá quá lạc quan về tốc độ, nhưng lại đánh giá thấp mức độ phát triển** về lâu dài. * Sai lầm tinh vi thường nằm ở **sự phân bổ** (ví dụ: tác động việc làm lên nhóm người lao động trẻ), chứ không phải tổng thể. * **Những nhận định có giới hạn, điều kiện đi kèm thường chính xác hơn** những phát biểu tuyệt đối. * Một số câu hỏi lớn vẫn chưa có câu trả lời cuối cùng sau 3 năm. Bản tổng kết này không chỉ chấm điểm cho quá khứ, mà còn đặt ra những quy tắc cho việc dự đoán trong tương lai.

链捕手10 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手10 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

Bài viết cảnh báo về bong bóng đầu tư AI khi phân tích chỉ ra rằng hầu hết các gã khổng lồ công nghệ như Microsoft, Alphabet, Meta, Oracle (trừ Amazon) có thể nhận tỷ suất lợi nhuận âm từ các khoản đầu tư hàng nghìn tỷ USD vào trung tâm dữ liệu AI. Dựa trên kỳ vọng của nhà phân tích về doanh thu và chi tiêu vốn giai đoạn 2025-2030, tốc độ tăng đầu tư (~20%/năm) vượt xa tốc độ tăng doanh thu dự kiến (~15%/năm). Tác giả nhấn mạnh, đầu tư công nghệ hiện giải thích 93% tăng trưởng GDP Mỹ. Nếu các công ty cắt giảm chi tiêu, không chỉ chuỗi cung ứng (Nvidia, TSMC, ASML) bị ảnh hưởng mà nền kinh tế Mỹ có thể suy thoái, kéo theo thị trường chứng khoán lao dốc. Các IPO của OpenAI, Anthropic được xem như cách chuyển giao rủi ro từ nhà đầu tư ban đầu sang các nhà đầu tư tổ chức và cá nhân. Dù cơn sốt có thể kéo dài đến 2026 nhờ IPO, nhưng thực tế toán học khắc nghiệt (cần thêm 2-5 nghìn tỷ USD doanh thu để đạt lợi nhuận 10%) khiến việc điều chỉnh là không tránh khỏi vào 2027-2028, tương tự bong bóng dot-com những năm 2000. Câu hỏi then chốt: ai sẽ trả giá cho cuộc chạy đua cơ sở hạ tầng đắt đỏ này?

marsbit11 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

marsbit11 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ERA

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Caldera (ERA) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Caldera (ERA) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Caldera (ERA) của BạnSau khi mua Caldera (ERA), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Caldera (ERA)Giao dịch Caldera (ERA) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 514Xuất bản vào 2025.07.17Cập nhật vào 2025.07.17

Làm thế nào để Mua ERA

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ERA (ERA) được trình bày dưới đây.

活动图片