Microsoft nhấn nút tạm dừng vibe coding: ‘Đốt token’ đã đắt hơn nhân viên rồi

marsbitXuất bản vào 2026-05-26Cập nhật gần nhất vào 2026-05-26

Tóm tắt

Ngày 14/5/2026, Microsoft thông báo dừng cấp phép Claude Code cho phần lớn nhân viên, hạn chót là 30/6. Quyết định này đến chỉ 6 tháng sau khi họ mở rộng công cụ AI hỗ trợ lập trình này, khuyến khích "vibe coding" – cách lập trình mô tả ý tưởng bằng ngôn ngữ tự nhiên để AI tạo code. Lý do không phải vì công cụ kém hiệu quả, mà ngược lại, nó quá phổ biến và khiến Copilot nội bộ của Microsoft bị "thất sủng". Vấn đề cốt lõi nằm ở kinh tế: chi phí token AI bổ sung đang trở nên quá lớn so với lợi ích gia tăng về năng suất. Cấu trúc "phi công chính + AI phụ tá" khiến tổng chi phí doanh nghiệp tăng lên (lương nhân viên cũ + hóa đơn token mới) mà không chắc chắn tăng doanh thu tương ứng. Uber và Nvidia cũng báo cáo vấn đề tương tự: ngân sách AI cạn kiệt nhanh chóng, chi phí điện toán đôi khi vượt quá chi phí nhân sự. Tuy nhiên, câu chuyện không đơn giản là "AI thất bại". Trong khi các công ty lớn như Microsoft vật lộn, hệ sinh thái startup tại Y Combinator (YC) lại có góc nhìn khác. Đối với họ, việc "đốt token" không phải là chi phí phát sinh, mà là khoản đầu tư để thay thế lao động. Các công ty AI-native được thiết kế với ít người hơn, mỗi người được hỗ trợ bởi nhiều AI agent, biến token thành công cụ thay thế nhân sự hiệu quả. Tom Blomfield của YC nhấn mạnh: "Nếu hóa đơn API không làm bạn đau, nghĩa là bạn chưa đốt đủ." Sự khác biệt này đến từ cấu trúc tổ chức. Công ty truyền thống "gắn thêm" AI vào quy trình cũ, trong khi công ty AI-native xây dựng lại từ gốc: tài sản thật sự l...

Ngày 14 tháng 5 năm 2026, Microsoft đã bắt đầu hủy bỏ giấy phép nội bộ Claude Code cho phần lớn nhân viên. Hạn chót là ngày 30 tháng 6 – cũng là ngày cuối cùng của năm tài chính Microsoft.

Chỉ 6 tháng trước, Microsoft vẫn đang làm điều ngược lại hoàn toàn – Tháng 12 năm 2025, họ mở Claude Code cho hàng nghìn nhân viên, bao gồm kỹ sư, quản lý sản phẩm, nhà thiết kế, khuyến khích mọi người sử dụng phương thức vibe coding để định hình lại quy trình làm việc. Nhân viên rất thích công cụ này, nhưng có lẽ, thích quá rồi.

Nhưng 6 tháng sau, chính Microsoft rút lui.

Và gần như cùng tuần đó, đối tác YC Tom Blomfield đã nói một câu khác trong một buổi batch talk: “Nếu hóa đơn API không làm bạn đau lòng, nghĩa là bạn đốt chưa đủ.”

Cùng một mùa xuân, Thung lũng Silicon đang đưa ra hai câu trả lời hoàn toàn trái ngược cho cùng một vấn đề – Dùng AI, rốt cuộc có đắt hơn con người không?

01 Hiện trường thất bại của vibe coding

Microsoft hủy bỏ không phải là mô hình Claude. Mô hình của Anthropic sẽ tiếp tục được cung cấp cho nhân viên Microsoft thông qua Copilot CLI. Họ hủy bỏ chính bản thân lối vào sản phẩm Claude Code.

Bộ phận bị ảnh hưởng sâu nhất là “Experiences + Devices” – tức là nhóm kỹ sư đứng sau Windows, Microsoft 365, Outlook, Teams và Surface. Phó chủ tịch điều hành Rajesh Jha trong bản ghi nhớ nội bộ đã đóng gói quyết định này thành “thống nhất chuỗi công cụ” (toolchain unification), nhưng thông tin nội bộ Microsoft được The Verge trích dẫn thẳng thắn hơn: Nhân viên nói chung cho rằng Claude Code dễ dùng hơn Copilot CLI, sự phổ biến của công cụ Anthropic này trong nội bộ Microsoft thậm chí còn khiến Copilot CLI của chính Microsoft bị “bỏ rơi”.

Nói cách khác, Microsoft gỡ bỏ Claude Code không phải vì nó không được, mà vì nó quá được.

Ngày hạn chót 30 tháng 6 đó cũng không phải ngẫu nhiên – đó là ngày cuối cùng của năm tài chính Microsoft. Cắt bỏ một công cụ mà nhân viên ưa thích, quay lại sản phẩm của mình, thời điểm khớp với mốc năm tài chính – trong đó có bao nhiêu phần là đánh giá sản phẩm, bao nhiêu phần là cân nhắc tài chính, mọi người đều hiểu.

Microsoft không phải là trường hợp cá biệt.

Một tháng trước, CTO của Uber, Praveen Neppalli Naga, tiết lộ với The Information: Ngân sách cả năm 2026 của công ty cho công cụ lập trình AI, đã bị đốt hết trong 4 tháng đầu tiên. Uber trước đó còn tổ chức bảng xếp hạng nội bộ, dùng cách thi đua để khuyến khích nhân viên dùng nhiều AI – kết quả là ngân sách sụp đổ.

Thẳng thắn hơn là câu nói của Phó chủ tịch Deep Learning Ứng dụng NVIDIA, Bryan Catanzaro, trong một cuộc phỏng vấn với Axios: “Đối với đội của tôi, chi phí tính toán vượt xa chi phí nhân viên.” Câu này được thốt ra từ miệng của một giám đốc điều hành công ty phần cứng – sản phẩm cốt lõi của công ty này chính là bán sức mạnh tính toán.

Fortune xâu chuỗi những manh mối này lại, đặt cho bài viết một tiêu đề rất Fortune: “Báo cáo của Microsoft phơi bày vấn đề chi phí thực sự của AI – Dùng thứ này còn đắt hơn nuôi nhân viên.”

Nếu chỉ đọc đến tầng này, kết luận rất đơn giản: vibe coding thất bại, câu chuyện AI thay thế con người có thể thu dọn.

Nhưng kết luận này hơi sớm.

02 Mô hình Copilot đã “đâm đầu vào tường”

Để giải thích sự rút lui của Microsoft, trước tiên phải nói rõ vibe coding là gì.

Từ này do Andrej Karpathy đề xuất vào đầu năm 2025 – ông mô tả một phương thức lập trình mới: Nhà phát triển không còn viết từng dòng code, mà dùng ngôn ngữ tự nhiên để mô tả ý định, để LLM tạo ra code. Nhà phát triển thậm chí không đọc code, chỉ xem kết quả – chạy được thì chấp nhận, không chạy được thì bảo AI sửa lại.

Đây là một lời hứa về năng suất hấp dẫn nhất trong thời đại AI. Nó có nghĩa là: Một kỹ sư không biết viết Rust có thể nhờ AI viết Rust giúp; một quản lý sản phẩm có thể nhờ AI tạo nguyên mẫu; một nhà thiết kế có thể nhờ AI viết code chạy được. Đối tượng mở Claude Code lần đó của Microsoft vào tháng 12 năm 2025 – kỹ sư, PM, nhà thiết kế – vừa vặn là ba loại người này. Đây không phải trùng hợp, đây là tư thế triển khai kinh điển nhất của vibe coding.

Nhưng vibe coding rơi vào công ty lớn, sẽ trở thành một việc rất vặn vẹo về mặt cấu trúc.

Giả sử Microsoft có một kỹ sư, lương hàng năm 300 nghìn USD. Sau khi Microsoft trang bị cho anh ta một Claude Code, sản lượng của anh ta tăng 20% – đây là trạng thái lý tưởng nhất của vibe coding. Nhưng đồng thời, chi phí token anh ta đốt mỗi tháng là 200 USD, 500 USD, hay 2000 USD? Con số này sẽ tăng đơn điệu cùng với sự phụ thuộc ngày càng sâu vào AI của anh ta.

Phiền phức hơn là, anh ta sẽ không bị sa thải vì “dùng AI” – lương 300 nghìn USD hàng năm của anh ta vẫn còn, phúc lợi vẫn còn, chỗ ngồi của anh ta vẫn còn.

Tức là, cơ cấu tổng chi phí của Microsoft là “lương nhân viên cũ + hóa đơn token mới tăng”. Công thức này chỉ có một hướng – chi phí bùng nổ.

Mà việc “sản lượng nhân viên +20%” này phản ánh trên tài chính là “doanh thu +20%” sao? Không. Là “doanh thu giữ nguyên, nhưng cơ cấu chi phí lại thêm một khoản hóa đơn AI” – bởi vì sản lượng của phần lớn nhân viên không trực tiếp tương ứng với doanh thu mới tăng, anh ta viết nhanh hơn không có nghĩa là công ty bán được nhiều hơn.

Đây chính là ý nghĩa thực sự của câu “sức mạnh tính toán đắt hơn nhân viên” của Catanzaro. Nó không phải nói AI ngu, mà là nói khi bạn lắp AI lên người nhân viên cũ, bạn không thể làm cho sổ sách cân đối được.

Logic này còn có dữ liệu hỗ trợ.

Trong một dự đoán gần đây của Gartner nói rằng: Đến năm 2030, chi phí suy luận của mô hình lớn nghìn tỷ tham số sẽ giảm gần 90% so với năm 2025. Nghe có vẻ là AI ngày càng rẻ, nhưng kết luận thực sự của Gartner là: Điều này sẽ không làm tổng hóa đơn AI của doanh nghiệp rẻ đi. Giám đốc phân tích cấp cao của Gartner, Will Sommer, đã nói một câu – “Các CPO không nên nhầm lẫn giữa ‘giảm phát token cấp hàng hóa’ và ‘phổ cập hóa năng lực suy luận tiên phong’.”

Dự đoán của Goldman Sachs còn trực tiếp hơn: Đến năm 2030, agentic AI sẽ thúc đẩy lượng tiêu thụ token tăng 24 lần, đạt 120 nghìn tỷ mỗi tháng. Giá đơn token giảm 90%, lượng tiêu thụ tăng 24 lần – kết quả là tổng hóa đơn vẫn tăng.

Huang Renxun có một phiên bản cấp tiến hơn. Ông đã nói ở nơi công cộng vài tháng trước, trong tương lai mỗi nhân viên NVIDIA sẽ có 100 AI agent làm việc cùng.

Nghe rất đẹp. Nhưng nếu bạn là CFO, bạn nghe thấy gì? Là 100 lò đốt token, 24 giờ mỗi ngày không ngừng đốt.

Vấn đề không phải là AI quá đắt. Vấn đề là bản thân giả định “trang bị cho mỗi nhân viên một phi công phụ AI”.

Tư thế này có một cái tên phổ biến trong giới công nghệ – “chế độ phi công phụ” (copilot mode). Giả định cốt lõi của nó là: Con người tiếp tục ở vị trí lái, AI ở ghế phụ đưa ra gợi ý cho bạn. Nó không thay thế bạn, chỉ làm bạn nhanh hơn.

Giả định này ở mặt văn tự rất dịu dàng – “AI sẽ không cướp việc của bạn, AI chỉ giúp bạn”. Nhưng ở mặt tài chính, ý nghĩa ngầm của nó là: Tất cả tiền lương cũ không đổi, nhưng thêm một khoản phí token.

Mà token không phải chi phí cố định, là tính phí theo tiêu thụ. Nhân viên dùng càng nhiều, công ty trả càng nhiều – đây vừa vặn là cơ cấu chi phí mà doanh nghiệp không muốn thấy nhất: linh động, không giới hạn trên, phóng đại ngược theo năng lực sản xuất.

Microsoft khi mở Claude Code vào tháng 12 năm 2025, có thể chưa hoàn toàn nhận ra điểm này. Ban đầu họ nghĩ: Để nhân viên thử một chút, xem AI có thể nâng cao hiệu suất làm việc bao nhiêu. Nhưng 6 tháng sau, nhân viên thực sự nghiện dùng, Claude Code quá phổ biến trong nội bộ Microsoft – kết quả là hóa đơn token vượt xa dự kiến, vượt quá sản lượng mà chính Microsoft có thể thu lại từ sự phổ biến đó.

Microsoft rút lui. Nhưng rút lui không phải là AI – rút lui là cấu trúc “nhân viên tiếp tục ở vị trí lái, AI ở ghế phụ” này.

Đây là một thất bại về cấu trúc. Nó sẽ không biến mất vì mô hình rẻ hơn, cũng không biến mất vì nhân viên thành thạo hơn – nó sẽ nghiêm trọng hơn cùng với việc nhân viên ngày càng thành thạo AI.

03 Đốt token, là vì không đốt đầu người

Gần như cùng tuần Microsoft rút lui, Tom Blomfield trong batch talk của YC đã đề xuất một góc nhìn hoàn toàn khác. Ông không thảo luận “AI nên dùng thế nào” – ông thảo luận là “Công ty thời đại AI nên trông như thế nào”.

Phán đoán của Blomfield rất trực tiếp: Hôm nay phần lớn công ty vẫn là cấu trúc kiểu “Quân đoàn La Mã” – thông tin truyền lên từng cấp, mệnh lệnh phân phát xuống từng cấp, con người là hạt nhân phối hợp. Lắp AI lên cấu trúc này, hiệu quả là phát vũ khí nóng cho bộ binh La Mã – họ sẽ dùng mạnh hơn, nhưng chiến thuật sẽ không thay đổi.

Công ty AI-native thực sự nên là một dạng khác.

Blomfield dùng một mô tả rất cụ thể: Mỗi động tác đều nên tạo ra một sản phẩm có thể ghi lại, có thể gọi ra, làm cho mọi thứ rõ ràng, đọc được đối với AI (legible to AI); công ty nên được thiết kế thành “vòng lặp AI tự cải tiến”, hệ thống có thể cảm nhận môi trường, đưa ra quyết định, gọi công cụ, tiếp nhận phản hồi, tự sửa chữa.

Con người trong công ty kiểu này chỉ còn hai vai trò. Một là người đóng góp cá nhân – mỗi người bất kể bộ phận đều là builder và operator, họp mang nguyên mẫu, không chỉ mang ý tưởng; hai là DRI (người chịu trách nhiệm trực tiếp) – mỗi sản phẩm đầu ra đều có một người chịu trách nhiệm rõ ràng, “không thể trốn sau lưng AI”.

Sau đó Blomfield nói câu vàng đó: “Nếu hóa đơn API không làm bạn đau lòng, nghĩa là bạn đốt chưa đủ.”

Câu này nếu xuất hiện ở văn phòng CFO của Microsoft, sẽ bị coi là trò cười; nhưng đặt trước mặt một phòng đầy nhà sáng lập startup của YC, không ai thấy điên rồ.

Tại sao?

Một đối tác khác của YC, Diana Hu, trong Startup School đầu tháng 5 đã đưa ra câu trả lời. Cô nói một câu – “Tối đa hóa không phải đầu người, là tiêu thụ token”. Cô còn có phiên bản thẳng thắn hơn: “Một người trang bị công cụ AI, bằng với một đội kỹ sư lớn trước đây.”

Chú ý từ khóa ở đây: “bằng với”. Không phải “tương đương”, không phải “tương tự” – là thay thế.

Trong lô P26 mùa xuân 2026 của YC, đã có không ít công ty dùng 5, 6 người làm việc mà trước đây cần 20, 30 người mới làm được. Hóa đơn token của họ đương nhiên cao, nhưng hóa đơn nhân sự cực thấp – tính tổng thể, là có lãi.

Trường hợp cấp tiến hơn là Block. Công ty fintech dưới trướng Jack Dorsey này gần đây đã cắt giảm 40% nhân viên. Đây không phải “giảm chi phí tăng hiệu quả” theo nghĩa truyền thống – Block đồng thời tăng cường đầu tư nội bộ vào công cụ AI, cấu trúc mới chính là loại Diana Hu mô tả: IC + DRI + AI agent.

Đốt token trong ngữ cảnh của YC không phải chi tiêu, là thay thế. Nó thay thế không phải chi phí ngoài AI, là lương đầu người. Sổ sách tính được, là vì công ty đồng thời loại bỏ những vị trí vốn phải đốt lương.

Đây chính là nguyên nhân cơ bản Microsoft và YC nhìn cùng một việc, nhưng đưa ra câu trả lời trái ngược – họ đốt căn bản không phải cùng một loại token. Token của Microsoft là đổ nhiên liệu cho phi công phụ của đội ngũ cũ, token của YC là thay thế tài xế vốn có.

04 Tài sản thực sự đang được định nghĩa lại

Tom Blomfield trong cuộc đối thoại, còn nói một câu đáng suy nghĩ hơn – “Con người là nhất thời, tài liệu ngữ cảnh mới là quan trọng.”

Đây là một phán đoán ở tầm kế toán.

Bảng cân đối kế toán của công ty truyền thống viết thế nào? Bên trái là tài sản cố định, khoản phải thu, lợi thế thương mại, IP, bên phải là nợ phải trả và vốn chủ sở hữu. Nhân viên không ở cột tài sản – nhân viên là chi phí. Nhưng mỗi công ty trong lòng đều biết, nhân viên thực ra là tài sản thực sự: quan hệ khách hàng ở trong đầu sales, trực giác nghiệp vụ ở trong đầu quản lý sản phẩm, kỹ thuật know-how ở trong đầu kỹ sư.

Đặc điểm của loại “tài sản” này là sẽ đi. Nhân viên nghỉ việc, tài sản chạy mất.

Mà công ty AI-native Blomfield mô tả, đang làm một việc: Trích xuất toàn bộ những tài sản vốn chỉ tồn tại trong não người này ra, biến thành “tài sản ngữ cảnh” AI có thể đọc, có thể gọi, có thể lặp lại.

Cụ thể hình thức là gì? Là tài liệu yêu cầu chi tiết; là quá trình lắng đọng mỗi quyết định, mỗi lần trao đổi email, mỗi lần thảo luận Slack thành tài liệu; là giao diện MCP mở và API; là artifact do mỗi công cụ nội bộ tạo ra – tất cả những thứ này, cấu thành một tầng tài sản mới, có thể kế thừa, không bay hơi theo nhân viên nghỉ việc của một công ty.

Con người trong công ty kiểu này ngược lại trở thành “biến số” – có thể nhanh chóng tiếp cận, cũng có thể nhanh chóng rời đi, bởi vì tài sản cốt lõi của công ty không ở trong não người, mà ở trong tài liệu.

Cấu trúc này nếu thành lập, ý nghĩa không chỉ là một mô hình tổ chức mới – mà là bảng cân đối kế toán của công ty đang được viết lại. Một công ty AI-native 6 người, đốt hóa đơn token kinh người, nhìn không lành mạnh về tài chính, nhưng tài sản thực sự của nó có thể còn dày hơn một công ty truyền thống 60 người – chỉ là loại tài sản này, chuẩn mực kế toán hiện tại chưa học được cách tính.

Nói cách khác, vibe coding không chết. Nó chỉ không thuộc về công ty truyền thống.

Ngày Microsoft gỡ bỏ Claude Code, không phải là ngày kinh tế học AI thất bại – là ngày một tư thế lắp AI lên tổ chức cũ, bị chính nó chứng minh là sai.

Mà trong phòng đầy startup của YC, đang mọc lên một tư thế khác – chúng nhỏ, chúng đốt, chúng không có “tỷ lệ sử dụng AI của nhân viên” trong biểu KPI, CFO của chúng cũng sẽ không hoảng sợ vì hóa đơn token bùng nổ – bởi vì thứ họ đốt vốn không phải “phi công phụ của nhân viên”, mà là “vật thay thế nhân viên”.

Vài năm tới, tất cả công ty cỡ vừa còn đang bắt nhân viên “dùng thêm một chút AI”, đều sẽ đâm vào bức tường Microsoft đã đâm – hóa đơn token tăng cấu trúc tất yếu.

Nhưng nguyên nhân thực sự đâm vào tường, không phải AI quá đắt – là tổ chức chưa thay đổi.

Mà phần lớn công ty, e rằng một lúc nửa khắc sẽ không thay đổi.

Câu hỏi Liên quan

QTại sao Microsoft ngừng cung cấp giấy phép Claude Code nội bộ cho phần lớn nhân viên?

AMicrosoft ngừng cấp phép Claude Code vì chi phí sử dụng công cụ này (đốt token) quá cao, thậm chí có thể vượt quá chi phí lương nhân viên. Việc nhân viên ưa chuộng Claude Code hơn sản phẩm nội bộ Copilot CLI của Microsoft cũng là một lý do, dẫn đến quyết định 'thống nhất công cụ' và cắt giảm chi phí vào cuối năm tài chính.

Q"Vibe coding" là gì và tại sao nó được cho là thất bại trong các công ty lớn như Microsoft?

A"Vibe coding" là một cách lập trình mới, nơi nhà phát triển mô tả ý định bằng ngôn ngữ tự nhiên để LLM tạo mã, thay vì viết từng dòng code. Nó được cho là thất bại trong các công ty lớn vì cấu trúc chi phí: công ty phải trả cả lương nhân viên cũ và hóa đơn token AI mới, trong khi năng suất tăng thêm không nhất thiết tạo ra doanh thu tương ứng, dẫn đến tổng chi phí tăng vọt.

QQuan điểm của đối tác YC Tom Blomfield về việc sử dụng AI và hóa đơn API khác với Microsoft như thế nào?

ATom Blomfield cho rằng 'Nếu hóa đơn API không làm bạn đau lòng, nghĩa là bạn đốt chưa đủ.' Quan điểm này trái ngược với Microsoft. Ông ấy đề xuất mô hình công ty AI-native, nơi token được đốt để thay thế con người, giảm mạnh chi phí nhân sự. Trong khi đó, Microsoft đốt token như một 'trợ lý' bổ sung cho nhân viên hiện có, làm tăng tổng chi phí mà không cắt giảm được chi phí lương.

QÝ tưởng về 'tài sản ngữ cảnh' (contextual assets) trong công ty AI-native là gì?

A'Tài sản ngữ cảnh' đề cập đến việc chuyển đổi tri thức, quy trình ra quyết định và kỹ năng nghiệp vụ - vốn tồn tại trong đầu nhân viên - thành các tài liệu, giao diện API và artifacts có cấu trúc mà AI có thể đọc, gọi và lặp lại. Điều này tạo ra một lớp tài sản mới, bền vững cho công ty, không bị mất đi khi nhân viên nghỉ việc, từ đó định hình lại bảng cân đối kế toán của doanh nghiệp.

QTheo bài viết, đâu là rào cản chính khiến nhiều công ty truyền thống gặp khó khăn khi áp dụng AI hiệu quả?

ARào cản chính là cấu trúc tổ chức cũ. Các công ty truyền thống cố gắng gắn AI vào mô hình hiện có như một 'trợ lý' (copilot mode), giữ nguyên đội ngũ nhân sự và quy trình làm việc cũ. Điều này dẫn đến chi phí token tăng lên như một khoản phụ trội, trong khi lợi ích về năng suất không đủ để bù đắp. Thay đổi cần thiết là tái cấu trúc tổ chức thành AI-native, nơi AI thay thế một phần nhân lực và tài sản tri thức được số hóa.

Nội dung Liên quan

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

Bản tóm tắt sự kiện Web3 đáng chú ý tháng 6: Thị trường tiền mã hóa tháng 6 tập trung vào các yếu tố chính: dữ liệu kinh tế vĩ mô của Mỹ (như CPI, phi nông nghiệp), quyết định lãi suất từ Cục Dự trữ Liên bang Mỹ (FOMC), Ngân hàng Trung ương Châu Âu và Ngân hàng Nhật Bản, tiếp tục ảnh hưởng đến kỳ vọng thanh khoản và tâm lý thị trường. Một số dự án như SUI, ENA sẽ có đợt mở khóa token, cần lưu ý rủi ro tiềm ẩn. Về tin tức sản phẩm, Coinbase dự kiến ra mắt hợp đồng tương lai chỉ số chứng khoán, trong khi CME Group lên kế hoạch cho hợp đồng tương lai chỉ số tiền mã hóa Nasdaq. Tình trạng thanh lý dự án vẫn tiếp diễn, với các dịch vụ như trình duyệt Bitcoin Ordinals (Ord.io) ngừng hoạt động, người dùng cần chú ý đến việc rút và di chuyển tài sản. Các sự kiện công nghệ và truyền thống đáng chú ý khác bao gồm World Cup, Hội nghị Nhà phát triển Toàn cầu của Apple (WWDC26), SpaceX lên sàn chứng khoán, và thượng hội IPO của công ty robot Unitree. Tóm lại, tháng 6 hứa hẹn tiếp tục là giai đoạn thị trường tìm kiếm phương hướng mới dưới tác động của kỳ vọng thanh khoản, biến động chính sách và sự luân chuyển trong hệ sinh thái.

marsbit1 giờ trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

Tuần cuối tháng 5, hai sự kiện AI liền kề đã phơi bày hai cách tiếp cận khác biệt của các gã khổng lồ công nghệ Trung Quốc. Alibaba tập trung vào tích hợp và thương mại hóa AI. Họ kết nối ứng dụng Qwen với Taobao, cho phép mua sắm và sử dụng các tính năng AI như thử đồ, so giá. Tổ chức được tái cấu trúc để tập trung vào AI, với động lực rõ ràng từ thị trường vốn. Doanh thu bên ngoài của Alibaba Cloud tăng 40%, cho thấy chiến lược "lắp AI vào quầy thu ngân" đang tạo ra dòng tiền. Tuy nhiên, cách tiếp cận thực dụng này có thể đi kèm rủi ro nếu có sự chênh lệch lớn về năng lực mô hình nền trong tương lai. Ngược lại, ByteDance theo đuổi giới hạn công nghệ thông qua bộ phận Seed. Họ đạt được thành tích đỉnh cao với mô hình tạo video Seedance 2.0 và đầu tư mạnh vào nghiên cứu cơ bản, thu hút nhân tài với các mục tiêu thuần túy học thuật. Ngân sách vốn (capex) của ByteDance được báo cáo là tăng vọt, lên tới 4700 tỷ NDT vào năm 2026, được tài trợ chủ yếu từ lợi nhuận. Lợi thế lớn của họ là không bị áp lực thị trường công khai, cho phép tập trung vào nghiên cứu dài hạn. Bài viết chỉ ra rằng sự khác biệt chiến lược này không chỉ là triết lý, mà chủ yếu bị chi phối bởi việc công ty có niêm yết hay không. Các công ty đại chúng như Alibaba chịu áp lực phải thể hiện kết quả tài chính ngắn hạn, dẫn đến chiến lược "bán AI". Các công ty chưa niêm yết như ByteDance có "sự xa xỉ" để "làm AI" và tập trung vào đột phá công nghệ. Tương lai của con đường nghiên cứu dài hạn tại ByteDance có thể được kiểm chứng nếu công ty này tiến hành IPO.

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

marsbit1 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit2 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit2 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit9 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit9 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片