Nỗi lo lắng 2026 của nhà đầu tư AI: Khi mô hình nuốt chửng mọi thứ, hào bảo vệ của các công ty khởi nghiệp còn lại gì?

marsbitXuất bản vào 2026-06-11Cập nhật gần nhất vào 2026-06-11

Tóm tắt

Tác giả Sarah Guo phản bác quan điểm bi quan của các nhà đầu tư AI rằng chỉ có các công ty mô hình lớn (như Anthropic) và nhà cung cấp chip (như NVIDIA) là đáng đầu tư. Bà lập luận rằng khi mô hình AI ngày càng giỏi, giá trị thực sự không nằm ở những thứ có thể đo lường và tối ưu hóa bằng benchmark (như viết code), mà nằm ở những lĩnh vực "không thể huấn luyện". Các benchmark đo lường công việc có thể kiểm tra tự động, khiến chúng dần trở thành hàng hóa và bị các mô hình tổng quát "nuốt chửng". Giá trị bền vững thực sự tồn tại trong các ngóc ngách phức tạp của thực tế: tích hợp vào hệ thống riêng tư và lỗi thời của doanh nghiệp, xây dựng lòng tin với người dùng qua thời gian dài, hiểu sâu các quy trình nghiệp vụ đặc thù (như pháp lý, y tế), và chịu trách nhiệm pháp lý. Các công ty khởi nghiệp có thể xây dựng "hào bảo vệ" bằng cách trở thành chuyên gia trong một lĩnh vực cụ thể, sử dụng dữ liệu riêng để huấn luyện mô hình chuyên biệt, và quan trọng nhất là thực hiện công việc "dịch thuật" tẻ nhạt - kết nối trí thông minh của AI với thực tế hỗn độn của khách hàng. Họ giành quyền định nghĩa thế nào là "kết quả tốt" trong lĩnh vực đó. Trong khi trí thông minh ngày càng rẻ, giá trị dịch chuyển về những nơi mà vốn và thuật toán thuần túy không thể với tới.

Tác giả: Sarah Guo

Biên dịch: TechFlow

Lời dẫn từ TechFlow: Khi các mô hình lớn bắt đầu đè bẹp con người trên mọi bảng xếp hạng, các nhà đầu tư rơi vào tuyệt vọng: ngoài Anthropic và NVIDIA, còn gì đáng để đầu tư? Nhà đầu tư hàng đầu Thung lũng Silicon này dùng dữ liệu và ví dụ để chỉ ra rằng, hào bảo vệ thực sự không nằm trên bảng xếp hạng – nó ẩn mình ở những nơi không thể đo lường bằng benchmark.

Giữa năm 2026, phiên bản lẫn lộn tinh thần AI của nhà đầu tư là một sự tuyệt vọng: Không còn gì đáng để đầu tư nữa, chúng ta nên bỏ hết tiền vào Anthropic và NVIDIA rồi về nhà.

Tôi chưa bao giờ có cảm giác đó. Tôi đã tin chắc mô hình thông minh hơn tôi vài phiên bản phụ, tôi rất sẵn lòng mua Anthropic và NVIDIA với giá thị trường, tất cả những người bạn thông minh nhất của tôi đều khá chắc chắn rằng khả năng tự cải tiến sẽ sớm thành công – nhưng tôi vẫn không cảm thấy sự tuyệt vọng này.

Sự tuyệt vọng đó không ngu ngốc. Logic là: nếu mô hình tiếp tục trở nên tốt hơn ở mọi thứ, thì mọi công ty xây dựng trên nó chỉ là một lớp vỏ mỏng, đang chờ bị hấp thụ, và giá trị duy nhất có thể tồn tại là sức mạnh tính toán và trọng lượng ở tuyến đầu.

Lấy phần mềm làm ví dụ, đây là trường hợp mà những người theo thuyết tuyệt vọng dựa vào nhiều nhất. Devin khi ra mắt năm 2024 chỉ giải quyết được 13% nhiệm vụ trên benchmark phần mềm tiêu chuẩn, về cơ bản bị phớt lờ. Một năm rưỡi sau, agent tốt nhất có thể đạt hơn 80 điểm, chúng đang làm việc thực tế bên trong Goldman Sachs và Quân đội Mỹ. Hầu hết mọi người đều rút ra bài học sai lầm giống nhau: mô hình đã nuốt chửng kỹ thuật phần mềm. Nhưng khi mô hình nuốt chửng phần dễ đo lường nhất của kỹ thuật phần mềm, chúng ta đang nhận ra lại điều mà nhiều nhóm đã biết từ lâu – kỹ thuật vẫn luôn kháng cự việc đo lường, phần dễ đo lường nhất có thể không phải là phần quan trọng duy nhất.

Mert Demirer của MIT và các cộng tác viên cuối cùng đã đưa ra con số: trong hơn 100.000 nhà phát triển, agent mã hóa mới nhất đã tăng lượng mã viết lên khoảng 180%, trong khi lượng mã thực sự được phát hành tăng khoảng 30%. Viết mã trở nên rẻ hơn. Phần còn lại vẫn phải thông qua con người, và nó quan trọng. Tất nhiên, tác động ròng vẫn rất đáng kinh ngạc.

Benchmark là thứ bạn có thể đo lường, và thứ bạn có thể đo lường là thứ bạn có thể huấn luyện dựa vào nó. Do đó, agent mã hóa chín muồi trước: trình biên dịch là bộ kiểm tra miễn phí, bộ thử nghiệm là bộ kiểm tra miễn phí, khi câu trả lời tự kiểm tra chính nó miễn phí, bạn có thể liên tục mài giũa dựa trên kiểm tra đó cho đến khi đánh bại nó. Nhưng vượt qua bài kiểm tra chưa bao giờ nói với bạn rằng, liệu thay đổi này có phải là đúng đối với một kho mã cũ mười năm với ba mô-đun chưa được ghi chép lý do tồn tại, pipeline triển khai duy trì nhờ một cron job mà không ai muốn thừa nhận là mình viết hay không.

Loại tính chính xác đó không thể đọc được từ bảng xếp hạng, thực tế cũng không thể đọc được từ bất cứ thứ gì. Bạn học bằng cách chạy đủ lâu trong thế giới thực để phát hiện ra một hệ thống phức tạp như vậy có hiệu quả hay không, và mô hình thông minh hơn không làm thế giới chạy nhanh hơn. Không ai làm kiểm tra đơn vị cho thứ ở quy mô của Google rồi tin vào dấu tích màu xanh lá; bạn tin nó vì nó đã chịu được khối lượng công việc thực tế trong nhiều năm. Tính chính xác như vậy không chỉ là riêng tư, nó còn là loại hào bảo vệ chậm chạp mà vốn không thể san bằng. Ngay cả những người lạc quan cũng thừa nhận đồng hồ không thể nhảy cóc: Noam Brown, người tiên phong về mô hình suy luận tại OpenAI, gần đây đã viết, phương pháp đáng tin cậy duy nhất để đánh giá một agent trong khoảng thời gian một năm có lẽ là... chạy nó một năm.

Như Gabe Pereyra đã nói, tự động hóa thực sự không chỉ là mô hình trở nên tốt hơn. Đó là sản phẩm, mô hình, quy trình làm việc và công ty cùng di chuyển, và trong bốn thứ đó, có ba thứ di chuyển theo tốc độ của tổ chức.

Những người di chuyển là phần benchmark không chạm tới: khiến một đối tác đa nghi thay đổi cách cô ấy xử lý công việc, giữ cho đội ngũ đoàn kết trong quá trình xây dựng lại. Đó là lý do tại sao khi chúng tôi tuyển CEO, khả năng xử lý con người quan trọng ít nhất bằng khả năng phân tích, và mô hình thông minh hơn không thay đổi trọng số đó. Phản hồi mơ hồ, khung thời gian tính bằng năm, niềm tin thuộc về một người. Mọi công ty tôi biết đều cho tất cả kỹ sư sử dụng mô hình mã hóa tiên tiến, nhưng không công ty nào thay đổi tổ chức kỹ thuật của họ với tốc độ gần bằng vậy. Việc áp dụng mất một quý, đó là một quý tăng trưởng token kỳ diệu biết bao! Nhưng việc xây dựng lại đang mất nhiều năm.

Cái có thể thấy là thứ đang rời đi. Công việc có giá trị về cấu trúc là vô hình: bất cứ thứ gì bạn có thể đặt lên bảng xếp hạng, bạn đều có thể huấn luyện dựa vào nó, vì vậy bất cứ thứ gì có thể đo lường đều đang trên đường trở thành hàng hóa. Quá trình này cần thời gian và sẽ không bao giờ hoàn toàn, nhưng hướng đi không bao giờ đảo ngược. Dùng thuật ngữ tiền bạc của bạn tôi Matt MacInnis ở Rippling: token chi cho việc trả lời câu hỏi chung chung hầu như vô giá trị, vì mô hình của bất kỳ ai cũng có thể trả lời nó, còn token chi cho việc suy luận về dữ liệu công ty của bạn có giá trị cao hơn nhiều, vì nó làm điều bạn thực sự muốn, không chỉ là điều có vẻ hợp lý.

Công việc có thể thấy bị nuốt chửng từ hai hướng. Từ phía dưới, bão hòa nhiệm vụ: một khi một công việc có thể được kiểm tra rẻ tiền, người mua không còn hỏi mô hình nào làm nó nữa, mà bắt đầu hỏi nó tốn bao nhiêu tiền, và công việc rơi vào mô hình mã nguồn mở hoặc chưng cất rẻ nhất tuần đó. Ở bất cứ nơi nào chúng có thể tạo tác động, biên lợi nhuận cuối cùng đều quan trọng. Từ phía trên, các phòng thí nghiệm đang cố gắng để mô hình nuốt chửng giàn giáo của chính nó. Truy xuất, định tuyến giữa các lệnh gọi rẻ và đắt, sử dụng công cụ, thậm chí chiến lược suy luận, tất cả các thiết bị từng bao bọc mô hình đều bị kéo vào trọng số, cho đến khi lớp bao bọc chính là mô hình. Đó là sự hấp thụ tiên tiến. Áp lực biên lợi nhuận cũng cắt giảm ngược lại: agent chung chung phải sẵn sàng cho mọi thứ, điều đó rất tốn kém, trong khi ứng dụng chuyên sâu có thể điều chỉnh một quy trình làm việc cho đến khi nó chạy trên một phần nhỏ chi tiêu token, và không giống như phòng thí nghiệm bán những token này, nó giữ lại chênh lệch giá.

Vì vậy, chúng ta có thể hỏi hai điều về bất kỳ loại công việc nào. Tính chính xác của nó có phải là riêng tư và tốn kém để xây dựng không, loại sự thật chỉ tồn tại bên trong dữ liệu của ai đó? Nó có bị cô lập không, bị khóa trong hệ thống bạn không thể vào? So sánh những điều này với mức độ bão hòa của nhiệm vụ, bạn có một ma trận 2x2. Công việc bão hòa có đáp án công khai là token hàng hóa, mô hình mã nguồn mở sở hữu nó. Công việc tiên tiến có đáp án công khai, nơi benchmark mã hóa tồn tại, là nơi phòng thí nghiệm chiến thắng, vì khi đánh giá miễn phí, việc sở hữu nó chẳng là gì. Giải thưởng nằm ở góc cuối cùng, góc không thể huấn luyện: công việc tiên tiến mà tính chính xác chỉ tồn tại trong lĩnh vực riêng tư. Bạn có thể thấy nó trong đám mây suy luận chứa chấp những người tiên phong AI bản địa, phần lớn token được tạo bởi mô hình tùy chỉnh, không phải mô hình mã nguồn mở chung chung.

Bức tường đi vào góc cuối cùng đó có độ cao khác nhau. Kho mã đồ chơi của một nhà phát triển đơn lẻ có thể di chuyển và tiêu chuẩn hóa, nên việc leo lên rất ngắn. Hệ thống sản xuất của ngân hàng không phải cả hai, bạn sẽ không có quyền root chỉ vì thông minh hơn 2% trên SWE-Bench Verified.

Năng lực nuốt chửng nhiều thứ, nhưng mô hình tốt hơn không biến sự thật cơ bản riêng tư thành công khai. Nó không nắm giữ giấy phép, không ký trách nhiệm, cũng không sở hữu tài liệu của công ty, nó không thể là bên bị kiện khi câu trả lời sai. Sự thông minh không phải là nút cổ chai ở đây. Giấy phép là, trách nhiệm cũng là. Bạn có thể tưởng tượng một mô hình thông minh hơn bất kỳ ai rất nhiều, nó vẫn phải được phép vào cửa, vẫn phải có người ký tên cho việc nó làm.

Cánh cửa đó có một ổ khóa và một then cửa. Ổ khóa là môi trường: bạn chỉ có thể xác minh AI có làm việc hữu ích hay không sau khi được tin tưởng bên trong hệ thống, sau khi xem xét an ninh, tích hợp, hợp đồng bạn ký tên cho kết quả. Then cửa là người dùng. Hiện nay hầu hết bác sĩ Mỹ mở OpenEvidence mỗi ngày, không lượng sức mạnh tính toán nào có thể mua được điều này. Phòng thí nghiệm ngày mai có thể huấn luyện một mô hình y tế hoàn hảo, vẫn không thể đi vào thói quen của bác sĩ, hoặc vào quy trình ra quyết định của UCSF, vì niềm tin được xây dựng chậm rãi, dựa trên mối quan hệ, cần sự đồng ý ngầm của người dùng, không phải xóa sạch gradient descent của họ.

Đây cũng là công việc. Một ứng dụng giành được vị trí của nó ở góc không thể huấn luyện bằng cách làm công việc thầm lặng: sắp xếp thực tế riêng tư của công ty để mô hình có thể hành động dựa trên nó, cung cấp công cụ cho mô hình hành động, hợp tác với khách hàng để thay đổi thực tế nhân viên của họ. Một công ty mang đến bản dịch rất khó sao chép – và bản dịch không bao giờ kết thúc. Tích hợp và bảo trì kéo dài lâu như mối quan hệ, được giành bởi các nhóm đặt kỹ sư chuyên ngành và công cụ bên cạnh khách hàng.

Lấy một ví dụ, tại một công ty luật hạng sang hàng đầu, chỉ riêng hoạt động M&A mỗi năm đã chạy gần một nghìn giao dịch. Vì lý do bảo mật và nhiều lý do khác, bạn không thể để hàng trăm trợ lý riêng lẻ tải tài liệu khách hàng về máy tính để bàn và yêu cầu agent chung lật qua chúng, ngay cả khi bạn có thể, những gì bạn học được sẽ là mảnh vỡ, một sửa chữa cho mỗi trợ lý một lần, không thấy toàn bộ giao dịch chảy như thế nào. Tín hiệu quan trọng tồn tại ở cấp độ giao dịch, và giao dịch có một hình dạng: với M&A là thỏa thuận bảo mật, bảng điều khoản, thẩm định, thỏa thuận mua bán, tài liệu phụ lục, danh sách nghiệm thu; với kiện tụng sở hữu trí tuệ, là các đề nghị, khám phá chứng cứ, trình độ hiện có, thêm đề nghị. Mỗi lĩnh vực kinh doanh có riêng của mình, luật sư và công cụ không thể hoán đổi qua lại giữa các lĩnh vực. Và vấn đề công ty luật thực sự giải quyết nằm ở một cấp độ trên tất cả những điều này: chạy song song mỗi lĩnh vực kinh doanh, giống như các đối tác hàng đầu đồng thời chạy hàng trăm vụ việc, đồng thời đưa vào vụ việc mới và đào tạo trợ lý. Chuyển đổi một công ty luật như vậy không phải là một nhiệm vụ đơn lẻ bạn có thể viết đánh giá cho nó. Nó cần một người vận hành làm bằng cách phân tích dữ liệu, mục tiêu cực kỳ mơ hồ, phản hồi không đầy đủ, khung thời gian dài, trong một môi trường không đứng yên.

Thật không may, giá trị vô hình cũng khó bán, vì lý do tương tự nó khó trở thành hàng hóa: công ty không thể đánh giá từ bên ngoài liệu AI có chuyển đổi hoạt động của họ không, giống như benchmark không thể đánh giá. Vì vậy, các doanh nghiệp mạnh nhất ngừng cố gắng chứng minh nó từ bên ngoài, mà đi vào bên trong, định giá kết quả. Sierra tính phí khi agent của họ giải quyết vấn đề của khách hàng, không tính phí khi chuyển vấn đề cho con người, vì vậy giá trở thành đánh giá, điều này chỉ hiệu quả khi Sierra sở hữu định nghĩa "đã giải quyết". Devin của Cognition làm điều tương tự trong phần mềm, cung cấp "bảo đảm hiệu suất", điều chỉ có thể đưa ra cho kết quả trong hệ thống bạn được tin tưởng để vào.

Ngay cả token dịch vụ, thứ mà mọi người thích gọi là lớp hàng hóa thuần túy, cũng không hoạt động như hàng hóa. Các công ty AI bản địa tốt nhất tập trung dịch vụ của họ vào một hoặc hai nhà cung cấp (Baseten hoặc Fireworks), vì chi phí mỗi token được kế hoạch hóa thành hàng hóa, trong khi độ tin cậy dưới lưu lượng thực và đảm bảo tiếp cận năng lực tính toán khan hiếm thì không. Bạn phục vụ ở đâu là một lựa chọn khác với bạn sử dụng mô hình nào. Giá cả là phần duy nhất trong suy luận hoạt động như hàng hóa.

Một phản đối thường được đưa ra là, phòng thí nghiệm là nhà cung cấp của bạn – tại sao họ không chạy sản phẩm cấp một của chính mình với giá dưới chi phí để vắt kiệt bạn, hoặc thu hồi quyền truy cập API và tự chiếm thị trường? Đây là phiên bản thực sự của thuyết tuyệt vọng, nó chỉ hiệu quả nếu tầng mô hình là trò chơi một người chơi. Rõ ràng không phải – nó trông giống một cuộc đua tử thần với ba bên rưỡi hơn, một nhóm người chơi quốc tế tụt lại sau sáu tháng huấn luyện, giải phát triển có quy mô gấp 5 lần năm ngoái. Khách hàng muốn có cạnh tranh giữa các nhà cung cấp, các phòng thí nghiệm muốn thị phần hơn là để bất kỳ ứng dụng nào chết.

Bạn có thể thấy điều này trên thị trường mà các phòng thí nghiệm đối đầu trực tiếp. Trong trò chuyện người tiêu dùng, mô hình tốt nhất chưa bao giờ đơn giản chiến thắng. ChatGPT duy trì vị trí dẫn đầu trong nhiều năm cạnh tranh thực tế, thị phần nó mất hiện nay đang chuyển sang Gemini, nhờ sức mạnh của Android và tìm kiếm, không phải mô hình tốt hơn. Anthropic, công ty mà thị trường dự đoán (và không khí internet) hiện đánh giá là có mô hình tốt nhất, hầu như không là một yếu tố trong trò chuyện người tiêu dùng, mà xây dựng doanh nghiệp của mình trong doanh nghiệp và mã hóa. Nếu mô hình tốt hơn không thể lấy đi người dùng của đối thủ ở ứng dụng cốt lõi nhất, nó sẽ không đi qua hồ sơ bệnh viện hoặc trách nhiệm ngân hàng bằng cách tích hợp. Lựa chọn của công chúng ngày nay không chỉ dựa trên mã hóa. Nếu tuyến đầu vẫn đông đúc, các lớp trên nó sẽ có giá trị.

Nếu công việc không thể được chấm điểm từ bên ngoài, một ai đó bên trong phải quyết định thậm chí câu trả lời tốt là gì, và quyết định đó là toàn bộ trò chơi. Đủ những quyết định này, viết ra, trở thành một benchmark. Harvey đã phát hành một cái cho luật, Sierra cho agent giọng nói. Bạn giành quyền định nghĩa điều gì có nghĩa là tốt cho một lĩnh vực bằng cách trở thành thứ mà lĩnh vực đó đã sử dụng, và các công ty này giành quyền đó thông qua cuộc đấu tranh áp dụng thực tế.

Đánh giá quyết định tiền thật là riêng tư và khác nhau tùy công ty: công ty này, trong vấn đề này, sẽ chấp nhận điều gì là công việc tốt, nó còn lâu mới hoàn thành, vì độ sâu của luật pháp làm lu mờ bất kỳ bài kiểm tra công cộng nào. OpenEvidence đang xác định câu trả lời lâm sàng an toàn trông như thế nào. Đây không phải là đo lường thực sự, đây là phán đoán về điều gì là thật và điều gì là tốt, được viết ra cho đến khi nó trở thành tiêu chuẩn mà tất cả những người khác bị đo lường dựa vào, và phòng thí nghiệm cơ bản dù thông minh đến đâu cũng không thể viết nó, vì địa vị đó chỉ tồn tại bên trong lĩnh vực đó. Thẩm quyền này có xu hướng rơi vào nơi nó đã ngồi. Luật sư kỳ cựu viết benchmark luật. Việc xác định câu trả lời lâm sàng an toàn rơi vào tay bác sĩ. Và "đã giải quyết" có nghĩa là bất cứ công ty nào đã có khách hàng nói nó có nghĩa vậy.

Việc hấp thụ tiên tiến liên tục tăng lên, vì chúng ta liên tục học cách đo lường nhiều công việc hơn, cái có thể đo lường bị nuốt chửng. Mặt đất không thể huấn luyện thu hẹp dưới chân bất kỳ ai đang đứng trên nó, vì vậy bạn không thể tìm một điểm có thể phòng thủ rồi nghỉ ngơi. Bạn liên tục tiến về phía bất cứ thứ gì chưa thể được chấm điểm, bạn liên tục tái bảo hiểm. Trên một nhiệm vụ hẹp, với dữ liệu riêng tư của bạn và đánh giá của riêng bạn, bạn có thể huấn luyện đến trình độ tiên tiến và đánh bại mô hình chung ở nơi quan trọng, và mô hình chuyên môn đó trở thành một phần của hào bảo vệ. Mặt khác, cạnh tranh trên mô hình chung là một cuộc chiến vốn, bạn sẽ thua người có nhiều sức mạnh tính toán nhất, đây là cái bẫy cho các công ty có quyền truy cập nông và nhiệm vụ có thể thấy. Nó hứa hẹn vượt qua huấn luyện tiên tiến trong phạm vi nhiệm vụ chung để tồn tại vào ngày đó, người chiến thắng dường như được quyết định nhiều nhất bởi quy mô trung tâm dữ liệu, và kết cục thường không phải là nhà vô địch độc lập mà là bán cho người giàu sức mạnh tính toán.

Tất cả những điều này là phòng thủ. Khó hơn là tấn công, lựa chọn xây dựng gì trước tiên. Đây là điều tôi dành một năm để tìm kiếm, tôi có lẽ tìm thấy ba lần. Mô hình không giúp được ở đây. Nó sẽ làm bất cứ điều gì bạn chỉ, nhưng không thể nói cho bạn biết điều gì đáng để chỉ, bạn không thể benchmark điều đó, vì vậy bạn không thể huấn luyện nó. Đây cũng là lý do các doanh nghiệp hiện có không lấy hết mọi thứ: họ giữ lãnh thổ họ có, thứ tiếp theo đến từ người phát hiện công dụng trước chúng ta. Có lẽ ý định là đầu vào khan hiếm hơn sức mạnh tính toán.

Thuyết tuyệt vọng đúng một nửa. Các lớp bao bọc mỏng thực sự đang bị hấp thụ, nhiều thứ trông giống công ty ngày nay là bao bọc mỏng. Nó sai về phần còn lại. Cơ chế rõ ràng; điểm đến thì không. Tôi sẽ đặt cược vào hướng đi: sự thông minh không ngừng trở nên rẻ hơn, giá trị không ngừng trượt về phía vài nơi mà mô hình không thể chạm tới. Không thể huấn luyện là giá trị có lịch sử. Vì vậy, hãy đi vào một cái, làm công việc dịch thuật thầm lặng, bắt đầu viết ra điều gì có nghĩa là tốt ở đó, vì một ai đó sẽ làm điều đó. Điểm benchmark được trích dẫn nhiều nhất năm nay là một bản đồ lãnh thổ sắp trở nên vô giá trị, và một thông báo về ai sắp mất quyền nói điều gì được tính là tốt.

Câu hỏi Liên quan

QBài viết giải thích hiện tượng 'sự tuyệt vọng của nhà đầu tư AI vào năm 2026' dựa trên logic nào?

ALogic của sự tuyệt vọng là: nếu các mô hình AI tiếp tục trở nên tốt hơn trong mọi việc, thì mọi công ty xây dựng trên nó chỉ là một lớp bao bọc mỏng manh sẽ bị hấp thụ. Khi đó, giá trị duy nhất còn tồn tại là năng lực tính toán (compute) và quyền truy cập vào các mô hình tiên phong (frontier models).

QTại sao việc viết mã (coding) được mô tả là công việc đầu tiên bị 'mô hình nuốt chửng', và bài học sai lầm mà mọi người rút ra là gì?

AViết mã là một trong những công việc đầu tiên trưởng thành vì benchmark (tiêu chuẩn đánh giá) của nó có thể đo lường được dễ dàng (thông qua trình biên dịch, bộ kiểm thử). Mọi người rút ra bài học sai lầm rằng 'mô hình đã nuốt chửng kỹ thuật phần mềm'. Trong thực tế, mô hình chỉ xử lý phần dễ đo lường, trong khi phần lớn giá trị thực sự (như hiểu codebase phức tạp, ra quyết định trong ngữ cảnh thực) vẫn cần đến con người và không thể đo lường bằng benchmark.

QTheo tác giả, 'hào bảo vệ' (moat) thực sự của các công ty khởi nghiệp nằm ở đâu khi các mô hình AI ngày càng mạnh?

AHào bảo vệ thực sự nằm ở những khu vực 'không thể đào tạo được' (untrainable) cho mô hình AI. Đó là: 1) Tính đúng đắn mang tính riêng tư và tốn kém để xây dựng (chỉ tồn tại trong dữ liệu nội bộ của một công ty). 2) Sự cô lập, bị khóa trong các hệ thống bên ngoài không thể tiếp cận (như tích hợp phức tạp, quy trình phê duyệt, giấy phép). 3) Công việc dịch thuật (translation) không ngừng nghỉ: sắp xếp thực tế riêng tư của công ty, cung cấp công cụ và hợp tác với khách hàng để thay đổi quy trình làm việc của họ.

QVai trò của 'sự tin cậy' (trust) và 'quyền quyết định' (authority) được nhấn mạnh như thế nào trong việc xây dựng lợi thế cạnh tranh?

ASự tin cậy và quyền quyết định là rào cản then chốt mà trí thông minh thuần túy của mô hình không thể vượt qua. Mô hình dù thông minh đến đâu cũng cần được 'cho phép vào cửa' thông qua các quy trình an ninh, tích hợp, hợp đồng và có người chịu trách nhiệm cho hành động của nó. Việc giành được sự tin cậy của người dùng (như bác sĩ, luật sư) là một quá trình chậm, dựa trên mối quan hệ. Công ty nào giành được vị trí trong một lĩnh vực sẽ có quyền xác định 'thế nào là một câu trả lời tốt' (ví dụ: Harvey trong ngành luật, OpenEvidence trong lâm sàng), từ đó tạo ra benchmark riêng và củng cố vị thế của mình.

QTác giả đưa ra lập luận nào để phản bác quan ngại rằng các phòng thí nghiệm AI (labs) sẽ tự mình chiếm lĩnh thị trường và khiến các ứng dụng bên trên trở nên dư thừa?

ATác giả lập luận rằng thị trường mô hình không phải là trò chơi một người. Có sự cạnh tranh khốc liệt giữa nhiều bên (OpenAI, Anthropic, Google, các công ty quốc tế...). Các phòng thí nghiệm muốn có thị phần và không muốn bất kỳ ứng dụng quan trọng nào chết đi vì điều đó có thể đẩy họ sang đối thủ. Hơn nữa, ví dụ thực tế cho thấy mô hình tốt nhất không phải lúc nào cũng thắng trong ứng dụng (ví dụ: ChatGPT giữ vị trí dẫn đầu nhờ tích hợp và thương hiệu, không chỉ là mô hình). Do đó, miễn là mặt trận mô hình vẫn đông đúc và cạnh tranh, các lớp ứng dụng phía trên vẫn sẽ có giá trị.

Nội dung Liên quan

Sau “Nhà máy AI” của Elon Musk và Jensen Huang, một cuộc “Chiến tranh cướp nước ngọt” không khói súng đã bắt đầu

Bạn có thể không tưởng tượng được, mỗi khi bạn yêu cầu ChatGPT viết một báo cáo tuần 100 từ, hoặc để Claude sửa vài dòng code, khoảng 500ml nước ngọt tinh khiết (tương đương một chai Nông Phu Sơn Tuyền) sẽ bốc hơi từ các đường ống làm mát ở đâu đó trên Trái đất. Trong hai năm qua, cuộc chạy đua vũ trang AI luôn bị gắn chặt trong vòng lặp logic "chip, sức mạnh tính toán và điện hạt nhân". Tuy nhiên, mọi người dường như đều lãng quên một giới hạn vật lý cơ bản và lạnh lùng nhất: những bộ não silicon nóng bỏng này cần uống nước, và là nước ngọt mà con người phụ thuộc để sinh tồn. Báo cáo mới nhất của Đại học Liên Hợp Quốc (UNU) về chi phí môi trường AI toàn cầu đã vạch trần sự thật: đến năm 2030, lượng nước tiêu thụ hàng năm của cơ sở hạ tầng AI toàn cầu sẽ đạt mức kinh ngạc 9,3 nghìn tỷ lít, đủ để đáp ứng nhu cầu nước sinh hoạt cơ bản của 1,3 tỷ dân trên Trái đất trong một năm. Một cuộc "chiến tranh cướp đoạt nước ngọt" do Physical AI và sức mạnh tính toán mô hình lớn thúc đẩy đã chính thức bắt đầu vào mùa hè năm 2026. Tại sao các mô hình AI lớn lại trở thành "quái vật hút nước"? Câu trả lời nằm ở kiến trúc tản nhiệt của trung tâm dữ liệu. Hơn 70% trung tâm dữ liệu toàn cầu sử dụng "hệ thống làm mát bay hơi", tiêu thụ một lượng lớn nước ngọt, với khoảng 80% bốc hơi vào khí quyển và không thể tái tuần hoàn tại chỗ. Các báo cáo cho thấy chỉ việc "huấn luyện" GPT-4 một lần đã tiêu thụ khoảng 600 triệu lít nước tinh khiết. Lượng nước tiêu thụ hàng năm của Google đã vượt quá 81 tỷ gallon, trong khi của Microsoft tại các khu vực trọng điểm huấn luyện mô hình lớn cũng tăng gần gấp đôi trong ba năm qua. Xung đột gay gắt nhất của cuộc "chiến tranh nước ngọt" này xảy ra tại Memphis, Tennessee, Mỹ. Năm 2024, để huấn luyện mô hình lớn Grok, đội ngũ xAI của Elon Musk đã xây dựng siêu máy tính Colossus ở Memphis trong 122 ngày. Để vận hành cỗ máy khổng lồ này, cần rút tới 1 triệu gallon nước uống của cư dân từ tầng chứa nước ngầm địa phương mỗi ngày, dẫn đến phản ứng dữ dội từ cộng đồng. Đối mặt với khủng hoảng, Musk và Jensen Huang buộc phải thỏa hiệp, công bố xây dựng một nhà máy xử lý nước tái chế. Sự kiện "Watergate" ở Memphis đã trở thành một bước ngoặt, chứng minh rằng từ năm 2026, nút thắt cổ chai cuối cùng hạn chế tốc độ mở rộng AI không còn là công suất của TSMC hay tiền tệ, mà là "quyền tiếp cận nguồn nước" được chính quyền địa phương phê duyệt. Trước những cuộc biểu tình ngày càng tăng và hạn hán nghiêm trọng, các CEO công nghệ bắt đầu kể những "câu chuyện mới". Tại hội nghị Microsoft Build 2026, CEO Satya Nadella tuyên bố về "cuộc cách mạng không nước", cho biết các trung tâm dữ liệu siêu lớn mới nhất đã loại bỏ hoàn toàn làm mát bay hơi và chuyển sang sử dụng hệ thống "làm lạnh vòng lặp kín không nước". Tuy nhiên, các chuyên gia chỉ ra rằng hệ thống vòng lặp kín làm tăng mức tiêu thụ điện từ 20% đến 30%, và dấu chân nước gián tiếp từ việc sản xuất điện thậm chí còn lớn hơn. Trong bối cảnh này, ngành công nghiệp AI Trung Quốc cần cảnh giác và tìm kiếm lộ trình đột phá. Giải pháp nằm ở việc bố trí sức mạnh tính toán theo địa lý, chẳng hạn như chính sách "Đông số Tây toán", đặt các phòng máy huấn luyện quy mô lớn cần nước lạnh ở những khu vực như Quý Châu, Nội Mông. Điểm đột phá công nghệ cốt lõi là tái cấu trúc sức mạnh tính toán hỗn hợp "tiểu não ở rìa, đại não trên đám mây". Các nhà sản xuất robot thông minh và thiết bị gia đình thông minh Trung Quốc đang thúc đẩy nghiên cứu và phát triển chip tối ưu hóa cho thiết bị đầu cuối. Nếu 90% vấn đề tương tác vật lý có thể được giải quyết tại chỗ bằng chip biên công suất thấp và mô hình thế giới nhẹ, thay vì gửi lệnh đa phương thức tiêu tốn nhiều năng lượng lên đám mây, chúng ta có thể cắt giảm 90% mức tiêu thụ nước và điện của AI. Cuộc "chiến tranh cướp đoạt nước ngọt" mà Musk và Huang đang đối mặt đang buộc AI toàn cầu phải từ bỏ lớp vỏ nông nổi. Liệu AI là bậc thang đưa nền văn minh nhân loại lên tầm cao mới, hay là một quái vật silicon cuối cùng sẽ tranh giành những giọt nước tinh khiết cuối cùng của Trái đất với con người? Mùa hè năm 2026, câu trả lời đang trở nên rõ ràng hơn cùng với hơi nước bốc lên đó.

marsbit48 phút trước

Sau “Nhà máy AI” của Elon Musk và Jensen Huang, một cuộc “Chiến tranh cướp nước ngọt” không khói súng đã bắt đầu

marsbit48 phút trước

AGI chỉ còn một bước nữa

Tháng 4/2024, Anthropic công bố mô hình Mythos cực mạnh, phát hiện hơn 10.000 lỗ hổng bảo mật cho 50 khách hàng doanh nghiệp, gây chấn động. Do lo ngại bị lạm dụng, nó đã không được công khai. Đến tối qua, Anthropic chính thức ra mắt Fable 5 - phiên bản đã được "cắt giảm chức năng" của Mythos 5 với bộ phân loại an toàn, trong khi Mythos 5 gốc chỉ dành cho khoảng 200 tổ chức được kiểm duyệt khắt khe. Fable 5 thể hiện sức mạnh đáng kinh ngạc. Trên bảng xếp hạng lập trình SWE-Bench Pro, nó đạt 80.3%, vượt xa GPT-5.5 (58.6%) và Gemini 3.1 Pro (54.2%). Trong thử nghiệm thực tế tại Stripe, nó tự động di chuyển 50 triệu dòng mã lịch sử chỉ trong một ngày. Mô hình này thể hiện "khả năng ủy thác tầm xa" thực sự, có thể tự lập kế hoạch con, điều phối công cụ và tự sửa lỗi, đánh dấu một bước tiến lớn so với các mô hình chỉ biết "phản hồi" trước đây. Từ góc độ hẹp, Fable 5 thực sự đã đạt được AGI (Trí tuệ nhân tạo phổ quát) trong lĩnh vực kinh tế số. Theo tiêu chuẩn 5 cấp độ AI của OpenAI, Fable 5 đã đứng vững ở cấp độ 3 (Trí tuệ) và đang khám phá cấp độ 4 (Đổi mới). Tốc độ cập nhật của Anthropic ngày càng nhanh, với việc nâng cấp từ Opus 4.8 lên Fable 5 chỉ mất 11 ngày. Dự đoán cấp độ 4 sẽ đạt được trong năm nay, và cấp độ 5 (Tổ chức) có thể chỉ còn 18-24 tháng nữa. Tuy nhiên, sức mạnh đi kèm rủi ro. Báo cáo đánh giá cho thấy Mythos 5 đạt cấp độ CB-1, có khả năng hướng dẫn tổng hợp vũ khí sinh hóa và tạo kịch bản tấn công khai thác lỗ hổng zero-day chỉ trong vài giây. Để giảm thiểu rủi ro, Anthropic đã áp dụng hai cơ chế an toàn chính cho Fable 5: 1) Cơ chế định tuyến giảm cấp lặng lẽ, chuyển hướng các truy vấn nguy hiểm sang Opus 4.8; 2) Chính sách lưu giữ dữ liệu 30 ngày bắt buộc để phát hiện lạm dụng. Về giá, Fable 5 có mức phí cao: 10 USD/triệu token đầu vào và 50 USD/triệu token đầu ra, biến nó thành một "mặt hàng xa xỉ" đối với người dùng cá nhân. Tuy nhiên, các doanh nghiệp sẵn sàng trả phí cao vì lợi nhuận và nhu cầu phòng thủ an ninh mạng. Động thái này đánh dấu sự phân hóa thị trường AI: các mô hình đỉnh cao phục vụ B2B và nghiên cứu, trong khi các mô hình rẻ hơn cạnh tranh ở thị trường tiêu dùng. Sự xuất hiện của Fable 5/Mythos 5 báo hiệu kỷ nguyên AI trưởng thành, nơi trí tuệ đỉnh cao trở thành tài nguyên chiến lược, thúc đẩy bùng nổ năng suất nhưng cũng mang đến những thách thức cho thị trường lao động truyền thống.

marsbit1 giờ trước

marsbit1 giờ trước

Phục Hồi Tính Riêng Tư Trong Crypto: ZCASH (ZEC) Thực Hiện Động Thái Sau Cú Sụp Giảm 50%

Zcash (ZEC) đang nỗ lực khôi phục niềm tin vào mạng lưới tập trung vào quyền riêng tư của mình sau một đợt bán tháo mạnh khiến giá giảm hơn 50%. Sự sụt giảm này được kích hoạt bởi phát hiện về một lỗ hổng nghiêm trọng trong mạch proof zero-knowledge Orchard, có khả năng cho phép tạo ra token ZEC giả mạo. Các nhà phát triển đã nhanh chóng vá lỗ hổng, giúp giá ZEC phục hồi khoảng 70%. Tuy nhiên, do tính chất bảo mật của Orchard, không thể xác minh liệu có đồng ZEC giả nào đã được tạo ra trước đó hay không. Để giải quyết vấn đề này và khôi phục khả năng xác minh nguồi cung lưu hành, một đề xuất mới có tên Ironwood đã được đưa ra bởi Shielded Labs, Zcash Foundation và các đối tác. Mục tiêu chính của Ironwood là trao cho mỗi người dùng khả năng tự xác minh tính toàn vẹn của nguồi cung ZEC. Đề xuất này sẽ chặn các giao dịch tạo coin mới trong pool Orchard và thiết lập một cơ chế "cửa quay" để kiểm soát dòng tiền ra. Hệ thống này cũng có thể cung cấp bằng chứng về việc lỗ hổng có từng bị khai thác hay không, đồng thời vô hiệu hóa bất kỳ đồng ZEC giả mạo nào nếu chúng cố gắng rời khỏi pool.

bitcoinist1 giờ trước

Phục Hồi Tính Riêng Tư Trong Crypto: ZCASH (ZEC) Thực Hiện Động Thái Sau Cú Sụp Giảm 50%

bitcoinist1 giờ trước

Tài Sản Thực Trên Solana Gây Sức Ép Với Sự Tăng Đột Biến Đáng Kể Trong Hoạt Động Chuyển Giao

Solana đang cho thấy sự phân kỳ thú vị: trong khi giá SOL giảm và phá vỡ các mức hỗ trợ quan trọng, mạng lưới lại ghi nhận đà tăng trưởng mạnh mẽ. Đặc biệt, lĩnh vực tài sản thế giới thực (RWA) trên Solana đã có bước tiến lớn với khối lượng chuyển giao trong ngày tăng hơn gấp đôi, đạt mức kỷ lục 1,49 tỷ USD, trong đó preSPAX chiếm hơn 1 tỷ USD. Điều này cho thấy nhu cầu ngày càng tăng đối với tài sản được mã hóa trên nền tảng này. Song song đó, Solana tiếp tục được các chuyên gia như Zensei đánh giá là nền tảng giao dịch spot tốt nhất hiện nay, với cặp SOL/USDC có khối lượng giao dịch gấp hơn 6 lần tổng của 9 thị trường SOL lớn khác. Về mặt giá cả, SOL hiện đang giao dịch trong vùng Fibonacci quan trọng (0.5-0.618), tương tự giai đoạn trước khi nó tăng trưởng hơn 2,200%. Một số nhà phân tích kỳ vọng rằng, nếu được kích hoạt bởi một mùa Altcoin, giá SOL có thể nhắm tới mốc 1.000 USD.

bitcoinist2 giờ trước

Tài Sản Thực Trên Solana Gây Sức Ép Với Sự Tăng Đột Biến Đáng Kể Trong Hoạt Động Chuyển Giao

bitcoinist2 giờ trước

Mức Cao Ba Năm Mới Đập Tan Giấc Mơ Giảm Lãi Suất, Ai Đang Mượn CPI Rửa Sạch Mã Thương?

Bài viết phân tích phản ứng của thị trường sau khi Mỹ công bố chỉ số CPI tháng 5/2026 tăng 4,2% so với cùng kỳ, mức cao nhất kể từ tháng 4/2023. Lạm phát tăng chủ yếu do giá năng lượng bởi xung đột địa chính trị, khiến kỳ vọng về việc Cục Dự trữ Liên bang (Fed) cắt giảm lãi suất trong năm nay gần như tan biến. Các công cụ theo dõi thị trường cho thấy xác suất Fed giữ nguyên lãi suất trong năm nay lên tới 72%. Thị trường chứng khoán và tiền mã hóa, với tư cách là tài sản rủi ro, chịu áp lực giảm điểm. Bitcoin dao động quanh ngưỡng 61.000-62.000 USD, các quỹ ETF bitcoin ghi nhận dòng tiền ròng rút liên tục. Dữ liệu từ Glassnode chỉ ra thị trường đang trong giai đoạn thanh lọc đòn bẩy và tâm lý bi quan, mặc dù các chỉ báo định giá đã ở vùng thấp lịch sử. Các chuyên gia như Olu Sonola (Fitch) và Seema Shah (Principal Asset Management) nhận định lạm phát cốt lõi vẫn được kiểm soát tương đối, cho Fed không gian tiếp tục quan sát. Họ cho rằng việc thị trường định giá khả năng tăng lãi suất là hơi cao. David Kelly từ JP Morgan Asset Management dự báo dữ liệu này có thể là đỉnh chu kỳ tạm thời và Fed nhiều khả năng sẽ duy trì lãi suất ở cuộc họp sắp tới.

Foresight News2 giờ trước

Mức Cao Ba Năm Mới Đập Tan Giấc Mơ Giảm Lãi Suất, Ai Đang Mượn CPI Rửa Sạch Mã Thương?

Foresight News2 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai