Google chính thức tuyên chiến

链捕手Xuất bản vào 2026-05-21Cập nhật gần nhất vào 2026-05-21

Tóm tắt

Google đã công bố hàng loạt đột phá tại I/O 2026, khẳng định vị thế thống lĩnh trong cuộc chiến AI. Trọng tâm là Gemini 3.5 Flash - mô hình nhẹ nhưng mạnh mẽ nhờ kỹ thuật "chưng cất tri thức" cực hạn và kiến trúc MoE với 256 chuyên gia, cho tốc độ phản hồi dưới 65ms. Google cũng giới thiệu Gemini Omni Flash (mô hình đa phương tiện nguyên bản), trợ lý AI Spark (được tích hợp sâu vào Android) và kính thông minh nhẹ 4g - tất cả nhằm đưa AI vào mọi điểm chạm. CEO Sundar Pichai tiết lộ Gemini đã đạt 9 tỷ người dùng hoạt động hàng tháng, nhờ tích hợp vào Chrome, Android và Workspace. Đặc biệt, Google gây sốc khi giảm giá mạnh: gói AI Ultra chỉ còn 99.9 USD/tháng, giá API của Gemini 3.5 Flash chỉ bằng 1/10 đối thủ. Chiến lược này dựa trên lợi thế hạ tầng máy chủ TPU nội bộ, biến AI thành hàng hóa cơ bản và gây áp lực lên các công ty thuần API như OpenAI. Động thái của Google đánh dấu sự chuyển dịch từ "cuộc đua mô hình thuần túy" sang "cuộc chiến không gian bốn chiều": thiết bị + đám mây + hệ sinh thái + phần cứng. Điều này không chỉ thách thức các đối thủ AI mà còn đe dọa vị thế nhập cảnh của Apple, khi tương tác không màn hình dự kiến sẽ chiếm 35% thời lượng sử dụng trong ba năm tới.

Hội nghị nhà phát triển Google I/O năm 2026, chỉ mang lại cảm giác về hai từ: Ngạo mạn.

Không chỉ nhồi nhét các tác nhân thông minh AI một cách liền mạch vào tất cả các cổng lưu lượng cốt lõi như tìm kiếm, trình duyệt, điện thoại, kính thông minh..., mà còn liên tục tung ra ba "vương bài":Gemini 3.5 Flash, mô hình videoOmni, và trợ lý AI hoàn toàn mớiSpark.

Sau khi phô diễn cơ bắp, "Pichai" thậm chí còn tuyên bố một cách khoe khoang rằng,Gemini đã vượt mốc 900 triệu người dùng hoạt động hàng tháng; và đồng thời công bố giảm giá mạnh.

Ý nghĩa còn rõ ràng hơn:Tôi mạnh hơn bạn, và còn rẻ hơn bạn.

Đây không phải là tuyên chiến thì là gì?

01

Điều gây ấn tượng nhất tại hội nghị, không còn nghi ngờ gì, là sự xuất hiện củaGemini 3.5 Flash.

Thông thường, "Pro" đại diện cho lực lượng nòng cốt, "Flash" đại diện cho nhẹ và nhanh.

Xét về số lượng tham số mô hình,3.5 Flash thực sự nhỏ hơn3.1 Pro, nhưng trên hầu hết các bài kiểm tra chuẩn suy luận và mã hóa, hiệu suất của mô hình trước lại vượt trội hơn:

Bài kiểm tra suy luận toán học phức tạp GSM8K,3.5 Flash đạt điểm số 95.8%, vượt qua 93.2% của3.1 Pro; Trong bài kiểm tra khả năng tạo mã SWE-bench phiên bản đầy đủ, tỷ lệ giải quyết của3.5 Flash đạt 38.4%, vượt xa 32.1% của3.1 Pro...

Tại sao?

Theo Báo cáo kỹ thuậtGemini 3.5 do DeepMind công bố, có hai công nghệ cốt lõi quan trọng nhất.

Chưng cất tri thức cực hạn: Lần này Google không chỉ đơn thuần dựa vào việc đẩy mạnh năng lực tính toán để huấn luyện Flash, mà đã sử dụng mô hình giáo viên chưa từng công bố trước đây là "Gemini 3.5 Ultra" để chưng cất giảm chiều Flash.

Theo phân tích từ tweet của nhà khoa học trưởng DeepMind, Jeff Dean, tỷ lệ tinh chỉnh của3.5 Flash trên bộ dữ liệu chuỗi logic chất lượng cao đã được nâng cao 400% so với thế hệ trước.

Điều này có nghĩa là nó kế thừa "bộ não logic" của mô hình siêu lớn, thay vì "kho kiến thức" học vẹt.

Kiến trúc MoE mới hoàn toàn (Mô hình hỗn hợp chuyên gia): Bên trong3.5 Flash, Google đã áp dụng mạng chuyên gia với độ mịn hạt tốt hơn.

Mô hình MoE truyền thống có thể chỉ có 8 hoặc 16 chuyên gia, mỗi lần chỉ kích hoạt 1-2 chuyên gia, đủ để hỗ trợ mô hình với quy mô tham số nghìn tỷ.

Còn theo phân tích từ bản ghi nhớ đầu tư cơ sở hạ tầng AI năm 2026 của a16z,3.5 Flash đã sử dụng 256 chuyên gia siêu nhỏ, mỗi lần suy luận có thể kích hoạt 4 chuyên gia hiệu quả nhất trong số đó.

Vì vậy, nó mới có thể bao phủ không gian đặc trưng đa phương thức cực kỳ rộng lớn trong khi vẫn duy trì lượng tham số kích hoạt cực thấp.

Trên chỉ số TTFT (Thời gian xuất token đầu tiên),3.5 Flash đã đạt dưới 65 mili giây.

Trong khi đó, một lần chớp mắt của con người cần 100-150 mili giây.

Nói một cách đơn giản, khi nó hoạt động như một tác nhân thông minh, từ góc độ sinh lý của con người, không thể phát hiện ra bất kỳ sự tạm dừng nào.

Đối với các nhà phát triển cần gọi công cụ thường xuyên, suy ngẫm nhiều vòng, độ trễ cực thấp, đây thực sự là nền tảng siêu đại lý hoàn hảo.

Chỉ dựa vào tối ưu hóa kỹ thuật cực kỳ tinh tế như vậy, mới có thể thiết lập sức mạnh thống trị về "triển khai phía thiết bị" trong môi trường cạnh tranh khốc liệt.

Thứ nhất, đa phương thức bản địaGemini Omni Flash.

Omni có nghĩa là toàn năng, đối đầu vớiGPT-4o ra mắt trước đó, chỉ cần nhìn tên thôi cũng có thể cảm nhận được mùi thuốc súng đậm đặc thế nào.

Ít nhất từ hiệu suất mà xem,Gemini Omni Flash xứng đáng sử dụng ký tự "o" này hơnGPT-4o nhiều.

Các mô hình video ban đầu nhưSora hayGemini 1.5, về cơ bản đều là "quái vật khâu vá", tức chuyển giọng nói thành văn bản, rồi văn bản chuyển thành hình ảnh.

Nhưng Omni được phát hành lần này, là sự căn chỉnh đa phương thức đầu-cuối bản địa thực sự. Nó không chỉ có thể hiểu bản địa tính nhất quán về thời gian và quy luật vật lý trong video, mà độ trễ cũng giảm từ mức trung bình ngành 400-600 mili giây xuống còn 120 mili giây.

Lấy một ví dụ từ hội nghị: Người dùng đeo camera đổ nước, cốc nước sắp đầy, Omni có thể nói "Dừng lại!" trước khi nước tràn ra 0.5 giây.

Loại suy luận thời gian thực về trạng thái vật lý của thế giới thực này, trông có vẻ đơn giản, nhưng ý nghĩa rất lớn:AI chính thức tiến hóa từ chatbot trong màn hình thành công cụ hỗ trợ thế giới thực.

Mặc dù chỉ là giai đoạn sơ khai.

Thứ hai, trợ lý thông minhSpark.

Theo tiết lộ từ cuộc phỏng vấn của The Verge với Phó chủ tịch kỹ thuật Android,Spark được trao quyền kiểm soát API cấp hệ thống bản địa ở lớp dưới của hệ thống Android 17.

Nói một cách đơn giản, những quy trình phức tạp trước đây bạn cần mở nhiều App mới có thể hoàn thành, bây giờ không cần động tay, chỉ cần ra lệnh cho Spark một tiếng, nó có thể giúp bạn xử lý tất cả, thậm chí có thể gửi thông tin, sắp xếp email, tổng hợp lịch trình, theo dõi động thái trang web, nhận diện phí trừ ẩn trên hóa đơn, xử lý hàng loạt tài liệu v.v... theo giọng điệu và sở thích của bạn...

Nói cách khác, sau này có trợ lý AI, chúng ta hầu như không cần dùng đến App nữa, bất kỳ thao tác phức tạp nào đều được đơn giản hóa thành duy nhất.

Thứ ba, kính thông minh.

Tại sao lại là kính?

Ít nhất theo quan điểm của Google, việc tích hợp liền mạch thị giác và thính giác, chính là vật chủ cuối cùng của mô hình lớn đa phương thức.

Chiếc kính này trông không có vẻ ngoài hào nhoáng nào, tập trung hoàn toàn vào khả năng thực tế:

Tròng kính dẫn sóng quang học Micro-OLED toàn màu chỉ nặng 4 gram, tỷ lệ truyền ánh sáng lên tới 85%;

Được trang bị chip cạnh Gemini nhẹ tự phát triển, độ trễ suy luận cục bộ ≤12ms, không cần kết nối mạng có thể hoàn thành dịch thời gian thực, nhận diện hình ảnh, phân tích cảnh quan;

Liên kết bản địa với tác nhân thông minh Spark, đồng bộ dữ liệu điện thoại, đám mây, thực hiện các dịch vụ cá nhân hóa như nhắc lịch, dịch thời gian thực, cảnh báo môi trường.

Tóm lại, chính là vượt qua màn hình điện thoại, nhồi nhét tác nhân thông minh vào góc nhìn thứ nhất của con người thông qua kính.

Nội dung quá nhiều, Google dường như đã xả hết tất cả các đòn mạnh một lúc, tuyên bố với thị trường một chân lý:

Thuật toán không có cổng vào, chẳng là gì cả.

Thời đại cuộn tham số mô hình lớn, cuộn điểm benchmark đã qua, các nhà cung cấp mô hình đơn thuần không còn hào rào bảo vệ, tương lai là cuộc chiến không gian bốn chiều "thiết bị + đám mây + hệ sinh thái + phần cứng".

Nhồi nhét AI vào bộ ứng dụng gia đình, thực chất là đang định hình lại logic phân phối lưu lượng toàn bộ Internet: từ "người dùng chủ động tìm kiếm / nhấp chuột", trở thành "tác nhân thông minh AI chủ động phân phối dịch vụ".

Đối với đông đảo nhà phát triển và doanh nghiệp vừa và nhỏ, điều này tốt hơn cả, vì năng lực tính toán cơ sở và mô hình trở nên cực kỳ rẻ, mọi người có thể tập trung làm sáng tạo ở lớp ứng dụng.

Nhưng các đối thủ cạnh tranh khác, lúc này có lẽ chỉ muốn chửi thề.

02

Khi Pichai trên sân khấu nhẹ nhàng tuyên bố "Người dùng hoạt động hàng tháng của Gemini chính thức vượt 900 triệu", đã tạo nên một cơn chấn động không nhỏ dưới khán đài.

900 triệu, nhiều hơn tổng MAU của tất cả đối thủ Mỹ cộng lại.

Làm thế nào để đạt được?

Câu trả lời đơn giản và thô bạo:Nhồi nhét cứng.

Google không cần phải chi phí quảng cáo để mua lượng người dùng như các công ty AI độc lập, chỉ cần thêm một biểu tượng bên cạnh thanh địa chỉ của trình duyệt Chrome, tích hợp một phím tắt gọi ở thanh điều hướng dưới cùng của 3 tỷ điện thoại Android, đẩy cập nhật toàn bộ trong Google Workspace...

Chi phí thu hút người dùng về cơ bản bằng 0.

Quan trọng hơn, trong khoảng thời gian tới, dữ liệu phản hồi thế giới thực đa phương thức, chất lượng cao với khối lượng khổng lồ được tạo ra từ 900 triệu người dùng hoạt động mỗi ngày khi họ nhìn sản phẩm bằng kính thông minh, sửa logic khi xử lý công việc bằng Spark và tương tác với mô hình hình ảnh Omni, tất cả sẽ trở thành dưỡng chất nuôi dưỡngGemini 4.

Đây là một hào rào cực kỳ kiên cố:Mô hình càng dễ dùng -> càng nhiều người dùng -> càng tạo ra nhiều dữ liệu -> mô hình càng trở nên dễ dùng hơn.

Để nhanh chóng củng cố vòng lặp này, Google trực tiếp tuyên bố với tất cả đối thủ phát động chiến tranh giá:Gói AI Ultra từ 249.99 USD / tháng giảm xuống còn 99.9 USD / tháng.

3.5 Flash có giá nhập đầu vào triệu token là 0.02 USD, giá xuất đầu ra triệu token là 0.08 USD.

Đây là mức giá thần thánh gì vậy?

So sánh một chút, giá trung bình của các mô hình cùng cấp trong ngành lần lượt là 0.15-0.2 USD và 0.6-1 USD.

Pichai tính toán: Khách hàng đầu ngành xử lý khoảng 1 nghìn tỷ token mỗi ngày. Chuyển 80% khối lượng công việc sangGemini 3.5 Flash trong một năm, có thể tiết kiệm hơn 10 tỷ USD.

Tại sao dám bán AI với giá rẻ như rau?

Chỗ dựa lớn nhất chính là:Cơ sở hạ tầng năng lực tính toán được tích hợp theo chiều dọc.

Các gã khổng lồ như OpenAI, Anthropic, trông có vẻ hào nhoáng, nhưng về bản chất vẫn là "khách thuê năng lực tính toán", cần phải mua năng lực tính toán từ Microsoft, Amazon, và những công ty sau lại phải trả tiền cho Nvidia.

Còn Google có TPU của riêng mình, cộng thêm hiệu suất kích hoạt thưa thớt cực kỳ biến thái của3.5 Flash, đã nén chi phí năng lực tính toán đến mức tối đa.

Hoàn toàn có thể sử dụng lợi thế tài sản nặng để giáng đòn giảm chiều xuống các công ty thuật toán đơn thuần.

Logic rất rõ ràng.

Mô hình lớn cơ sở đang nhanh chóng hàng hóa hóa. Giống như nước và điện vậy, bạn đã thấy công ty nước sạch nào có lợi nhuận khổng lồ chưa?

Google không sợ bản thân mô hình lớn không kiếm được tiền, vì có thể kiếm tiền lại thông qua quảng cáo tìm kiếm, dịch vụ đám mây và hoa hồng từ hệ sinh thái Android.

Nhưng đối với OpenAI, Anthropic, Cohere, Mistral, những công ty sống dựa vào việc bán API mô hình lớn thuần túy, điều này là không thể.

Các nhà đầu tư bây giờ có lẽ rất muốn ấn đầu Sam Altman để hỏi:"Giá API của Google chỉ bằng một phần mười của anh, hiệu suất còn tốt hơn anh, anh nói cho tôi biết, mô hình kinh doanh của anh sẽ chạy thông như thế nào?"

Cấu trúc cạnh tranh của nhiều ngành công nghiệp sẽ vì thế bước vào giai đoạn rửa bài gia tốc.

Các nhà cung cấp AI không cần nói nhiều, phải nhanh chóng tìm ra nguồn năng lực tính toán rẻ hơn, hoặc tự mình xuống sân làm chip.

Tiếp theo là Apple vẫn đang đóng cửa làm xe.

Sự kết hợp giữa kính thông minh + mô hình video lớn Omni + Spark tiếp quản cấp hệ thống bản địa, không còn nghi ngờ gì, đã đe dọa đến iPhone.

Theo Báo cáo Dự báo Xu hướng Điện tử Tiêu dùng của Macquarie:Trong ba năm tới, tỷ lệ thời gian tương tác không màn hình dựa trên thị giác / giọng nói, dự kiến sẽ tăng từ mức 8% hiện tại lên 35%.

Nếu người dùng quen với việc sử dụng kính và giọng nói để hoàn thành công việc hàng ngày và giải trí, thời gian sử dụng màn hình chắc chắn sẽ bị nén đáng kể.

Nếu Apple không đưa ra được thiết bị đeo đủ ấn tượng để phản kích (Vision Pro quá nặng và đắt, nhất định chỉ là đồ chơi của số ít), quyền độc quyền cổng vào của họ trong thời đại Internet di động sẽ bị thách thức chưa từng có.

Đây không phải là lặp lại, là cách mạng.

Google dùng ba con dao công nghệ, lưu lượng và giá, gửi chiến thư cho tất cả đối thủ.

Lúc này, còn ai cười nó mắc bệnh doanh nghiệp lớn không?

Câu hỏi Liên quan

QGoogle đã công bố những cải tiến và sản phẩm chính nào tại Google I/O 2026?

ATại Google I/O 2026, Google đã công bố nhiều cải tiến và sản phẩm chính: Mô hình Gemini 3.5 Flash với hiệu suất vượt trội và giá thành cực thấp, mô hình video đa phương thức mới Gemini Omni Flash, trợ lý AI mới Spark được tích hợp sâu vào hệ thống Android 17, và kính thông minh AI mới với hiệu suất xử lý cục bộ cao. Đồng thời, họ cũng thông báo Gemini đã đạt 9 tỷ người dùng hoạt động hàng tháng (MAU) và giảm giá mạnh các dịch vụ AI.

QVì sao Gemini 3.5 Flash được mô tả là có hiệu suất nổi bật và chi phí thấp?

AGemini 3.5 Flash đạt hiệu suất nổi bật nhờ hai công nghệ cốt lõi: 1) Kỹ thuật 'Chưng cất kiến thức tối đa' (Extreme Knowledge Distillation) từ mô hình giáo viên 'Gemini 3.5 Ultra' mạnh hơn, giúp nó kế thừa khả năng lập luận logic. 2) Kiến trúc MoE (Mô hình hỗn hợp chuyên gia) mới với 256 chuyên gia vi mô, chỉ kích hoạt 4 chuyên gia hiệu quả nhất cho mỗi lần suy luận, giúp tiết kiệm tài nguyên. Chi phí thấp nhờ kiến trúc hiệu quả này và nền tảng điện toán đám mây dựa trên TPU tự phát triển của Google, cho phép họ giảm giá API xuống mức cạnh tranh chưa từng có (0,02 USD cho 1 triệu token đầu vào).

QTrợ lý AI Spark và kính thông minh mới của Google có vai trò gì trong chiến lược của họ?

ATrợ lý AI Spark và kính thông minh đóng vai trò then chốt trong chiến lược 'thống trị điểm truy cập' (entry point dominance) của Google. Spark được tích hợp sâu vào hệ điều hành Android 17, có thể tự động hóa các tác vụ phức tạp xuyên ứng dụng, thay thế việc người dùng phải mở nhiều app. Kính thông minh là thiết bị đưa AI vào 'góc nhìn thứ nhất' của người dùng, xử lý đa phương thức (hình ảnh, âm thanh) với độ trễ cực thấp. Cả hai cùng tạo ra một hệ sinh thái AI liền mạch, chuyển đổi từ tương tác chủ động trên màn hình sang sự phân phối dịch vụ chủ động bởi AI, định hình lại logic phân phối lưu lượng internet.

QViệc Google công bố Gemini có 9 tỷ MAU và giảm giá mạnh tạo ra thách thức gì cho các đối thủ?

AViệc Google công bố 9 tỷ MAU và giảm giá mạnh tạo ra thách thức lớn về mô hình kinh doanh và cạnh tranh cho các đối thủ, đặc biệt là các công ty chuyên cung cấp API mô hình lớn (LLM) như OpenAI, Anthropic. Google có lợi thế: 1) Lượng người dùng khổng lồ từ hệ sinh thái sẵn có (Android, Chrome, Workspace) với chi phí thu hút bằng 0, tạo vòng lặp dữ liệu tự củng cố. 2) Cơ sở hạ tầng điện toán đám mây dọc (TPU) giúp giảm chi phí vận hành. Điều này khiến các đối thủ thuần API khó cạnh tranh về giá và cần tìm nguồn điện toán rẻ hơn hoặc tự phát triển chip. Đồng thời, nó cũng thách thức Apple nếu không nhanh chóng ra mắt thiết bị đeo AI cạnh tranh.

QBài viết đánh giá như thế nào về tác động của các động thái này đối với ngành công nghiệp AI?

ABài viết đánh giá động thái của Google tại I/O 2026 là một 'cuộc cách mạng', đánh dấu sự chuyển dịch từ cuộc chiến thuần túy về thông số mô hình sang cuộc chiến 'không gian bốn chiều' bao gồm: thiết bị đầu cuối, điện toán đám mây, hệ sinh thái và phần cứng. Nó cho thấy các mô hình cơ bản đang nhanh chóng trở thành hàng hóa, và lợi thế thực sự nằm ở việc tích hợp AI vào các điểm tiếp xúc và luồng dữ liệu khổng lồ. Điều này thúc đẩy quá trình sàng lọc và tái cấu trúc ngành, nơi các nhà cung cấp thuần API sẽ gặp khó khăn, trong khi các nhà phát triển ứng dụng có thể hưởng lợi từ chi phí tính toán thấp hơn để tập trung đổi mới.

Nội dung Liên quan

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

Bản tóm tắt sự kiện Web3 đáng chú ý tháng 6: Thị trường tiền mã hóa tháng 6 tập trung vào các yếu tố chính: dữ liệu kinh tế vĩ mô của Mỹ (như CPI, phi nông nghiệp), quyết định lãi suất từ Cục Dự trữ Liên bang Mỹ (FOMC), Ngân hàng Trung ương Châu Âu và Ngân hàng Nhật Bản, tiếp tục ảnh hưởng đến kỳ vọng thanh khoản và tâm lý thị trường. Một số dự án như SUI, ENA sẽ có đợt mở khóa token, cần lưu ý rủi ro tiềm ẩn. Về tin tức sản phẩm, Coinbase dự kiến ra mắt hợp đồng tương lai chỉ số chứng khoán, trong khi CME Group lên kế hoạch cho hợp đồng tương lai chỉ số tiền mã hóa Nasdaq. Tình trạng thanh lý dự án vẫn tiếp diễn, với các dịch vụ như trình duyệt Bitcoin Ordinals (Ord.io) ngừng hoạt động, người dùng cần chú ý đến việc rút và di chuyển tài sản. Các sự kiện công nghệ và truyền thống đáng chú ý khác bao gồm World Cup, Hội nghị Nhà phát triển Toàn cầu của Apple (WWDC26), SpaceX lên sàn chứng khoán, và thượng hội IPO của công ty robot Unitree. Tóm lại, tháng 6 hứa hẹn tiếp tục là giai đoạn thị trường tìm kiếm phương hướng mới dưới tác động của kỳ vọng thanh khoản, biến động chính sách và sự luân chuyển trong hệ sinh thái.

marsbit50 phút trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

marsbit50 phút trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

Tuần cuối tháng 5, hai sự kiện AI liền kề đã phơi bày hai cách tiếp cận khác biệt của các gã khổng lồ công nghệ Trung Quốc. Alibaba tập trung vào tích hợp và thương mại hóa AI. Họ kết nối ứng dụng Qwen với Taobao, cho phép mua sắm và sử dụng các tính năng AI như thử đồ, so giá. Tổ chức được tái cấu trúc để tập trung vào AI, với động lực rõ ràng từ thị trường vốn. Doanh thu bên ngoài của Alibaba Cloud tăng 40%, cho thấy chiến lược "lắp AI vào quầy thu ngân" đang tạo ra dòng tiền. Tuy nhiên, cách tiếp cận thực dụng này có thể đi kèm rủi ro nếu có sự chênh lệch lớn về năng lực mô hình nền trong tương lai. Ngược lại, ByteDance theo đuổi giới hạn công nghệ thông qua bộ phận Seed. Họ đạt được thành tích đỉnh cao với mô hình tạo video Seedance 2.0 và đầu tư mạnh vào nghiên cứu cơ bản, thu hút nhân tài với các mục tiêu thuần túy học thuật. Ngân sách vốn (capex) của ByteDance được báo cáo là tăng vọt, lên tới 4700 tỷ NDT vào năm 2026, được tài trợ chủ yếu từ lợi nhuận. Lợi thế lớn của họ là không bị áp lực thị trường công khai, cho phép tập trung vào nghiên cứu dài hạn. Bài viết chỉ ra rằng sự khác biệt chiến lược này không chỉ là triết lý, mà chủ yếu bị chi phối bởi việc công ty có niêm yết hay không. Các công ty đại chúng như Alibaba chịu áp lực phải thể hiện kết quả tài chính ngắn hạn, dẫn đến chiến lược "bán AI". Các công ty chưa niêm yết như ByteDance có "sự xa xỉ" để "làm AI" và tập trung vào đột phá công nghệ. Tương lai của con đường nghiên cứu dài hạn tại ByteDance có thể được kiểm chứng nếu công ty này tiến hành IPO.

marsbit58 phút trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

marsbit58 phút trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit2 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit2 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit9 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit9 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua WAR

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua WAR (WAR) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua WAR (WAR) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ WAR (WAR) của BạnSau khi mua WAR (WAR), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch WAR (WAR)Giao dịch WAR (WAR) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 680Xuất bản vào 2024.12.11Cập nhật vào 2026.04.27

Làm thế nào để Mua WAR

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của WAR (WAR) được trình bày dưới đây.

活动图片