Google chính thức tuyên chiến

链捕手Xuất bản vào 2026-05-21Cập nhật gần nhất vào 2026-05-21

Tóm tắt

Google đã công bố hàng loạt đột phá tại I/O 2026, khẳng định vị thế thống lĩnh trong cuộc chiến AI. Trọng tâm là Gemini 3.5 Flash - mô hình nhẹ nhưng mạnh mẽ nhờ kỹ thuật "chưng cất tri thức" cực hạn và kiến trúc MoE với 256 chuyên gia, cho tốc độ phản hồi dưới 65ms. Google cũng giới thiệu Gemini Omni Flash (mô hình đa phương tiện nguyên bản), trợ lý AI Spark (được tích hợp sâu vào Android) và kính thông minh nhẹ 4g - tất cả nhằm đưa AI vào mọi điểm chạm. CEO Sundar Pichai tiết lộ Gemini đã đạt 9 tỷ người dùng hoạt động hàng tháng, nhờ tích hợp vào Chrome, Android và Workspace. Đặc biệt, Google gây sốc khi giảm giá mạnh: gói AI Ultra chỉ còn 99.9 USD/tháng, giá API của Gemini 3.5 Flash chỉ bằng 1/10 đối thủ. Chiến lược này dựa trên lợi thế hạ tầng máy chủ TPU nội bộ, biến AI thành hàng hóa cơ bản và gây áp lực lên các công ty thuần API như OpenAI. Động thái của Google đánh dấu sự chuyển dịch từ "cuộc đua mô hình thuần túy" sang "cuộc chiến không gian bốn chiều": thiết bị + đám mây + hệ sinh thái + phần cứng. Điều này không chỉ thách thức các đối thủ AI mà còn đe dọa vị thế nhập cảnh của Apple, khi tương tác không màn hình dự kiến sẽ chiếm 35% thời lượng sử dụng trong ba năm tới.

Hội nghị nhà phát triển Google I/O năm 2026, chỉ mang lại cảm giác về hai từ: Ngạo mạn.

Không chỉ nhồi nhét các tác nhân thông minh AI một cách liền mạch vào tất cả các cổng lưu lượng cốt lõi như tìm kiếm, trình duyệt, điện thoại, kính thông minh..., mà còn liên tục tung ra ba "vương bài":Gemini 3.5 Flash, mô hình videoOmni, và trợ lý AI hoàn toàn mớiSpark.

Sau khi phô diễn cơ bắp, "Pichai" thậm chí còn tuyên bố một cách khoe khoang rằng,Gemini đã vượt mốc 900 triệu người dùng hoạt động hàng tháng; và đồng thời công bố giảm giá mạnh.

Ý nghĩa còn rõ ràng hơn:Tôi mạnh hơn bạn, và còn rẻ hơn bạn.

Đây không phải là tuyên chiến thì là gì?

01

Điều gây ấn tượng nhất tại hội nghị, không còn nghi ngờ gì, là sự xuất hiện củaGemini 3.5 Flash.

Thông thường, "Pro" đại diện cho lực lượng nòng cốt, "Flash" đại diện cho nhẹ và nhanh.

Xét về số lượng tham số mô hình,3.5 Flash thực sự nhỏ hơn3.1 Pro, nhưng trên hầu hết các bài kiểm tra chuẩn suy luận và mã hóa, hiệu suất của mô hình trước lại vượt trội hơn:

Bài kiểm tra suy luận toán học phức tạp GSM8K,3.5 Flash đạt điểm số 95.8%, vượt qua 93.2% của3.1 Pro; Trong bài kiểm tra khả năng tạo mã SWE-bench phiên bản đầy đủ, tỷ lệ giải quyết của3.5 Flash đạt 38.4%, vượt xa 32.1% của3.1 Pro...

Tại sao?

Theo Báo cáo kỹ thuậtGemini 3.5 do DeepMind công bố, có hai công nghệ cốt lõi quan trọng nhất.

Chưng cất tri thức cực hạn: Lần này Google không chỉ đơn thuần dựa vào việc đẩy mạnh năng lực tính toán để huấn luyện Flash, mà đã sử dụng mô hình giáo viên chưa từng công bố trước đây là "Gemini 3.5 Ultra" để chưng cất giảm chiều Flash.

Theo phân tích từ tweet của nhà khoa học trưởng DeepMind, Jeff Dean, tỷ lệ tinh chỉnh của3.5 Flash trên bộ dữ liệu chuỗi logic chất lượng cao đã được nâng cao 400% so với thế hệ trước.

Điều này có nghĩa là nó kế thừa "bộ não logic" của mô hình siêu lớn, thay vì "kho kiến thức" học vẹt.

Kiến trúc MoE mới hoàn toàn (Mô hình hỗn hợp chuyên gia): Bên trong3.5 Flash, Google đã áp dụng mạng chuyên gia với độ mịn hạt tốt hơn.

Mô hình MoE truyền thống có thể chỉ có 8 hoặc 16 chuyên gia, mỗi lần chỉ kích hoạt 1-2 chuyên gia, đủ để hỗ trợ mô hình với quy mô tham số nghìn tỷ.

Còn theo phân tích từ bản ghi nhớ đầu tư cơ sở hạ tầng AI năm 2026 của a16z,3.5 Flash đã sử dụng 256 chuyên gia siêu nhỏ, mỗi lần suy luận có thể kích hoạt 4 chuyên gia hiệu quả nhất trong số đó.

Vì vậy, nó mới có thể bao phủ không gian đặc trưng đa phương thức cực kỳ rộng lớn trong khi vẫn duy trì lượng tham số kích hoạt cực thấp.

Trên chỉ số TTFT (Thời gian xuất token đầu tiên),3.5 Flash đã đạt dưới 65 mili giây.

Trong khi đó, một lần chớp mắt của con người cần 100-150 mili giây.

Nói một cách đơn giản, khi nó hoạt động như một tác nhân thông minh, từ góc độ sinh lý của con người, không thể phát hiện ra bất kỳ sự tạm dừng nào.

Đối với các nhà phát triển cần gọi công cụ thường xuyên, suy ngẫm nhiều vòng, độ trễ cực thấp, đây thực sự là nền tảng siêu đại lý hoàn hảo.

Chỉ dựa vào tối ưu hóa kỹ thuật cực kỳ tinh tế như vậy, mới có thể thiết lập sức mạnh thống trị về "triển khai phía thiết bị" trong môi trường cạnh tranh khốc liệt.

Thứ nhất, đa phương thức bản địaGemini Omni Flash.

Omni có nghĩa là toàn năng, đối đầu vớiGPT-4o ra mắt trước đó, chỉ cần nhìn tên thôi cũng có thể cảm nhận được mùi thuốc súng đậm đặc thế nào.

Ít nhất từ hiệu suất mà xem,Gemini Omni Flash xứng đáng sử dụng ký tự "o" này hơnGPT-4o nhiều.

Các mô hình video ban đầu nhưSora hayGemini 1.5, về cơ bản đều là "quái vật khâu vá", tức chuyển giọng nói thành văn bản, rồi văn bản chuyển thành hình ảnh.

Nhưng Omni được phát hành lần này, là sự căn chỉnh đa phương thức đầu-cuối bản địa thực sự. Nó không chỉ có thể hiểu bản địa tính nhất quán về thời gian và quy luật vật lý trong video, mà độ trễ cũng giảm từ mức trung bình ngành 400-600 mili giây xuống còn 120 mili giây.

Lấy một ví dụ từ hội nghị: Người dùng đeo camera đổ nước, cốc nước sắp đầy, Omni có thể nói "Dừng lại!" trước khi nước tràn ra 0.5 giây.

Loại suy luận thời gian thực về trạng thái vật lý của thế giới thực này, trông có vẻ đơn giản, nhưng ý nghĩa rất lớn:AI chính thức tiến hóa từ chatbot trong màn hình thành công cụ hỗ trợ thế giới thực.

Mặc dù chỉ là giai đoạn sơ khai.

Thứ hai, trợ lý thông minhSpark.

Theo tiết lộ từ cuộc phỏng vấn của The Verge với Phó chủ tịch kỹ thuật Android,Spark được trao quyền kiểm soát API cấp hệ thống bản địa ở lớp dưới của hệ thống Android 17.

Nói một cách đơn giản, những quy trình phức tạp trước đây bạn cần mở nhiều App mới có thể hoàn thành, bây giờ không cần động tay, chỉ cần ra lệnh cho Spark một tiếng, nó có thể giúp bạn xử lý tất cả, thậm chí có thể gửi thông tin, sắp xếp email, tổng hợp lịch trình, theo dõi động thái trang web, nhận diện phí trừ ẩn trên hóa đơn, xử lý hàng loạt tài liệu v.v... theo giọng điệu và sở thích của bạn...

Nói cách khác, sau này có trợ lý AI, chúng ta hầu như không cần dùng đến App nữa, bất kỳ thao tác phức tạp nào đều được đơn giản hóa thành duy nhất.

Thứ ba, kính thông minh.

Tại sao lại là kính?

Ít nhất theo quan điểm của Google, việc tích hợp liền mạch thị giác và thính giác, chính là vật chủ cuối cùng của mô hình lớn đa phương thức.

Chiếc kính này trông không có vẻ ngoài hào nhoáng nào, tập trung hoàn toàn vào khả năng thực tế:

Tròng kính dẫn sóng quang học Micro-OLED toàn màu chỉ nặng 4 gram, tỷ lệ truyền ánh sáng lên tới 85%;

Được trang bị chip cạnh Gemini nhẹ tự phát triển, độ trễ suy luận cục bộ ≤12ms, không cần kết nối mạng có thể hoàn thành dịch thời gian thực, nhận diện hình ảnh, phân tích cảnh quan;

Liên kết bản địa với tác nhân thông minh Spark, đồng bộ dữ liệu điện thoại, đám mây, thực hiện các dịch vụ cá nhân hóa như nhắc lịch, dịch thời gian thực, cảnh báo môi trường.

Tóm lại, chính là vượt qua màn hình điện thoại, nhồi nhét tác nhân thông minh vào góc nhìn thứ nhất của con người thông qua kính.

Nội dung quá nhiều, Google dường như đã xả hết tất cả các đòn mạnh một lúc, tuyên bố với thị trường một chân lý:

Thuật toán không có cổng vào, chẳng là gì cả.

Thời đại cuộn tham số mô hình lớn, cuộn điểm benchmark đã qua, các nhà cung cấp mô hình đơn thuần không còn hào rào bảo vệ, tương lai là cuộc chiến không gian bốn chiều "thiết bị + đám mây + hệ sinh thái + phần cứng".

Nhồi nhét AI vào bộ ứng dụng gia đình, thực chất là đang định hình lại logic phân phối lưu lượng toàn bộ Internet: từ "người dùng chủ động tìm kiếm / nhấp chuột", trở thành "tác nhân thông minh AI chủ động phân phối dịch vụ".

Đối với đông đảo nhà phát triển và doanh nghiệp vừa và nhỏ, điều này tốt hơn cả, vì năng lực tính toán cơ sở và mô hình trở nên cực kỳ rẻ, mọi người có thể tập trung làm sáng tạo ở lớp ứng dụng.

Nhưng các đối thủ cạnh tranh khác, lúc này có lẽ chỉ muốn chửi thề.

02

Khi Pichai trên sân khấu nhẹ nhàng tuyên bố "Người dùng hoạt động hàng tháng của Gemini chính thức vượt 900 triệu", đã tạo nên một cơn chấn động không nhỏ dưới khán đài.

900 triệu, nhiều hơn tổng MAU của tất cả đối thủ Mỹ cộng lại.

Làm thế nào để đạt được?

Câu trả lời đơn giản và thô bạo:Nhồi nhét cứng.

Google không cần phải chi phí quảng cáo để mua lượng người dùng như các công ty AI độc lập, chỉ cần thêm một biểu tượng bên cạnh thanh địa chỉ của trình duyệt Chrome, tích hợp một phím tắt gọi ở thanh điều hướng dưới cùng của 3 tỷ điện thoại Android, đẩy cập nhật toàn bộ trong Google Workspace...

Chi phí thu hút người dùng về cơ bản bằng 0.

Quan trọng hơn, trong khoảng thời gian tới, dữ liệu phản hồi thế giới thực đa phương thức, chất lượng cao với khối lượng khổng lồ được tạo ra từ 900 triệu người dùng hoạt động mỗi ngày khi họ nhìn sản phẩm bằng kính thông minh, sửa logic khi xử lý công việc bằng Spark và tương tác với mô hình hình ảnh Omni, tất cả sẽ trở thành dưỡng chất nuôi dưỡngGemini 4.

Đây là một hào rào cực kỳ kiên cố:Mô hình càng dễ dùng -> càng nhiều người dùng -> càng tạo ra nhiều dữ liệu -> mô hình càng trở nên dễ dùng hơn.

Để nhanh chóng củng cố vòng lặp này, Google trực tiếp tuyên bố với tất cả đối thủ phát động chiến tranh giá:Gói AI Ultra từ 249.99 USD / tháng giảm xuống còn 99.9 USD / tháng.

3.5 Flash có giá nhập đầu vào triệu token là 0.02 USD, giá xuất đầu ra triệu token là 0.08 USD.

Đây là mức giá thần thánh gì vậy?

So sánh một chút, giá trung bình của các mô hình cùng cấp trong ngành lần lượt là 0.15-0.2 USD và 0.6-1 USD.

Pichai tính toán: Khách hàng đầu ngành xử lý khoảng 1 nghìn tỷ token mỗi ngày. Chuyển 80% khối lượng công việc sangGemini 3.5 Flash trong một năm, có thể tiết kiệm hơn 10 tỷ USD.

Tại sao dám bán AI với giá rẻ như rau?

Chỗ dựa lớn nhất chính là:Cơ sở hạ tầng năng lực tính toán được tích hợp theo chiều dọc.

Các gã khổng lồ như OpenAI, Anthropic, trông có vẻ hào nhoáng, nhưng về bản chất vẫn là "khách thuê năng lực tính toán", cần phải mua năng lực tính toán từ Microsoft, Amazon, và những công ty sau lại phải trả tiền cho Nvidia.

Còn Google có TPU của riêng mình, cộng thêm hiệu suất kích hoạt thưa thớt cực kỳ biến thái của3.5 Flash, đã nén chi phí năng lực tính toán đến mức tối đa.

Hoàn toàn có thể sử dụng lợi thế tài sản nặng để giáng đòn giảm chiều xuống các công ty thuật toán đơn thuần.

Logic rất rõ ràng.

Mô hình lớn cơ sở đang nhanh chóng hàng hóa hóa. Giống như nước và điện vậy, bạn đã thấy công ty nước sạch nào có lợi nhuận khổng lồ chưa?

Google không sợ bản thân mô hình lớn không kiếm được tiền, vì có thể kiếm tiền lại thông qua quảng cáo tìm kiếm, dịch vụ đám mây và hoa hồng từ hệ sinh thái Android.

Nhưng đối với OpenAI, Anthropic, Cohere, Mistral, những công ty sống dựa vào việc bán API mô hình lớn thuần túy, điều này là không thể.

Các nhà đầu tư bây giờ có lẽ rất muốn ấn đầu Sam Altman để hỏi:"Giá API của Google chỉ bằng một phần mười của anh, hiệu suất còn tốt hơn anh, anh nói cho tôi biết, mô hình kinh doanh của anh sẽ chạy thông như thế nào?"

Cấu trúc cạnh tranh của nhiều ngành công nghiệp sẽ vì thế bước vào giai đoạn rửa bài gia tốc.

Các nhà cung cấp AI không cần nói nhiều, phải nhanh chóng tìm ra nguồn năng lực tính toán rẻ hơn, hoặc tự mình xuống sân làm chip.

Tiếp theo là Apple vẫn đang đóng cửa làm xe.

Sự kết hợp giữa kính thông minh + mô hình video lớn Omni + Spark tiếp quản cấp hệ thống bản địa, không còn nghi ngờ gì, đã đe dọa đến iPhone.

Theo Báo cáo Dự báo Xu hướng Điện tử Tiêu dùng của Macquarie:Trong ba năm tới, tỷ lệ thời gian tương tác không màn hình dựa trên thị giác / giọng nói, dự kiến sẽ tăng từ mức 8% hiện tại lên 35%.

Nếu người dùng quen với việc sử dụng kính và giọng nói để hoàn thành công việc hàng ngày và giải trí, thời gian sử dụng màn hình chắc chắn sẽ bị nén đáng kể.

Nếu Apple không đưa ra được thiết bị đeo đủ ấn tượng để phản kích (Vision Pro quá nặng và đắt, nhất định chỉ là đồ chơi của số ít), quyền độc quyền cổng vào của họ trong thời đại Internet di động sẽ bị thách thức chưa từng có.

Đây không phải là lặp lại, là cách mạng.

Google dùng ba con dao công nghệ, lưu lượng và giá, gửi chiến thư cho tất cả đối thủ.

Lúc này, còn ai cười nó mắc bệnh doanh nghiệp lớn không?

Câu hỏi Liên quan

QGoogle đã công bố những cải tiến và sản phẩm chính nào tại Google I/O 2026?

ATại Google I/O 2026, Google đã công bố nhiều cải tiến và sản phẩm chính: Mô hình Gemini 3.5 Flash với hiệu suất vượt trội và giá thành cực thấp, mô hình video đa phương thức mới Gemini Omni Flash, trợ lý AI mới Spark được tích hợp sâu vào hệ thống Android 17, và kính thông minh AI mới với hiệu suất xử lý cục bộ cao. Đồng thời, họ cũng thông báo Gemini đã đạt 9 tỷ người dùng hoạt động hàng tháng (MAU) và giảm giá mạnh các dịch vụ AI.

QVì sao Gemini 3.5 Flash được mô tả là có hiệu suất nổi bật và chi phí thấp?

AGemini 3.5 Flash đạt hiệu suất nổi bật nhờ hai công nghệ cốt lõi: 1) Kỹ thuật 'Chưng cất kiến thức tối đa' (Extreme Knowledge Distillation) từ mô hình giáo viên 'Gemini 3.5 Ultra' mạnh hơn, giúp nó kế thừa khả năng lập luận logic. 2) Kiến trúc MoE (Mô hình hỗn hợp chuyên gia) mới với 256 chuyên gia vi mô, chỉ kích hoạt 4 chuyên gia hiệu quả nhất cho mỗi lần suy luận, giúp tiết kiệm tài nguyên. Chi phí thấp nhờ kiến trúc hiệu quả này và nền tảng điện toán đám mây dựa trên TPU tự phát triển của Google, cho phép họ giảm giá API xuống mức cạnh tranh chưa từng có (0,02 USD cho 1 triệu token đầu vào).

QTrợ lý AI Spark và kính thông minh mới của Google có vai trò gì trong chiến lược của họ?

ATrợ lý AI Spark và kính thông minh đóng vai trò then chốt trong chiến lược 'thống trị điểm truy cập' (entry point dominance) của Google. Spark được tích hợp sâu vào hệ điều hành Android 17, có thể tự động hóa các tác vụ phức tạp xuyên ứng dụng, thay thế việc người dùng phải mở nhiều app. Kính thông minh là thiết bị đưa AI vào 'góc nhìn thứ nhất' của người dùng, xử lý đa phương thức (hình ảnh, âm thanh) với độ trễ cực thấp. Cả hai cùng tạo ra một hệ sinh thái AI liền mạch, chuyển đổi từ tương tác chủ động trên màn hình sang sự phân phối dịch vụ chủ động bởi AI, định hình lại logic phân phối lưu lượng internet.

QViệc Google công bố Gemini có 9 tỷ MAU và giảm giá mạnh tạo ra thách thức gì cho các đối thủ?

AViệc Google công bố 9 tỷ MAU và giảm giá mạnh tạo ra thách thức lớn về mô hình kinh doanh và cạnh tranh cho các đối thủ, đặc biệt là các công ty chuyên cung cấp API mô hình lớn (LLM) như OpenAI, Anthropic. Google có lợi thế: 1) Lượng người dùng khổng lồ từ hệ sinh thái sẵn có (Android, Chrome, Workspace) với chi phí thu hút bằng 0, tạo vòng lặp dữ liệu tự củng cố. 2) Cơ sở hạ tầng điện toán đám mây dọc (TPU) giúp giảm chi phí vận hành. Điều này khiến các đối thủ thuần API khó cạnh tranh về giá và cần tìm nguồn điện toán rẻ hơn hoặc tự phát triển chip. Đồng thời, nó cũng thách thức Apple nếu không nhanh chóng ra mắt thiết bị đeo AI cạnh tranh.

QBài viết đánh giá như thế nào về tác động của các động thái này đối với ngành công nghiệp AI?

ABài viết đánh giá động thái của Google tại I/O 2026 là một 'cuộc cách mạng', đánh dấu sự chuyển dịch từ cuộc chiến thuần túy về thông số mô hình sang cuộc chiến 'không gian bốn chiều' bao gồm: thiết bị đầu cuối, điện toán đám mây, hệ sinh thái và phần cứng. Nó cho thấy các mô hình cơ bản đang nhanh chóng trở thành hàng hóa, và lợi thế thực sự nằm ở việc tích hợp AI vào các điểm tiếp xúc và luồng dữ liệu khổng lồ. Điều này thúc đẩy quá trình sàng lọc và tái cấu trúc ngành, nơi các nhà cung cấp thuần API sẽ gặp khó khăn, trong khi các nhà phát triển ứng dụng có thể hưởng lợi từ chi phí tính toán thấp hơn để tập trung đổi mới.

Nội dung Liên quan

Jensen Huang: Vera Rubin Đã Được Sản Xuất Hàng Loạt, AI Agent Là Hướng Đi Trọng Tâm, Thách Thức Intel Và Nhắm Đến Cổng Vào AI PC Thế Hệ Tiếp Theo

Ngày 1/6, CEO NVIDIA Jensen Huang đã có bài phát biểu quan trọng tại GTC Đài Bắc 2026, công bố hàng loạt sản phẩm và định hướng mới. Kiến trúc Vera Rubin đã chính thức được sản xuất hàng loạt, với khách hàng đầu tiên là OpenAI, Anthropic và SpaceX. NVIDIA tập trung mạnh vào phát triển AI Agent, đồng thời giới thiệu CPU Vera dành riêng cho các tác nhân AI. Một điểm nhấn lớn là tham vọng của NVIDIA trong thị trường AI PC thế hệ tiếp theo. Họ sẽ hợp tác với MediaTek phát triển chip RTX SPARK cho máy tính Windows, do TSMC sản xuất, dự kiến ra mắt vào mùa thu năm nay. Động thái này được xem như một thách thức trực tiếp đối với Intel và hướng tới việc cung cấp nền tảng tính toán hoàn chỉnh cho toàn bộ hệ sinh thái Windows. NVIDIA cũng công bố mô hình AI mới Nemotron 3 Ultra và nền tảng DSX - một "hướng dẫn hành động" hoàn chỉnh để xây dựng các nhà máy AI. Trong lĩnh vực ô tô tự hành, nền tảng DRIVE Hyperion đã được nhiều hãng xe Trung Quốc như BYD, Geely, Zeekr, Xiaomi và Pony.ai áp dụng. NVIDIA còn giới thiệu mô hình suy luận mở Alpamayo 2 cho taxi tự lái. Về robot hình người, NVIDIA hợp tác toàn cầu, bao gồm công ty Trung Quốc Unitree, và giới thiệu nền tảng tham chiếu Isaac GR00T cùng bộ công cụ phát triển mã nguồn mở, nhằm xây dựng hệ sinh thái cho kỷ nguyên robot.

marsbit10 phút trước

Jensen Huang: Vera Rubin Đã Được Sản Xuất Hàng Loạt, AI Agent Là Hướng Đi Trọng Tâm, Thách Thức Intel Và Nhắm Đến Cổng Vào AI PC Thế Hệ Tiếp Theo

marsbit10 phút trước

Cuộc Phỏng Vấn Với Bậc Thầy Vĩ Mô Raoul Pal: Điểm Kỳ Dị Kinh Tế Đang Đến Gần, Đừng Dễ Dàng Xuống Xe Trong 4 Năm Tới

Nhà đầu tư vĩ mô Raoul Pal chia sẻ quan điểm về tương lai kinh tế và cơ hội đầu tư trong bối cảnh AI phát triển bùng nổ. Ông nhận định cuộc đua AI giữa các quốc gia và doanh nghiệp là sự kiện vốn hóa lớn nhất lịch sử, dẫn dắt dòng tiền và có thể tiến tới "điểm kỳ dị kinh tế" - khi tốc độ công nghệ vượt quá khả năng vận hành của hệ thống kinh tế truyền thống. Về tiền mã hóa, Pal cho rằng đây vẫn là kênh đầu tư có tỷ suất sinh lời rủi ro tốt nhất về dài hạn. Ông nhấn mạnh tiềm năng vô hạn khi AI Agents (tác nhân AI) gia nhập và sử dụng mạng lưới blockchain, biến các Layer1 như ETH, Solana, Sui thành nền tảng hạ tầng then chốt. Ông xem đây là "cổ phần cơ bản" cho mọi người trong nền kinh tế số tương lai. Pal khuyên nhà đầu tư nên kiên nhẫn nắm giữ dài hạn thay vì cố gắng giao dịch thời điểm, vì lịch sử cho thấy chiến lược "mua và giữ" thường mang lại kết quả vượt trội. Ông lạc quan về triển vọng 2026-2027 với sự gia tăng thanh khoản toàn cầu, sự tham gia của ngân hàng, tiến bộ về mặt pháp lý và vị thế định giá hấp dẫn hiện tại của tài sản mã hóa so với các thị trường truyền thống.

链捕手11 phút trước

Cuộc Phỏng Vấn Với Bậc Thầy Vĩ Mô Raoul Pal: Điểm Kỳ Dị Kinh Tế Đang Đến Gần, Đừng Dễ Dàng Xuống Xe Trong 4 Năm Tới

链捕手11 phút trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

Trong những năm gần đây, Mô hình Chuyên gia Hỗn hợp (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên điện thoại, Kiến trúc Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc. Meta đã đề xuất MobileMoE, lần đầu tiên triển khai suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trên 14 bài kiểm tra cơ bản, MobileMoE-S/M đạt độ chính xác trung bình tương đương hoặc cao hơn với chỉ 1/2 đến 1/4 lượng tính toán suy luận so với mô hình dày đặc cơ sở, trong khi sử dụng bộ nhớ tương tự. Trong thử nghiệm thực tế, MobileMoE-S trên iPhone 16 Pro (backend GPU/MLX) tăng tốc độ đáng kể, tăng tốc lên đến 3.8 lần trong giai đoạn đầu vào. MobileMoE là một loại mô hình ngôn ngữ MoE được thiết kế cho triển khai trên thiết bị đầu cuối, thay thế các lớp feed-forward dày đặc bằng các lớp MoE trong kiến trúc Transformer decoder-only. Quy trình đào tạo bao gồm bốn giai đoạn: tiền đào tạo, đào tạo trung gian, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa. Các thí nghiệm cho thấy cấu hình tối ưu sử dụng 8 chuyên gia (E=8), độ hạt chuyên gia 8 (g=8), với một chuyên gia được chia sẻ. MobileMoE thiết lập một biên giới Pareto mới cho LLM trên thiết bị đầu cuối, cân bằng tốt hơn giữa độ chính xác và chi phí suy luận. Sau khi lượng tử hóa INT4, mô hình vẫn duy trì tính cạnh tranh. Khi triển khai trên Samsung Galaxy S25 và iPhone 16 Pro, MobileMoE-S cho thấy tốc độ nhanh hơn đáng kể và mức sử dụng bộ nhớ thấp hơn so với các mô hình so sánh. Hướng phát triển trong tương lai bao gồm củng cố quá trình hậu đào tạo, mở rộng đa phương thức và tối ưu hóa việc triển khai trên NPU di động để tiếp tục cải thiện hiệu quả.

marsbit14 phút trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

marsbit14 phút trước

Đà Hồi Phục Yếu Ớt Của Bitcoin Khó Che Giấu Xu Hướng Điều Chỉnh, Tín Hiệu Đỉnh HYPE Cảnh Báo Rủi Ro Ngắn Hạn | Phân Tích Đặc Biệt

**Bitcoin Phục hồi yếu khó che giấu xu hướng điều chỉnh, tín hiệu đỉnh HYPE cảnh báo rủi ro ngắn hạn** **Phân tích cấu trúc Bitcoin (BTC):** - **Khung ngày:** BTC đã phá vỡ đường trung bình của kênh tăng (vàng) hình thành từ tháng 2/2026, cho thấy cấu trúc kỹ thuật suy yếu. Giá hiện trong kênh giảm ngắn hạn (xanh) và đang trong đợt phục hồi yếu hướng lên vùng kháng cự trên của kênh này (75.000-76.000 USD). - **Dự báo:** Đợt phục hồi này có thể chỉ là điều chỉnh kỹ thuật. Nếu không vượt qua được vùng 75.000-76.000 USD, giá có khả năng tiếp tục xu hướng giảm, thử thách vùng hỗ trợ mạnh 69.500-70.500 USD và thậm chí là đường xu hướng dưới của kênh tăng dài hạn. - **Chiến lược:** Ưu tiên chiến lược bán ra ở vùng kháng cự (Kế hoạch A) hoặc theo đà bán nếu giá phá vỡ hỗ trợ (Kế hoạch B), với khối lượng giao dịch dưới 30% và quản lý rủi ro chặt chẽ. **Phân tích cấu trúc HYPE:** - **Khung 4 giờ:** HYPE đã hoàn thành mô hình tăng 7 sóng từ đáy tháng 5. Điểm cuối cùng (47) cho thấy dấu hiệu phân kỳ động lượng tiềm ẩn và tín hiệu cảnh báo đỉnh mạnh từ mô hình giao dịch. - **Dự báo:** Nếu tín hiệu đỉnh tại điểm 47 được xác nhận cùng với phân kỳ, đây có thể là đỉnh ngắn hạn. Cần theo dõi phản ứng giá tại vùng hỗ trợ then chốt 62.5 - 64.75 USD. - **Chiến lược:** Chỉ xem xét mua vào nhẹ nếu giá hồi về vùng hỗ trợ 62.5-64.75 USD và có tín hiệu ổn định kết hợp. Nếu vùng này bị phá vỡ, điều chỉnh có thể mở rộng xuống 54-56.3 USD. **Lưu ý chung:** Thị trường biến động, cần điều chỉnh chiến lược linh hoạt. Mọi phân tích chỉ mang tính tham khảo, không phải lời khuyên đầu tư. Luôn sử dụng lệnh dừng lỗ và quản lý vốn nghiêm ngặt.

marsbit29 phút trước

Đà Hồi Phục Yếu Ớt Của Bitcoin Khó Che Giấu Xu Hướng Điều Chỉnh, Tín Hiệu Đỉnh HYPE Cảnh Báo Rủi Ro Ngắn Hạn | Phân Tích Đặc Biệt

marsbit29 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua WAR

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua WAR (WAR) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua WAR (WAR) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ WAR (WAR) của BạnSau khi mua WAR (WAR), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch WAR (WAR)Giao dịch WAR (WAR) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 683Xuất bản vào 2024.12.11Cập nhật vào 2026.04.27

Làm thế nào để Mua WAR

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của WAR (WAR) được trình bày dưới đây.

活动图片