Văn | Vân Dũng AI, Tác giả | Hoàng Vân Hạo
Một. Sau Google I/O 2026: Bốn hệ điều hành thiết bị chính bước vào kỷ nguyên Agent
Ngày 12 tháng 5 năm 2026, Google đã tổ chức hội nghị Android Show|I/O Edition, là sự kiện riêng về Android trước đại hội I/O vào ngày 19 tháng 5. Tổng giám đốc hệ sinh thái Android, Sameer Samat, đã định hướng cho hội nghị này: Android cần chuyển từ hệ điều hành thành một hệ thống thông minh. Để tiếp nối chủ đề này, đó là Gemini Intelligence - một bộ khả năng AI chủ động ở tầng hệ thống Android.
Áp phích hội nghị Android Show|I/O Edition 2026
Nguồn: Android Heaadlines
So với sự kết hợp Gemini Nano+AICore năm ngoái, lần này Google đã nhúng sâu hơn khả năng vượt qua ứng dụng và ngữ cảnh của Agent vào tầng hệ điều hành: tự động hóa tác vụ xuyên ứng dụng (đặt đồ ăn, mua sắm, đặt hàng), điền tự động biểu mẫu, tóm tắt trang web, widget tùy chỉnh, lần lượt được ghi vào danh sách khả năng cấp hệ thống. Google đồng thời đặt ra ba nguyên tắc sản phẩm: kiểm soát tường minh của người dùng (explicit user control), bảo vệ dữ liệu toàn diện (comprehensive data protection), minh bạch vận hành (operational transparency).
Một tuần sau, trong bài phát biểu chính của sự kiện I/O ngày 19 tháng 5, CEO Google Sundar Pichai đã khởi động theo chủ đề này:
Welcome to the agentic Gemini era (Chào mừng đến kỷ nguyên Gemini được Agent hóa)
Nhảy vào làn sóng Agent hóa hệ điều hành thiết bị, Google không phải là người xuất phát sớm.
Microsoft tại Build 2024 vào tháng 5/2024 đã ra mắt Copilot+PC (loại máy Windows 11 thế hệ mới trang bị NPU 40+ TOPS), dựa trên mô hình nhỏ trên thiết bị Phi Silica, khả năng Agent màn hình Click to Do và khả năng ghi nhớ hoạt động cấp hệ thống Recall để nhúng khả năng Agent vào hệ điều hành.
Tại WWDC24 tháng 6/2024, Apple đã chính thức công bố "Apple Intelligence", Apple khi đó định vị nó là "personal intelligence system" (hệ thống thông minh cá nhân), sau đó đã lần lượt ra mắt một số tính năng hỗ trợ AI, chỉ là do mô hình lớn tự phát triển gặp khó khăn, các vấn đề của Siri "yếu kém" nên khả năng Agent cốt lõi của Apple Intelligence vẫn chưa thể ra mắt.
Huawei tại HDC 2025 tháng 6/2025 đã phát hành HarmonyOS 6 và khung trình Agent thông minh Hongmeng (HMAF), sau đó Quảng trường Trí tuệ nhân tạo Tiểu Nghệ đã ra mắt hơn 80 Agent thông minh.
Xu hướng lớn về Agent hóa hệ điều hành thiết bị đã đồng thời xuất hiện trên các hệ điều hành chủ lưu như Android, iOS, HarmonyOS, Windows.
Hội nghị chỉ triển lãm tính năng, điều các hãng hệ điều hành thực sự phải cạnh tranh là ba tầng năng lực nền tảng hỗ trợ OS Agent vận hành tin cậy, giải quyết vấn đề thực tế: AI Runtime cấp hệ thống, chip có thể kiểm soát, ma trận mô hình thiết bị-đám mây.
Hai. Dưới lớp vỏ hội nghị: Ba tầng nền tảng chống đỡ OS Agent
AI Runtime cấp hệ thống: Trung tâm điều phối trí tuệ thiết bị
Runtime là động cơ suy luận và dịch vụ hệ thống mà mô hình trên thiết bị chạy trong hệ điều hành. Xuống dưới, nó trực tiếp kết nối với NPU và điều phối tài nguyên hệ thống; lên trên, nó thông qua API ổn định để phơi bày khả năng suy luận cho tất cả ứng dụng. Nó biến mô hình trên thiết bị thành "trí tuệ chia sẻ ở tầng hệ điều hành": chia sẻ trọng số mô hình xuyên ứng dụng, điều phối thống nhất sức mạnh tính toán và bộ nhớ, hỗ trợ gọi công cụ, hướng dẫn sinh, ngữ cảnh và kết nối quyền mà Agent cần. Nó quyết định OS Agent rốt cuộc chỉ là một nút chat trong ứng dụng, hay là dịch vụ thường trú có thể thực thi thao tác cấp hệ thống trên hệ điều hành.
Mẫu hoàn chỉnh nhất trong hệ thống Android là Google AICore. Tháng 12/2023, AICore đã lên sóng với tư cách là dịch vụ hệ thống (system service) của Android 14; tháng 8/2025, Gemini Nano thông qua ML Kit GenAI APIs đã mở cửa cho nhà phát triển. Từ nền tảng dịch vụ hệ thống đến API ổn định hướng đến ứng dụng, AICore đã mất gần hai năm, liên tục mài giũa.
Các hãng hệ điều hành khác đi trên cùng một con đường, chỉ khác nhịp độ. Apple tại WWDC25 đã mở khung Foundation Models cho nhà phát triển, khung này tự có decorator @Generable, gọi công cụ, hướng dẫn sinh (guided generation) và phiên có trạng thái (stateful session), phía sau kết nối với mô hình cơ sở trên thiết bị khoảng 3B tham số, cộng với tính toán đám mây riêng tư để cung cấp hỗ trợ đám mây. Microsoft đã đưa khung AI trên thiết bị Foundry on Windows và Phi Silica vào Windows 11, lấy Windows ML làm backend suy luận cơ sở. Huawei tại HDC 2025 phát hành Agent Framework Kit (Khung trình Agent thông minh Hongmeng, HMAF), đồng thời mở cả hệ thống ý định và giao thức hợp tác Agent.
Android AICore với tư cách dịch vụ hệ thống, điều phối Gemini Nano suy luận trên bộ tăng tốc phần cứng
Nguồn: Android Developers
Chip có thể kiểm soát: Điểm tựa phối hợp phần mềm-phần cứng
Google tại Android Show|I/O Edition đã đặt ra ngưỡng phần cứng rõ ràng cho Gemini Intelligence: toàn bộ tính năng ra mắt đầu tiên chỉ hướng đến một số flagship mới nhất như dòng Pixel 10 và Galaxy S26 series, các mẫu năm ngoái đều không nằm trong danh sách. Điều này chỉ ra một sự thật đơn giản: Mô hình AI vẫn đang phát triển nhanh, phần mềm liên tục đưa ra yêu cầu mới cho phần cứng. Chip có thể kiểm soát là nền tảng tiếp nhận những yêu cầu này, mức độ có thể kiểm soát quyết định không gian mà các hãng hệ điều hành có để thích ứng phần mềm-phần cứng cho OS Agent trên thiết bị.
Apple là hình mẫu của lộ trình phần mềm-phần cứng tích hợp. iOS và macOS từ đầu đã cùng phát triển theo thế hệ với chip series A, series M, Core ML thì đóng gói thống nhất việc điều phối CPU, GPU, ANE vào tầng khung. Lộ trình này tiếp tục kéo dài trong thời đại LLM. Apple Machine Learning Research đã đưa ra một nhóm thử nghiệm thực tế: Theo đường tối ưu của Core ML, triển khai Llama 3.1 8B Instruct lên M1 Max, tốc độ giải mã cục bộ có thể đạt khoảng 33 tokens/s. Báo cáo kỹ thuật "Apple Intelligence Foundation Language Models" cũng tiết lộ, Apple đã tối ưu hóa cấp kiến trúc như chia sẻ KV cache và huấn luyện nhận thức lượng tử 2-bit cho chip của riêng mình, mới có thể thành công mở mô hình cơ sở trên thiết bị khoảng 3B cho nhà phát triển thông qua khung Foundation Models. Chiều sâu như vậy, chỉ khi nắm giữ chip trong tay mới làm được - đây chính là giá trị của chip có thể kiểm soát đối với các hãng hệ điều hành: Nó quyết định độ sâu phối hợp phần mềm-phần cứng, cũng nâng cao giới hạn trải nghiệm của OS Agent trên thiết bị.
Bước vào thời đại AI, Google cũng đang làm điều tương tự - từ Pixel 6 đã đi theo lộ trình tự nghiên cứu SoC Tensor, Tensor G5 mới nhất nâng cao hiệu suất TPU tối đa 60%, CPU trung bình tăng 34%, là SoC đầu tiên chạy hoàn chỉnh thế hệ mới nhất Gemini Nano và đã xuất hiện trên Pixel 10. Tất nhiên, Tensor G5 cũng có điểm yếu: Thử nghiệm thực tế của Android Central cho thấy cấu hình bộ nhớ (dung lượng RAM) của nó vẫn là nút thắt hiệu suất AI; điểm benchmark Geekbench AI thua Snapdragon 8 Elite; trong thử nghiệm thực tế Geekbench 6 của Macworld, điểm đơn nhân và đa nhân của G5 đều thấp hơn A18 Pro. Google vẫn đang đuổi theo, nhưng lộ trình phối hợp tự nghiên cứu Tensor cộng với Gemini trên thiết bị đã định hình.
Kirin của Huawei kết hợp NPU Da Vinci và mô hình Pangu trên thiết bị, là một lộ trình chip có thể kiểm soát khác song song với Apple và Google. Xiaomi đã triển khai Xuanjie O1, là tân binh bước vào hướng chip có thể kiểm soát.
Ma trận mô hình thiết bị-đám mây: Nguồn trí tuệ của Agent
Ma trận mô hình thiết bị-đám mây là nguồn "trí tuệ" của thiết bị đầu cuối: mô hình đám mây nâng cao trần năng lực cho nhiệm vụ phức tạp, mô hình trên thiết bị đỡ lấy giới hạn dưới của vận hành hàng ngày - độ trễ, thời lượng pin, quyền riêng tư, tính ổn định đều đè lên đầu phía thiết bị. Hai đầu không thể thiếu, khác biệt nằm ở độ liên kết sâu với hệ điều hành. Mô hình trên thiết bị cần được nhúng vào hệ điều hành của mỗi thiết bị đầu cuối, liên kết sâu với NPU của máy, trong hệ điều hành đảm nhận danh tính kép: Xuống dưới, nó là backend suy luận cục bộ của Runtime; lên trên, nó thông qua khung và SDK của Runtime trở thành API cấp hệ thống mở cho ứng dụng.
Tự nghiên cứu có ý nghĩa cả ở đám mây và thiết bị, chỉ là sự đền đáp ở thiết bị rõ ràng hơn. Mô hình đám mây mua ngoài cũng có thể nâng cao trần năng lực, lợi thế tự nghiên cứu chủ yếu thể hiện ở quyền kiểm soát định tuyến, điều khoản thương mại, nhịp độ lặp mô hình. Thiết bị thì khác. Mô hình trên thiết bị nhúng vào hệ điều hành và NPU của từng thiết bị, sự đền đáp của tự nghiên cứu trực tiếp thể hiện trên hiệu suất sản phẩm: chia sẻ KV cache, huấn luyện nhận thức lượng tử 2-bit thiết kế riêng cho một thế hệ chip nhất định, Per-Layer Embedding (bắt nguồn từ Gemma 3n, tải tăng dần tham số embedding từ bộ lưu trữ nhanh theo lớp), v.v., những cái này đều phải là mô hình và phần cứng thiết kế đồng bộ mới dễ thực hiện; đồng thời, nhịp độ phối hợp cũng không thể bị hãng phần cứng bên thứ ba chi phối nữa.
Sức mạnh tính toán TPU của Tensor G5 tăng cao nhất 60% so với thế hệ trước G4, nhưng hiệu suất của Gemini Nano trên G5 vượt xa hơn thế - theo tổng hợp chính thức của Google và Jon Peddie Research, tốc độ xử lý cục bộ đạt 2.6 lần thế hệ trước, tiêu hao năng lượng giảm xuống một nửa so với ban đầu, cửa sổ token mở rộng từ 12,000 lên 32,000 (tương đương tiêu hóa một lần khoảng trăm ảnh chụp màn hình). Những biểu hiện hiệu suất vượt trội rõ ràng này, bắt nguồn từ kiến trúc suy luận đàn hồi Matryoshka Transformer mà Gemini Nano v3 áp dụng, kết hợp với tối ưu hóa phối hợp với TPU của Tensor G5.
Sự nhảy vọt hiệu suất của Gemini Nano trên Tensor G5 so với thế hệ trước
Nguồn: Google/Jon Peddie Research, Vân Dũng AI vẽ
Ở tầng mô hình trên thiết bị này, các hãng hệ điều hành chủ lưu nắm trong tay đều là lá bài của riêng mình: Gemini Nano của Google, mô hình cơ sở trên thiết bị khoảng 3B tham số của Apple, Phi Silica của Microsoft, mô hình Pangu trên thiết bị của Huawei. Tự nghiên cứu, là lựa chọn mặc định của tầng này.
Ba. Giữa ba tầng: Phối hợp càng sâu, không gian khác biệt càng lớn
Ba tầng năng lực nền tảng liên kết từ dưới lên trên: chip có thể kiểm soát → mô hình trên thiết bị/đám mây → Runtime → Agent. Chip có thể kiểm soát quyết định hiệu suất suy luận và tiêu hao năng lượng mà mô hình trên thiết bị có thể đạt được, mô hình trên thiết bị quyết định trí tuệ cục bộ mà Runtime có thể điều phối, Runtime quyết định độ tin cậy của Agent với tư cách dịch vụ hệ thống thực thi xuyên ứng dụng. Ba bên phối hợp càng sâu, trải nghiệm sản phẩm của hãng hệ điều hành trên Agent thiết bị càng khác biệt lớn, hào bảo vệ cũng càng dày.
Ba tầng càng ăn khớp sâu trong cùng một bộ phần mềm-phần cứng, khả năng sản phẩm của OS Agent càng xuất hiện những khác biệt mà một tầng đơn lẻ không làm được.
- Độ trễ phản hồi và tiêu hao năng lượng. Tốc độ xử lý gấp 2.6 lần và tiêu hao năng lượng giảm một nửa mà Gemini Nano đạt được trên Tensor G5, dựa vào việc kiến trúc mô hình, thiết kế chip, điều phối Runtime ba tầng trong thiết kế phần mềm-phần cứng cùng thế hệ thích ứng lẫn nhau, sự cải thiện cấp độ này mới xuất hiện.
- Quyền riêng tư và tin cậy. Nhiệm vụ thường dùng liên quan dữ liệu riêng tư do mô hình trên thiết bị hoàn thành tại chỗ, yêu cầu phức tạp mới giao cho đám mây - đây là tư thế mặc định hợp lý của OS Agent đối với dữ liệu người dùng ở giai đoạn hiện tại. Liên kết ba tầng quyết định "ưu tiên thiết bị, đám mây hỗ trợ" này có thể thực sự triển khai hay không: NPU và mô hình trên thiết bị thích ứng sâu, là con đường then chốt để mô hình trên thiết bị vẫn đang trong giai đoạn phát triển đảm nhận suy luận tần suất cao hàng ngày; mô hình nén lượng tử và chia sẻ KV cache cho NPU; Runtime định tuyến giữa thiết bị và đám mây theo độ phức tạp nhiệm vụ. Bất kỳ tầng nào trong ba tầng không đạt, "ưu tiên thiết bị" chỉ có thể là lời nói tiếp thị.
- Ngữ cảnh cấp hệ thống. Các hãng hệ điều hành tổ chức lại dữ liệu người dùng xuyên ứng dụng và tầng hệ điều hành (chỉ mục ngữ nghĩa, cảm nhận màn hình, trí nhớ dài hạn) thành ngữ cảnh cá nhân cấp hệ thống cung cấp cho Agent, là tiền đề để Agent thực sự "hiểu người dùng", cũng là đặc trưng cốt lõi của OS Agent khác với Agent cấp ứng dụng đơn lẻ. Triển khai phụ thuộc vào ba tầng ăn khớp: Runtime nắm giữ chỉ mục xuyên ứng dụng và quyền hạn, mô hình trên thiết bị thường trú chịu trách nhiệm hiểu suy luận, NPU cung cấp sức mạnh tính toán hiệu quả cục bộ. Core Spotlight của Apple thiết lập chỉ mục ngữ nghĩa trên thiết bị đầu cuối, ứng dụng thông qua App Intents đưa hành động và dữ liệu vào hệ thống, Agent sẽ thông qua Personal Context để lấy ngữ cảnh (Apple đã thông báo khả năng này sẽ ra mắt cùng bản cập nhật phần mềm trong tương lai); AppFunctions phía Android đi trên cùng một con đường.
- Độ tin cậy với tư cách dịch vụ hệ thống. OS Agent muốn được gọi với tư cách dịch vụ cấp hệ thống, thì phải giữ được khả dụng trong các tình huống thực tế như không kết nối mạng, pin yếu, giảm nhiệt độ hoạt động. Mô hình trên thiết bị thường trú thiết bị, khiến Agent rời mạng vẫn có thể làm việc; NPU tối ưu hóa cao phần mềm-phần cứng đảm nhận suy luận tiêu hao năng lượng thấp; Runtime khi tài nguyên thiết bị căng thẳng sẽ điều phối lùi theo tính khả dụng (chuyển sang mô hình nhẹ hơn, hoặc định tuyến yêu cầu lên đám mây). Bất kỳ tầng nào trong ba tầng thiếu, OS Agent sẽ không thể chống đỡ được hình thái dịch vụ hệ thống, chỉ có thể lùi về nút chat cấp ứng dụng.
Apple Intelligence thể hiện mô hình phối hợp hoàn chỉnh: Apple Silicon, mô hình cơ sở trên thiết bị khoảng 3B, khung Foundation Models từ dưới lên trên ăn khớp, xử lý trên thiết bị các tình huống thường dùng, yêu cầu phức tạp chuyển vào tính toán đám mây riêng tư. Google là một hình thái khác. Tensor G5 với tư cách SoC đầu tiên chạy hoàn chỉnh thế hệ mới nhất Gemini Nano đã xuất hiện trên Pixel 10, do AICore điều phối thống nhất, khiến các chức năng Agent cấp hệ thống như Magic Cue, Pixel Screenshots có thể mặc định mở mà không phụ thuộc đám mây. Huawei là hình mẫu trong nước xây dựng phối hợp ba tầng: Kirin, NPU Da Vinci, Pangu trên thiết bị, HMAF bốn món đều tự có, từ dưới lên trên liên kết thành ba tầng nền tảng hoàn chỉnh.
Cơ chế ăn khớp của ba tầng nền tảng OS Agent thiết bị
Nguồn: Vân Dũng AI
Bốn. Trên nền tảng: Các biến số then chốt khác của hào bảo vệ dài hạn
Phối hợp ba tầng xây dựng nên cốt lõi của hào bảo vệ. Trên nền tảng còn có nhiều biến số ảnh hưởng đến sức cạnh tranh sản phẩm trong thời đại OS Agent, bao gồm khả năng tương tác của Agent với ứng dụng, bảo vệ quyền riêng tư, v.v.
Tương tác giữa OS Agent và ứng dụng, nằm ở tiền tuyến đấu tranh giữa hãng hệ điều hành và hãng ứng dụng. Hiện tại có hai con đường song song. Một là nhận diện màn hình và tự động hóa, bao gồm chia sẻ màn hình Gemini Live, Apple Visual Intelligence, Circle to Search, v.v. OS Agent dựa vào đọc màn hình, nhấn nút để can thiệp ứng dụng, nhiệm vụ đơn lần khả thi, nhưng mỗi lần gọi đều thiếu thông tin cấu trúc, động tác nhiều bước khó xây dựng ổn định luồng công việc. Con đường khác là tích hợp sâu API, bao gồm Google AppFunctions, Apple App Intents, Huawei Intents Kit, v.v. Ứng dụng phơi bày hành động cốt lõi qua giao diện có cấu trúc cho hệ thống, Agent gọi ổn định, cũng có thể xây dựng luồng công việc nhiều bước. Con đường API có thể trải rộng hay không, then chốt không nằm ở hãng hệ điều hành, mà ở hãng ứng dụng. Đưa chức năng cốt lõi cho Agent gọi, có nghĩa người dùng có thể không trực tiếp mở ứng dụng nữa, phơi bày thương hiệu, vị trí quảng cáo, dữ liệu hành vi, cổng thanh toán đều có nguy cơ bị hệ điều hành cắt lấy. Đây sẽ là điểm tranh giành cốt lõi quyền phân phối lưu lượng thiết bị đầu cuối phía người dùng.
Bảo vệ quyền riêng tư, là giá trị then chốt và giới hạn dưới của hệ thống thiết bị. Các hãng hệ điều hành nắm giữ quyền hạn cấp hệ thống sâu nhất và dữ liệu người dùng nhạy cảm nhất ở phía thiết bị, quyền riêng tư vừa là lập trường bản chức, cũng là điều kiện tiên quyết để hai việc trước tiến triển dài hạn. Apple thông qua chip bảo mật độc lập Secure Enclave trên thiết bị và cùng một thiết kế bảo mật cấp phần cứng được chia sẻ bởi các nút PCC đám mây riêng tư, xây dựng hệ thống bảo vệ quyền riêng tư dựa trên thiết bị đầu cuối, chiến lược sản phẩm này khiến "Privacy. That’s Apple." trở thành nhãn hiệu cốt lõi của Apple trên thị trường cao cấp toàn cầu, từ đó giành được sự tin tưởng của người dùng.
Nhãn hiệu "Privacy. That’s Apple." của Apple
Nguồn: Trang chủ Apple
Phối hợp ba tầng dựng lên cốt lõi của hào bảo vệ, những biến số dài hạn trên nền tảng này thì ảnh hưởng đến việc nó có thể gia cố sâu đến mức nào.
Năm. Không chỉ là làm lại hệ điều hành
Xu hướng Agent hóa hệ điều hành thiết bị, ba tầng nền tảng AI Runtime cấp hệ thống, chip có thể kiểm soát, ma trận mô hình thiết bị-đám mây càng vững chắc, giới hạn dưới sản phẩm của hãng hệ điều hành trong trận chiến này càng cao, không gian khác biệt cũng càng lớn. Nắm bắt được xu hướng này, hãng hệ điều hành mới có cơ hội thúc đẩy việc thiết lập lại quyền phân phối lưu lượng cửa vào thiết bị, giành vị trí cạnh tranh mạnh hơn.
Xu hướng này không chỉ giới hạn ở điện thoại và PC. Năng lực cơ sở của OS Agent tràn ra nhiều thiết bị đầu cuối hơn dọc theo hệ sinh thái đa thiết bị mà các hãng đã xây dựng, đặc biệt thịnh hành ở IoT. Chip có thể kiểm soát chìm xuống các kịch bản như SoC ô tô, Huawei đã bố trí chip Kirin tiêu chuẩn ô tô, hệ điều hành Xiaomi HyperOS bước vào các mẫu xe của riêng mình; mô hình trên thiết bị di chuyển làm nhẹ hóa đến phần cứng hình thái mới như kính, Google cùng Samsung, Gentle Monster, Warby Parker phát triển kính thông minh Android XR sẽ ra mắt mùa thu 2026; sự phối hợp giữa Runtime và Agent thông qua khung "siêu thiết bị đầu cuối/phân tán" mà các hãng đã triển khai mở rộng đến nhóm thiết bị, ví dụ 1+8+N của Huawei và bus mềm phân tán Hongmeng, hệ sinh thái đầy đủ "người-xe-nhà" của Xiaomi và HyperConnect, Continuity của Apple, Cross device SDK và dịch vụ xuyên thiết bị của Google. Trận chiến OS Agent này, xa hơn không chỉ là thắng thua của điện thoại và PC.
AICore mài giũa gần hai năm; hệ điều hành của Apple và series chip Apple silicon hòa hợp hơn mười năm; Tensor sửa đổi đến G5, Pixel 10 mới có thể đảm đương trọng trách Gemini Nano v3. Cao thấp của trận chiến này, từ trước đến nay không nằm trong một hai giờ của hội nghị, mà mài ra từ những thế hệ chip, mô hình và Runtime.
Tài liệu tham khảo:
- Gemini Intelligence brings proactive AI to Android|Google Blog
- I/O 2026: Welcome to the agentic Gemini era|Google Blog
- Phi Silica, small but mighty on-device SLM|Windows Experience Blog
- Apple Delays Siri Upgrade Indefinitely|Bloomberg
- HarmonyOS 6 开发者 Beta 启动新闻稿(HDC 2025)|Huawei
- The latest Gemini Nano with on-device ML Kit GenAI APIs|Android Developers Blog
- Foundation Models framework documentation|Apple Developer
- Sách trắng Khung trình Agent thông minh Hongmeng|Nhà phát triển Huawei
- On-Device Llama 3.1 with Core ML|Apple Machine Learning Research
- Apple Intelligence Foundation Language Models Tech Report 2025|Apple Machine Learning Research
- Google Tensor G5: Benchmarks and everything you need to know|Android Central
- Google’s new M5 SoC(Chi tiết Tensor G5·Matryoshka Transformer)|Jon Peddie Research
- Private Cloud Compute: A new frontier for AI privacy in the cloud|Apple Security Engineering
- Overview of AppFunctions|Android Developers
- App Intents|Apple Developer
- Giới thiệu Intents Kit (HarmonyOS)|Nhà phát triển Huawei
- The Google Pixel 10 Pro’s Tensor G5 chip is impressive—if you compare it to an iPhone 14|Macworld
- Gemma 3n model overview|Google AI for Developers











