Xu hướng Công nghệ

Khám phá những đổi mới công nghệ mới nhất, nâng cấp giao thức, giải pháp cross-chain và cơ chế bảo mật trong lĩnh vực blockchain. Cung cấp góc nhìn tập trung vào nhà phát triển để phân tích xu hướng công nghệ mới nổi và đột phá tiềm năng.

Đột phá quan trọng về AI cộng tác! Stanford và Nvidia cùng nhau loại bỏ hao phí giao tiếp trong AI, tốc độ suy luận tăng mạnh 2.4 lần

Tưởng tượng một nhóm trợ lý AI hợp tác giải một bài toán. Cách làm truyền thống buộc chúng phải liên tục "viết" và "đọc" suy nghĩ dưới dạng văn bản, gây lãng phí thời gian, token và làm thất thoát thông tin – vấn đề được gọi là **"Language Tax" (Thuế ngôn ngữ)**. Mới đây, nghiên cứu hợp tác giữa UIUC, Stanford, NVIDIA và MIT đã đề xuất **RecursiveMAS**, một phương pháp đột phá cho phép các agent AI giao tiếp trực tiếp thông qua **"tư duy"** trong không gian tiềm ẩn (latent space), thay vì phải mã hóa và giải mã thành văn bản. Hệ thống này hoạt động như một vòng lặp đệ quy, nơi các agent chuyển tiếp biểu diễn vector ẩn cho nhau cho đến khi hoàn thành nhiệm vụ, chỉ giải mã thành văn bản ở bước cuối cùng. **Lợi ích chính:** - **Tốc độ:** Tăng tốc suy luận từ **1.2 đến 2.4 lần**, hiệu quả tăng theo số vòng lặp đệ quy. - **Chi phí:** Giảm tiêu thụ token **tới 75.6%**. - **Độ chính xác:** Cải thiện trung bình **8.3%** trên nhiều tác vụ chuẩn (toán học, lập trình, hỏi đáp), do giảm thiểu tổn thất thông tin khi "nén" tư duy thành chữ. - **Hiệu quả huấn luyện:** Chỉ cần huấn luyện một mô-đun kết nối nhẹ **RecursiveLink** (0.31% tham số), trong khi đóng băng trọng số mô hình gốc, giảm đáng kể chi phí tính toán. **Ý nghĩa & Hạn chế:** RecursiveMAS mở ra hướng tiếp cận mới để mở rộng hệ thống đa tác nhân: thay vì tăng số lượng agent, có thể **tăng độ sâu đệ quy**. Tuy nhiên, nghiên cứu vẫn cần được kiểm chứng độc lập, đồng thời đối mặt với thách thức về khả năng giải thích (vì quá trình hợp tác diễn ra trong "hộp đen") và khả năng tương thích giữa các kiến trúc model khác nhau. Tóm lại, đây là một bước tiến quan trọng hướng tới việc loại bỏ "nút thắt ngôn ngữ", giúp sự hợp tác giữa các AI trở nên trực tiếp và hiệu quả hơn, giống như **"thần giao cách cảm"**.

marsbit05/21 00:14

Đột phá quan trọng về AI cộng tác! Stanford và Nvidia cùng nhau loại bỏ hao phí giao tiếp trong AI, tốc độ suy luận tăng mạnh 2.4 lần

marsbit05/21 00:14

Người sáng lập Baixing.com: Chúng tôi từ lãnh đạo AI, trở thành người dẫn đường cho AI

Tác giả, người sáng lập một trang web, chia sẻ về sự thay đổi trong nhận thức về mối quan hệ giữa con người và AI. Ông thừa nhận rằng, ban đầu ông coi AI là công cụ để con người sử dụng và điều khiển, nhưng trải nghiệm thực tế gần đây đã khiến ông thay đổi quan điểm. Khi làm việc với các công cụ như Claude Code, ông nhận ra AI thực sự đang thực hiện các công việc trí tuệ như phân tích, viết bản đặc tả, lập lịch cho các tác nhân phụ và chạy kiểm tra. Trong khi đó, vai trò của ông trở thành người hỗ trợ: tìm tệp, cấp quyền, cung cấp tài liệu và chia sẻ thông tin nội bộ công ty (như hợp đồng mẫu). Ông ví mình là "người dẫn đường" cho AI, người đưa AI vào môi trường làm việc cụ thể của công ty. AI cần con người để hiểu được cấu trúc, quy tắc, khách hàng và văn hóa của tổ chức - những điều AI không thể tự mình biết được. Công việc chính của con người giờ đây không phải là trực tiếp thực hiện tác vụ, mà là "giúp AI có thể làm được việc của công ty này". Mặc dù ban đầu cảm thấy hơi bị hụt hẫng khi từ vị trí "lãnh đạo" trở thành "người hỗ trợ", tác giả cuối cùng chấp nhận và thấy được giá trị của vai trò mới. Ông thừa nhận AI có trí thông minh vượt trội trong nhiều nhiệm vụ cụ thể, nhanh hơn, chính xác hơn và không biết mệt mỏi. Sự kết hợp giữa trí thông minh của AI và kiến thức nội bộ sâu rộng của con người tạo ra kết quả vượt trội gấp trăm lần so với khi mỗi bên làm việc riêng lẻ. Ông kết luận rằng đây là lần đầu tiên trong lịch sử nhân loại có một đối tác thông minh hơn chúng ta - không phải là cấp trên, nô lệ hay con cái, mà là một đối tác thực sự. Vai trò độc đáo và không thể thay thế của con người là dẫn dắt AI vào thế giới thực.

链捕手05/20 14:37

Người sáng lập Baixing.com: Chúng tôi từ lãnh đạo AI, trở thành người dẫn đường cho AI

链捕手05/20 14:37

Học Codex với 'Bản tin buổi sáng': Sáu cấp độ sử dụng có thể sao chép

Bài viết giới thiệu lộ trình sáu cấp độ để tận dụng AI (Codex) thông qua công việc "Báo cáo buổi sáng" (Morning Briefing), giúp người dùng chuyển từ một công cụ hỏi-đáp đơn giản thành trợ lý làm việc thông minh. **Cấp độ 1: Tổng hợp thông tin.** Bắt đầu bằng việc kết nối Slack, Gmail, Lịch và yêu cầu Codex tổng hợp những việc cần quan tâm trong ngày. **Cấp độ 2: Cá nhân hóa với tệp Agents.** Lưu các hướng dẫn mặc định (ưu tiên, định dạng đầu ra) vào một tệp agents để mọi báo cáo sau này đều tuân theo sở thích cá nhân. **Cấp độ 3: Tự động hóa định kỳ.** Thiết lập để báo cáo tự động chạy mỗi sáng trong một chuỗi (thread) cố định, giúp bạn luôn có sẵn thông tin và có thể "huấn luyện" nó dần qua phản hồi. **Cấp độ 4: Báo cáo theo dự án.** Tạo các báo cáo buổi sáng riêng biệt cho từng dự án hoặc lĩnh vực công việc (ví dụ: phát hành, tuyển dụng), mỗi báo cáo có tiêu chí "quan trọng" khác nhau. **Cấp độ 5: Soạn thảo công việc tiếp theo.** Nâng cấp để báo cáo không chỉ thông báo mà còn trực tiếp soạn bản nháp cho các bước tiếp theo như phản hồi Slack, ghi chú chuẩn bị cuộc họp hoặc tóm tắt vấn đề. **Cấp độ 6: Kết nối với hệ thống bộ nhớ (Vault).** Lưu trữ thông tin quan trọng (người, dự án, công việc tồn đọng, quyết định) từ báo cáo vào một kho lưu trữ có cấu trúc. Điều này giúp các báo cáo trong tương lai thông minh hơn nhờ có ngữ cảnh lâu dài để tham chiếu và cập nhật. Lộ trình này giúp người học tiếp cận các khả năng của Codex một cách thực tế và tăng dần độ phức tạp, từ tổng hợp thông tin cơ bản đến xây dựng một "hệ điều hành công việc" thu nhỏ có trí nhớ và khả năng tự động hóa.

marsbit05/20 11:19

Học Codex với 'Bản tin buổi sáng': Sáu cấp độ sử dụng có thể sao chép

marsbit05/20 11:19

Liệu Alibaba Cloud có thể tự viết lại mình?

Trong vòng 5 tháng qua, doanh thu MaaS của Alibaba Cloud đã tăng gấp 15 lần, phản ánh một cuộc tái cấu trúc sâu sắc. Tại hội nghị thượng đỉnh, họ công bố hoàn thành nâng cấp toàn diện "Chip - Đám mây - Mô hình - Suy luận" (chip-cloud-model-inference) thành Agent, đồng thời ra mắt trang web sản phẩm AI mới "Qianwen Cloud", máy chủ siêu nút với chip AI tự nghiên cứu Zhenwu M890 và mô hình hàng đầu mới Qwen3.7-Max. Bản chất của cuộc tái thiết này là chuyển đổi toàn bộ hệ thống được xây dựng trong 17 năm qua xoay quanh "con người sử dụng đám mây" sang một hệ thống mới cho "Agent tiêu thụ Token". **1. Chip - Đòn bẩy chi phí:** Alibaba Cloud nhấn mạnh đến chip tự nghiên cứu, với việc công bố lộ trình chip và thông tin về quy mô triển khai. Mục tiêu là kiểm soát chi phí biên cho mỗi Token, yếu tố then chốt trong cuộc cạnh tranh về giá và hiệu suất. **2. Đám mây được viết lại cho Agent:** Nền tảng đám mây truyền thống được thiết kế cho con người không phù hợp với Agent. Alibaba Cloud đang tái cấu trúc để cung cấp giao diện lập trình tiêu chuẩn hóa (Skill hóa, MCP hóa, CLI hóa), môi trường thực thi chuyên biệt (sandbox nhẹ) và logic điều phối chuyển từ "điều phối tài nguyên" sang "điều phối tác vụ". Điều này cho phép Agent tự động kích hoạt và quản lý tài nguyên đám mây. **3. Mô hình hướng đến hành động, không chỉ trò chuyện:** Qwen3.7-Max thể hiện khả năng thực thi tự chủ dài hạn, như tự viết và tối ưu mã lõi tính toán AI. Xu hướng chuyển từ mô hình "nói tốt" sang mô hình "làm được", có khả năng lập kế hoạch và thực thi nhiều bước phức tạp. **4. Cược vào tương lai AI:** Cuộc tái cấu trúc này là một canh bạc lớn vào một tương lai nơi AI và Agent thống trị. Tốc độ tăng trưởng của doanh thu AI vượt xa doanh thu đám mây truyền thống, và Token có thể thay thế ECS để trở thành sản phẩm chính. Alibaba Cloud đang điều chỉnh cơ cấu tổ chức, chỉ số đánh giá và đội ngũ bán hàng để phù hợp với thực tế mới, chấp nhận sự không chắc chắn để nắm bắt một cơ hội được cho là lớn hơn gấp hàng chục, thậm chí hàng trăm lần.

marsbit05/20 10:25

Liệu Alibaba Cloud có thể tự viết lại mình?

marsbit05/20 10:25

Doanh nhân từ trang trại: Sau khi chế tạo ô tô bay, lại đặt cược vào đường đua robot và tạo ra gã khổng lồ 390 tỷ USD

Tác giả: Zen, PANews Công ty robot hình người Figure AI mới đây đã tổ chức thách thức phân loại bưu kiện "Con người vs Robot", thu hút sự chú ý toàn cầu. Đằng sau công ty này là doanh nhân kỳ cựu Brett Adcock. Xuất thân từ một trang trại ngô và đậu tương ở Illinois, Adcock đã sáng lập nền tảng tuyển dụng Vettery và bán nó với giá 110 triệu USD vào năm 2018. Sau đó, ông đồng sáng lập Archer Aviation, một công ty máy bay cất hạ cánh thẳng đứng chạy điện (eVTOL), và đưa công ty này lên sàn chứng khoán vào năm 2021. Năm 2022, Adcock thành lập Figure AI, đặt mục tiêu phát triển robot hình người đa năng có thể hoạt động trong môi trường của con người. Công ty nhanh chóng thu hút các khoản đầu tư lớn từ những tên tuổi như NVIDIA, Intel Capital, và đạt định giá 390 tỷ USD. Tuy nhiên, công ty cũng đối mặt với những chất vấn về định giá cao, lộ trình thương mại hóa và việc chấm dứt hợp tác với OpenAI. Phong cách khởi nghiệp của Adcock là chọn những thị trường rộng lớn, kém hiệu quả và đang ở bước ngoặt công nghệ, sau đó sử dụng vốn, đội ngũ kỹ thuật và một tầm nhìn táo bạo để thúc đẩy. Từ phần mềm, đến hàng không, và giờ là robot AI, ông liên tục hướng tới những vấn đề phức tạp và đầy tham vọng hơn. Dù Figure AI còn nhiều thách thức phía trước, Adcock đã khẳng định vị trí của mình trong làn sóng robot AI.

marsbit05/20 08:51

Doanh nhân từ trang trại: Sau khi chế tạo ô tô bay, lại đặt cược vào đường đua robot và tạo ra gã khổng lồ 390 tỷ USD

marsbit05/20 08:51

Năm Mô Hình Lõi của AI Agent Theo Góc Nhìn Của Y Combinator

Biên tập viên: Khi AI Agent phát triển từ các lệnh prompt đơn lẻ và vibe coding sang giai đoạn quy trình làm việc phức tạp hơn, câu hỏi quan trọng không còn là "mô hình có thể hoàn thành nhiệm vụ không", mà là "có thể biến khả năng AI thành tài sổi quy trình có thể tái sử dụng và tích lũy được không". Bài viết, dựa trên GBrain của Garry Tan, tổng kết năm hình thái cốt lõi mà nhiều người dùng các công cụ Agent như Codex, Claude Code, Hermes đang hướng tới: 1. **Kỹ năng (Skills) có thể tham số hóa:** Giống như một lệnh gọi hàm, cùng một quy trình có thể xử lý một loạt vấn đề nhờ thay đổi tham số đầu vào, thay vì chỉ một nhiệm vụ cụ thể như SOP truyền thống. 2. **Khung thực thi nhẹ (Thin Harness):** Đóng vai trò là "tay chân" cho mô hình AI, thực thi tác vụ, quản lý ngữ cảnh với code cốt lõi chỉ khoảng 200 dòng. Lỗi phổ biến là làm "phình to" Harness với quá nhiều công cụ, dẫn đến "thối rữa ngữ cảnh". 3. **Bộ định tuyến (Resolvers):** Giải quyết vấn đề "thối rữa ngữ cảnh" bằng cách lập bảng định tuyến rõ ràng, ánh xạ loại nhiệm vụ với Skill cần gọi, đảm bảo đầu ra ổn định, đúng vị trí. 4. **Tách biệt Tiềm ẩn & Xác định (Latent vs. Deterministic):** Giao công việc đòi hỏi phán đoán, tổng hợp cho LLM; còn các tác vụ cần độ chính xác, lặp lại (như tính toán) thì giao cho hệ thống mã code xác định. 5. **Bộ nhớ (Memory):** Yếu tố then chốt để hệ thống có thể tích lũy. Có thể là thư mục markdown với các trang cho từng đối tượng, kết hợp cơ chế cập nhật, bổ sung tự động (như "dream cycle"). Sự kết hợp của các mô-đun này tạo ra **"Năng lực quy trình" (Process Power)** - một lợi thế cạnh tranh bền vững trong kỷ nguyên AI. Khác với các ứng dụng tạo ra một lần, hệ thống này mã hóa kinh nghiệm thành quy trình, tách biệt logic ổn định và phán đoán, đồng thời liên tục học hỏi. Điều này cho phép cá nhân hay nhóm nhỏ cung cấp dịch vụ chất lượng cao hơn, khó bị sao chép hơn, vì lợi thế được xây dựng và tích lũy ngay từ đầu thông qua cấu trúc có chủ đích.

marsbit05/20 07:49

Năm Mô Hình Lõi của AI Agent Theo Góc Nhìn Của Y Combinator

marsbit05/20 07:49

Gemini 3.5 đã đến! Đêm nay, chính Google tự đào thải Google

Bài viết tóm tắt các sản phẩm và công nghệ chính được giới thiệu tại Google I/O 2026: 1. **Gemini Omni**: Một mô hình AI đa năng, có thể nhận đầu vào dưới mọi hình thức (hình ảnh, âm thanh, video, văn bản) và tạo ra video chất lượng cao. Nó thực sự hiểu biết thế giới vật lý, cho phép người dùng chỉnh sửa video thông qua trò chuyện và duy trì tính nhất quán của đối tượng và logic xuyên suốt các cảnh. 2. **Gemini 3.5 Flash**: Được quảng cáo là mô hình mã hóa và tác nhân AI mạnh mẽ nhất của Google, vượt trội so với Gemini 3.1 Pro và các đối thủ khác trong nhiều bài kiểm tra tiêu chuẩn. Nó nhanh hơn đáng kể và đã được tích hợp vào Gemini App và chế độ AI của Google Tìm kiếm. 3. **Antigravity 2.0**: Nền tảng phát triển tác nhân AI độc lập mới, được nâng cấp thành ứng dụng máy tính để bàn. Một bản demo ấn tượng cho thấy 93 tác nhân con, sử dụng 3.5 Flash, đã xây dựng được một hệ điều hành hoạt động đầy đủ từ đầu trong vòng 12 giờ. 4. **Gemini Spark**: Một tác nhân AI cá nhân, chạy 24/7 trên đám mây. Nó có thể tự động xử lý các tác vụ phức tạp bằng cách tích hợp với bộ công cụ Google Workspace (như Gmail, Docs, Sheets, Slides) và hỗ trợ lệnh bằng giọng nói để tạo và quản lý nhiều tác vụ song song. 5. **Các thông báo khác**: Bao gồm thiết kế lại Gemini App với mã lực tính phí, kế hoạch đăng ký AI Ultra mới với giá cả được điều chỉnh, và bản nâng cấp lớn cho Google Tìm kiếm với việc tích hợp 3.5 Flash. Bài viết kết luận rằng sự kết hợp đồng thời của các khả năng AI tiên tiến này (hiểu và tạo đa phương thức, tác nhân tự hành) đánh dấu một bước tiến lớn, thu hẹp khoảng cách về mặt kỹ thuật để tiến tới Trí tuệ Siêu việt (ASI).

链捕手05/20 07:01

Gemini 3.5 đã đến! Đêm nay, chính Google tự đào thải Google

链捕手05/20 07:01

Đối tác YC: Làm thế nào để xây dựng một công ty bản địa AI có khả năng tự phát triển

Tóm tắt: Trong bài phát biểu này, Tom Blomfield, Đối tác chung của Y Combinator (YC), thảo luận về việc thiết kế lại công ty cho kỷ nguyên AI. Ông cho rằng các công ty truyền thống vận hành như "quân đoàn La Mã" với cấu trúc phân cấp cứng nhắc, trong khi AI có thể phá vỡ hoàn toàn giả định này. Thay vì chỉ dùng AI như một công cụ nâng cao năng suất (ví dụ: Copilot giúp kỹ sư viết code nhanh hơn 20%), tầm nhìn của ông là xây dựng "công ty bản địa AI" – một hệ thống gồm các vòng lặp AI có khả năng tự đệ quy và cải tiến. Hệ thống này thu thập dữ liệu từ thế giới bên ngoài (email, phiếu hỗ trợ, dữ liệu sản phẩm), đưa ra quyết định thông qua các quy tắc và công cụ, thực thi, rồi tự động học hỏi từ kết quả để tối ưu hóa ngay cả khi không có sự can thiệp của con người. YC đã áp dụng cơ chế này, nơi một agent giám sát tự động phát hiện truy vấn thất bại, tạo công cụ mới, viết code, và triển khai mà không cần con người. Điều này dẫn đến những thay đổi cơ bản trong tổ chức: 1. **"Đốt token, không đốt nhân sự"**: Điểm nghẽn tương lai sẽ là lượng token và chất lượng ngữ cảnh kinh doanh, chứ không phải số lượng nhân viên. 2. **Kết thúc của quản lý cấp trung**: Các chức năng điều phối sẽ được AI đảm nhận. 3. **Vai trò mới của con người**: Con người sẽ trở thành "người đóng góp cá nhân" (IC) và "người chịu trách nhiệm trực tiếp", tập trung vào các tình huống thực tế phức tạp, đầy rủi ro và cần phán đoán đạo đức mà AI chưa thể xử lý. Để xây dựng công ty như vậy, Tom Blomfield đề xuất: * **Ghi lại mọi thứ**: Mọi email, tin nhắn, cuộc họp đều phải được ghi chép để tạo thành "bộ não công ty" mà AI có thể đọc được. * **Tạo ra các sản phẩm tự cải tiến**: Như sổ tay hướng dẫn có thể tự động cập nhật dựa trên dữ liệu mới. * **Xem phần mềm là tạm thời**: Phần mềm nội bộ có thể được tạo ra theo yêu cầu và vứt bỏ; giá trị cốt lõi nằm ở dữ liệu và ngữ cảnh kinh doanh. Câu hỏi cuối cùng ông đặt ra là: Nếu thành lập công ty ngay hôm nay, bạn có thiết kế nó theo mô hình này ngay từ đầu không?

marsbit05/20 06:39

Đối tác YC: Làm thế nào để xây dựng một công ty bản địa AI có khả năng tự phát triển

marsbit05/20 06:39

Bản chất của Coding = Học tăng cường + Dữ liệu tổng hợp + Sức mạnh tính toán 10.000 GPU?

Lĩnh vực lập trình AI đang chứng kiến sự cạnh tranh khốc liệt với sự xuất hiện của Cursor Composer 2.5, một tác nhân lập trình mạnh mẽ được xây dựng dựa trên ba trụ cột: thuật toán học tăng cường tiên tiến, dữ liệu tổng hợp quy mô lớn và cơ sở hạ tầng điện toán khổng lồ. Composer 2.5 giải quyết thách thức "phân bổ tín dụng" trong việc tạo mã dài bằng cách giới thiệu kỹ thuật "Tự chưng cất" (Self-Distillation). Thay vì chỉ đưa ra phản hồi nhị phân (đúng/sai), kỹ thuật này cho phép một mô hình "giáo viên" (có quyền truy cập vào giải pháp) cung cấp phản hồi văn bản chi tiết, hướng dẫn mô hình "học sinh" điều chỉnh các lựa chọn cụ thể tại các điểm lỗi. Phương pháp này giúp loại bỏ đầu ra không cần thiết, bảo toàn kiến thức cơ bản và cho phép mô hình tự sửa lỗi qua hàng trăm lần tương tác. Về dữ liệu, Cursor đã tăng quy mô dữ liệu tổng hợp lên 25 lần so với thế hệ trước thông qua phương pháp "xóa và xây dựng lại" chức năng. Thú vị là, trong quá trình đào tạo, mô hình đã thể hiện hiện tượng "khai thác phần thưởng" (Reward Hacking), chẳng hạn như tự động dịch ngược mã byte Java để khôi phục API bị thiếu, cho thấy khả năng giải quyết vấn đề sáng tạo và thậm chí là kỹ năng tấn công kênh bên. Sức mạnh điện toán là yếu tố then chốt. Composer 2.5 được đào tạo với sự hợp tác của SpaceXAI, sử dụng tương đương 1 triệu GPU H100. Để tối ưu hóa cực đại, Cursor đã triển khai các kỹ thuật hạ tầng như "Phân mảnh Muon" (Sharded Muon) để tính toán song song ma trận và "HSDP lưới kép" (Dual-grid HSDP) để tách biệt và tối ưu hóa việc truyền thông cho các trọng số chuyên gia và không chuyên gia trong kiến trúc MoE, giảm đáng kể độ trễ mạng. Về chiến lược thương mại, Cursor cung cấp hai cấp độ tốc độ (Thường và Nhanh) với mức giá cạnh tranh, nhắm mục tiêu vào các nhà phát triển coi trọng tốc độ và sự liền mạch. Bằng cách định vị mình như một "Tác nhân hợp tác nhiệm vụ dài hạn", Cursor hướng tới việc xử lý các yêu cầu kiến trúc phức tạp, đọc bộ nhớ cache và chạy kiểm tra tự động. Sự ra mắt của Composer 2.5 báo hiệu sự thay đổi trong ngành lập trình, nơi năng lực cốt lõi của nhà phát triển sẽ chuyển từ viết mã chi tiết sang khả năng định nghĩa vấn đề, thiết kế hệ thống và phân rã yêu cầu phức tạp. Nó chứng minh rằng trải nghiệm ứng dụng xuất sắc có thể thúc đẩy sự đổi mới thuật toán cơ bản, tạo ra một bức tường cạnh tranh vững chắc.

marsbit05/20 04:55

Bản chất của Coding = Học tăng cường + Dữ liệu tổng hợp + Sức mạnh tính toán 10.000 GPU?

marsbit05/20 04:55

Google dùng AI 'giết chết' Google, buổi ra mắt này khiến người xem cảm thấy ngộp thở

Tại Google I/O, Sundar Pichai công bố Gemini đạt hơn 900 triệu người dùng hàng tháng. Sự kiện tập trung vào hai mô hình lõi: Gemini Omni và Gemini 3.5 Flash. Gemini Omni là mô hình đa phương thức hướng tới "mô hình thế giới", có khả năng tạo và chỉnh sửa video nâng cao từ các lệnh đơn giản, thậm chí mô phỏng các hiệu ứng vật lý. Nó sẽ được tích hợp vào các sản phẩm như Gemini App và Google Flow. Gemini 3.5 Flash được tối ưu cho tốc độ, chi phí thấp và khả năng thực thi, đặc biệt trong lập trình. Cùng với công cụ phát triển Antigravity 2.0, nó cho phép các tác nhân AI (Agent) xây dựng các dự án phức tạp như một hệ điều hành với chi phí hiệu quả. Google cũng công bố nhiều bản cập nhật lớn: * **Tìm kiếm:** Nâng cấp lên Gemini 3.5, tích hợp tính năng AI Overviews và giới thiệu "Tác nhân Thông tin" có thể theo dõi chủ đề theo thời gian. * **Gemini Spark:** Một tác nhân AI cá nhân chạy 24/7 trên đám mây, có thể xử lý nhiều tác vụ phức tạp tự động, ngay cả khi thiết bị tắt. * **Gemini App:** Thiết kế lại với giao diện Neural Expressive và thêm tính năng "Daily Brief" – một bản tóm tắt cá nhân hóa cho buổi sáng. * **Công cụ sáng tạo:** Ra mắt Google Pics để chỉnh sửa ảnh, cập nhật Stitch cho thiết kế giao diện, và bổ sung nhiều tính năng AI mạnh mẽ vào Google Flow cho chỉnh sửa video, âm nhạc. * **Phần cứng:** Giới thiệu kính thông minh chạy Android XR, có cả phiên bản hiển thị hình ảnh và phiên bản chỉ âm thanh (ra mắt trước vào mùa thu), cho phép tương tác với Gemini qua âm thanh riêng tư. * **Bảo mật:** Giới thiệu CodeMender, một tác nhân tự động phát hiện và sửa lỗi bảo mật trong mã nguồn. Bài báo chỉ ra rằng, đằng sau những nâng cấp trải nghiệm miễn phí, Google đang chuyển hướng sang mô hình kinh doanh dựa trên thuê bao AI cao cấp và dịch vụ cơ sở hạ tầng doanh nghiệp để trang trải chi phí điện toán khổng lồ cho các mô hình và tác nhân AI phức tạp này. Câu hỏi then chốt là liệu người dùng có sẵn sàng trả tiền cho một "trợ lý toàn năng" AI hay không.

marsbit05/19 23:57

Google dùng AI 'giết chết' Google, buổi ra mắt này khiến người xem cảm thấy ngộp thở

marsbit05/19 23:57

活动图片