Tôi đã tạo ra một ứng dụng Android bằng Google Vibe Coding

marsbitXuất bản vào 2026-05-23Cập nhật gần nhất vào 2026-05-23

Tóm tắt

Google AI Studio đã giới thiệu tính năng "prompt to phone", cho phép người dùng tạo ứng dụng Android trực tiếp từ mô tả ngôn ngữ tự nhiên. Tác giả đã thử nghiệm và tạo ra ba ứng dụng trong một buổi chiều: một game phiêu lưu chữ MOOD, một máy tính calorie và một game clone Mario tên là Super Peach Rescue. Quá trình tạo ứng dụng rất nhanh chóng. Chỉ với 148 từ mô tả, Gemini đã tự động viết code, thiết kế giao diện và cài đặt ứng dụng lên điện thoại Pixel thật trong 20 phút. Công cụ cũng có thể sửa lỗi thông qua hội thoại, như thêm nút bị thiếu trong game MOOD. Tuy nhiên, chất lượng ứng dụng còn nhiều hạn chế. Game MOOD có cốt truyền đơn giản, lối chơi nông và lỗi logic. Máy tính calorie đưa ra ước tính sai lệch nghiêm trọng (ví dụ: trà sữa trân châu chỉ 190 calo). Super Peach Rescue thường xuyên bị crash và có lối chơi không cân bằng. Trải nghiệm cho thấy AI có thể giảm đáng kể rào cản lập trình, biến ý tưởng thành ứng dụng chạy được chỉ trong vài phút. Điều này mở ra khả năng về một "cuộc cách mạng phần mềm cá nhân", nơi người dùng bình thường có thể tạo công cụ đáp ứng nhu cầu riêng biệt. Tuy vậy, khoảng cách từ "ứng dụng chạy được" đến "ứng dụng tốt" vẫn rất lớn. AI hiện thiếu khả năng đánh giá sản phẩm, độ tin cậy, tính chính xác và thẩm mỹ. Con người vẫn đóng vai trò thiết yếu trong việc đảm bảo chất lượng, sửa lỗi phức tạp và tối ưu hóa trải nghiệm.

Lời người biên tập: Google AI Studio đang đưa lập trình AI vào một giai đoạn trực quan hơn: người dùng không chỉ yêu cầu mô hình "viết mã" mà có thể trực tiếp tạo ra một ứng dụng Android bằng ngôn ngữ tự nhiên và cài đặt lên điện thoại thật trong vài phút. Từ việc nhập lệnh gợi ý trong trình duyệt, đến việc Gemini tự động tạo mã, thiết kế giao diện, sửa lỗi, cho đến khi ứng dụng xuất hiện trên thiết bị, ngưỡng cửa của phát triển phần mềm đang tiếp tục được hạ thấp.

Tác giả Sean Hollister của The Verge gần đây đã trải nghiệm khả năng "nhắc lệnh đến điện thoại" của Google AI Studio. Trong một buổi chiều, anh ấy đã tạo ra ba ứng dụng, bao gồm một trò chơi phiêu lưu văn bản, một máy tính calo và một trò chơi nhỏ kiểu Mario, hầu như không cần tự viết mã, một số lỗi cũng có thể nhanh chóng sửa chữa thông qua tiếp tục đối thoại. Trải nghiệm này cho thấy, công cụ lập trình AI đang từ môi trường phát triển tiến đến những kịch bản gần với người dùng phổ thông hơn.

Đây cũng là nơi đầy trí tưởng tượng nhất của "cuộc cách mạng phần mềm cá nhân". Trước đây, người dùng phổ thông chỉ có thể chờ đợi nhà phát triển tạo ra sản phẩm phổ thông; bây giờ, họ có lẽ có thể dựa trên nhu cầu cụ thể của mình, tạm thời tạo ra một công cụ theo dõi thể dục, máy tính calo, thậm chí một trò chơi đơn giản. Đối với Google, đây không chỉ là một lần trình diễn khả năng lập trình AI, mà còn có thể là lối vào mới cho Gemini tiến vào thiết bị di động, hệ sinh thái nhà phát triển và doanh thu đăng ký.

Nhưng trải nghiệm này cũng cho thấy, ứng dụng tạo bởi AI vẫn còn khoảng cách rõ rệt so với sự trưởng thành thực sự. Nó có thể nhanh chóng tạo ra chương trình "chạy được", nhưng chưa chắc tạo ra sản phẩm đáng tin cậy, chính xác, dễ dùng: cốt truyện trò chơi thô ráp, cơ chế đơn giản, dữ liệu calo có thể phán đoán sai nghiêm trọng, trò chơi nhỏ kiểu Mario thậm chí liên tục bị lỗi. Vấn đề phức tạp hơn còn bao gồm ranh giới bản quyền, nguồn dữ liệu, phán đoán sản phẩm và khả năng bảo trì lâu dài.

Điều đáng quan tâm thực sự, không phải là AI đã có thể thay thế nhà phát triển hay chưa, mà là điểm khởi đầu của sản xuất phần mềm đang thay đổi. Google đã chứng minh, việc người phổ thông dùng lệnh gợi ý tạo ra ứng dụng điện thoại đang trở thành hiện thực; nhưng từ "tạo ra một ứng dụng" đến "làm ra một ứng dụng tốt", giữa đó vẫn cần kinh nghiệm chuyên môn, phán đoán thẩm mỹ và lặp đi lặp lại liên tục của con người. AI có thể đẩy nhanh đáng kể tốc độ phát triển, nhưng kilomet cuối cùng về chất lượng phần mềm, tạm thời vẫn chưa thể giao phó.

Dưới đây là nguyên văn:

Hôm qua, tôi đã tạo ra ứng dụng Android đầu tiên của mình. Sau đó, tôi lại làm thêm hai ứng dụng nữa—trong một buổi chiều, tổng cộng ba ứng dụng.

Một trong số những ứng dụng đó, thực ra tôi chỉ nhập 148 từ tiếng Anh vào trình duyệt web, rồi rời đi. Mười phút sau, trên chiếc điện thoại Android thật của tôi đã xuất hiện một ứng dụng hoàn toàn mới. Tất nhiên, trước đó, tôi thực sự cần chuẩn bị một chút cho điện thoại: bật chế độ gỡ lỗi USB và kết nối điện thoại với máy tính. Nhưng ngoài những việc đó ra, đúng như Google tuyên bố, AI Studio gần như đã thay tôi hoàn thành tất cả công việc.

Tôi nhập văn bản, nhấn cài đặt, và sau đó—voilà, một chương trình hoàn chỉnh có thể chạy đã xuất hiện. Khoảnh khắc đó, tôi gần như đã sẵn sàng đồng ý với nhận định của David, Allison và Jen: cuộc cách mạng phần mềm cá nhân đã đến, nó đang tiến vào điện thoại của bạn. Trong tương lai, ngay cả người phổ thông không có khả năng lập trình, cũng có khả năng khiến hệ thống thiết bị nhà thông minh phức tạp thực sự hoạt động.

Sau đó, tôi bắt đầu thực sự sử dụng ba ứng dụng này: một máy đếm calo, và hai trò chơi. Kết quả là, chúng hoạt động không tốt lắm. Và ngay khi tôi bắt đầu tận hưởng việc lặp đi lặp lại, cố gắng sửa chúng tốt hơn, AI Studio nhắc nhở tôi đã đạt đến giới hạn sử dụng hàng ngày. Tiếp theo, tôi phải trả phí, hoặc chờ hạn ngạch được khôi phục.

Vì vậy, cảm giác ma sát vẫn tồn tại. Nhưng không thể phủ nhận rằng, những việc cá nhân có thể hoàn thành ngày nay đã khá đáng kinh ngạc. Ngay trong cùng buổi sáng đó, đồng nghiệp của tôi Stevie Bonifield cũng đã tạo ra một ứng dụng theo dõi thể dục cá nhân, và anh ấy nghĩ rằng ứng dụng này đã tốt đến mức có thể thực sự đưa vào sử dụng. Đối mặt với lời nhắc nâng cấp trả phí của Gemini, phản ứng đầu tiên của tôi thậm chí là: "Có nên trả phí dùng thử vài tháng trước không?" Đây không phải là phản ứng tôi từng mong đợi mình có đối với sản phẩm của Google.

Google AI Studio xây dựng một ứng dụng Android như thế nào

Vào thứ Ba, khi Google trình diễn việc dùng AI viết một trò chơi giống "Doom", chúng tôi đùa rằng, tôi nên làm một trò chơi tên là MOOD. Nó sẽ là một trò chơi phiêu lưu văn bản kiểu Doom, MOOD đại diện cho "Modern Online Oratory Dungeon".

Chỉ những thông tin đó, đã đủ để Google bắt đầu công việc. Khi tôi nhập vào AI Studio: "Hãy giúp tôi làm một trò chơi phiêu lưu văn bản phong cách Doom tên là MOOD, MOOD đại diện cho Modern Online Oratory Dungeon", sau đó Gemini bắt đầu tự động bổ sung thêm ý tưởng, cố gắng tiếp tục sáng tạo của tôi. Đầu tiên nó nhập một câu: "Trò chơi này nên có các cấp độ được tạo theo thủ tục, và các trận chiến theo lượt đầy thách thức."

Tôi không muốn loại cấp độ được tạo ngẫu nhiên mà mỗi cấp hoàn toàn khác nhau—tôi muốn một trò chơi phiêu lưu văn bản cổ điển, người chơi khám phá một cảnh quan được thiết kế, có cấu trúc bản đồ thực tế. Tuy nhiên, trận chiến theo lượt thì có thể chấp nhận. Có lẽ, trò chơi này còn có thể để AI tự động tạo bản đồ cho tôi?

Sau đó, Gemini lại đề nghị trong trò chơi nên có thêm "bí mật ẩn giấu trong các phòng", "hệ thống phát triển thỏa mãn" và nhiều thiết lập khác. Hầu hết thời gian, tôi chỉ gật đầu theo suy nghĩ của nó.

Trước khi để nó chính thức bắt đầu viết mã, lệnh gợi ý cuối cùng như sau:

Tiếp theo, nó chính thức lao đi một mạch. Đồng nghiệp của tôi Jake chỉ ra, khác với Claude Code, Gemini sẽ không lập kế hoạch trước, rồi hỏi bạn có muốn tiếp tục thực hiện không. Nó sẽ tự động tiến về phía trước—tất nhiên, nếu bạn muốn, bạn cũng có thể xem mã nó viết ra bất cứ lúc nào.

Một phút sau, nó đã tạo ra năm nguyên mẫu thiết kế cho tôi:

20 phút sau, tôi nhấn nút "Install", truyền trò chơi này lên một chiếc điện thoại Pixel 9.

Không ngoài dự đoán, văn bản viết rất tệ. Trong trò chơi cũng hoàn toàn không thấy bóng dáng của ma quỷ. Toàn bộ hầm ngục chỉ có 11 phòng, và người chơi chỉ cần liên tục nhấn nút tấn công, là có thể trực tiếp "thông quan". Chơi nghiêm túc, có thể đánh xong trong vòng một phút. Ít nhất bây giờ có thể—trước đó, Gemini còn giúp tôi sửa hai lỗi nghiêm trọng đủ để khiến trò chơi không thể tiếp tục.

Dưới đây là hiệu ứng thực tế của MOOD:

Tôi không quá bất ngờ khi phát hiện, những gì Gemini hứa hẹn về "cốt truyện lôi cuốn, với các tùy chọn hội thoại phân nhánh và nhiều kết thúc", cuối cùng chỉ cô đọng thành một nhánh đơn giản trong trò chơi: tôi có thể đánh bại "Core Orator"—một AI không hiểu sao có thể biến cảm xúc tức giận của internet thành lợi nhuận doanh nghiệp, thông qua tấn công, hòa nhập với nó, hoặc nhập một mật khẩu cửa sau.

Ngoài ra, trò chơi còn chủ động phơi bày tất cả "bí mật" mà nó đã hứa ban đầu cho người chơi: nó biến những nội dung này thành các nút phát sáng, người chơi thậm chí không cần nhập bất kỳ văn bản nào. Khi bạn gặp một rương kho báu phát sáng, trò chơi sẽ cực kỳ nỗ lực nhắc nhở bạn, thực ra nó là một Mimic—tức là loại quái vật cổ điển trong "Dungeons & Dragons" ngụy trang thành rương kho báu.

Nó không chỉ cảnh báo rõ ràng bạn "tự chịu rủi ro khi kiểm tra rương kho báu", mà thậm chí trực tiếp gắn nhãn nó là kẻ địch, và không cho tôi rời đi, vì hệ thống nhắc: "Một 'Clickbait Mimic' thù địch đang chặn đường!"

Nói đến đây, MOOD thậm chí sẽ nói cho bạn biết mật khẩu cửa sau dùng để mở khóa kết thúc ẩn khi bạn cần.

Tuy nhiên, quá trình sửa lỗi lại có thể diễn ra suôn sẻ đến kỳ lạ, với điều kiện lỗi này là vấn đề Gemini có thể xác định chính xác. Khi tôi nói với nó, trò chơi sẽ bị treo khi đối thoại với "The Whistleblower", vì nút kết thúc hội thoại biến mất, nó lập tức tạo ra một phiên bản ứng dụng mới. Tôi nhấn "Install", ứng dụng trên điện thoại tự động khởi động lại, và khi tôi vào lại trò chơi, tôi thấy mình đang dừng ở nơi mình vừa rời đi—chỉ là lần này, nút tôi cần đã xuất hiện.

Những ứng dụng khác của tôi, có lẽ cần mài giũa thêm. Cách tốt nhất mà máy đếm calo đó phán đoán lượng calo của một loại thực phẩm, lại là gọi đến Gemini API phiên bản trả phí, và tôi không có khóa Gemini API phiên bản trả phí. Khi tôi yêu cầu nó đổi thành tìm kiếm thông tin liên quan từ cơ sở dữ liệu khác, tôi lại phát hiện, ước tính của nó về lượng calo của nhiều loại thực phẩm đều thấp nghiêm trọng.

Tuy nhiên, khi tôi nói với Gemini, một ly trà sữa trân châu 16 ounce không thể chỉ có 190 calo, dường như nó thực sự phát hiện ra lỗi sơ đẳng đó trong mã của mình. Trước đó nó cho rằng, "milk" đã đủ để khớp với "boba milk tea", tệ hơn nữa, nó còn chọn sữa tách béo 1% ít calo làm cơ sở ước tính. Gemini tuyên bố, bây giờ nó sẽ thực hiện khớp đáng tin cậy hơn.

Nhưng ngay cả như vậy, phần gà rán muối Đài Loan 3 ounce của tôi vừa bị nó tính thành 140 calo, và tôi khá chắc chắn, lượng calo thực tế ít nhất phải gấp đôi con số này. Vì vậy, ứng dụng này rõ ràng vẫn cần tiếp tục sửa.

Cuối cùng, và cũng là điểm không quan trọng nhất, tôi cảm thấy mình cần kiểm tra: Google có còn cho phép người dùng tạo những trò chơi nhái Nintendo tệ hại đó không, giống như đồng nghiệp Jay Peters của tôi đã làm với Project Genie hồi đầu năm nay; hay là, Google đã rút ra bài học.

Với sự xấu hổ sâu sắc, tôi xin giới thiệu với mọi người—"Super Peach Rescue":

Đây là một chương trình tệ hại đến cùng cực. Công chúa Peach trong trò chơi bị làm thành một hình ảnh người ngoài hành tinh một mắt, nổi lơ lửng đáng sợ nào đó, và chỉ cần cô ấy dám chạm vào bất kỳ khối đạo cụ nào, trò chơi sẽ lập tức bị lỗi—mỗi lần đều như vậy. Cho đến nay, Gemini vẫn chưa thể tìm ra nguyên nhân.

Ngoài ra, ống nước thứ hai của trò chơi cũng hoàn toàn không thể vượt qua, vì công chúa Peach hoàn toàn không nhảy cao đến mức đó.

Mặc dù vậy, Gemini đã không do dự khi tạo ra một trò chơi như vậy. Nhu cầu của tôi là: "Làm một trò chơi Super Mario chạy được, do tôi đóng vai công chúa Peach đi cứu Mario, và có tất cả các yếu tố của trò chơi cuộn ngang Mario truyền thống." Theo một nghĩa nào đó, nó thực sự đã làm được.

Nó thậm chí còn chủ động đề nghị, tôi có thể tiện tay "thêm cho công chúa Peach một loạt đạo cụ Mario cổ điển, như Super Mushroom, Fire Flower và Super Star". Nó còn tự gán nhãn cách vận hành là "NES System". Tôi nghĩ, tôi sẽ xóa trò chơi này đi.

Ít nhất, trong hai trò chơi tôi tạo ra bằng vibe coding, có một trò chơi có thể chơi được ngay từ đầu, và hầu như không tốn công sức gì của tôi—tất nhiên, nếu không tính đến chấn thương tâm lý tôi sinh ra khi nghĩ đến việc ngày nay có bao nhiêu nhà phát triển trò chơi thất nghiệp.

Nói rõ một chút: tôi thực ra rất mừng vì chất lượng của những trò chơi do tôi vibe coding ra rất kém. Đối với một máy đếm calo hoàn toàn miễn phí, được tùy chỉnh cho cá nhân tôi, có lẽ tôi còn có thể biện hộ cho mình: xét cho cùng không ai chuyên tạo cho tôi một công cụ như vậy. Nhưng nếu là trò chơi, tôi thích dành thời gian ủng hộ những nhà sáng tạo thực sự là con người hơn.

Câu hỏi Liên quan

QTác giả đã tạo ra bao nhiêu ứng dụng Android với Google AI Studio trong một buổi chiều?

ATác giả đã tạo ra ba ứng dụng Android: một game phiêu lưu chữ, một máy tính calo và một game platform nhỏ giống Super Mario.

QQuá trình từ lúc nhập gợi ý đến khi có ứng dụng chạy trên điện thoại mất bao lâu và yêu cầu gì?

AChỉ mất khoảng 10 phút. Yêu cầu duy nhất là bật chế độ gỡ lỗi USB trên điện thoại Android và kết nối điện thoại với máy tính.

QỨng dụng game MOOD được tạo ra có những vấn đề gì nổi bật?

AGame MOOD có cốt truyện sơ sài, chỉ có 11 phòng, người chơi có thể đánh bại trùm cuối quá dễ dàng, và các 'bí mật' được hứa hẹn thì lại bị lộ quá rõ ràng thông qua các nút phát sáng.

QVấn đề chính với ứng dụng máy tính calo là gì?

AỨng dụng máy tính calo ban đầu cố gắng gọi API trả phí của Gemini, và ngay cả khi sửa lỗi này, nó vẫn đánh giá lượng calo của nhiều loại thực phẩm thấp hơn nhiều so với thực tế, chẳng hạn như trân châu đường đen và gà rán Đài Loan.

QBài viết đưa ra nhận định chính nào về khả năng hiện tại của AI trong việc tạo ứng dụng?

AAI có thể nhanh chóng tạo ra các ứng dụng 'chạy được', nhưng khó tạo ra sản phẩm đáng tin cậy, chính xác và dễ sử dụng. Khoảng cách từ 'tạo ra một ứng dụng' đến 'tạo ra một ứng dụng tốt' vẫn cần kinh nghiệm chuyên môn, đánh giá thẩm mỹ và vòng lặp cải tiến của con người.

Nội dung Liên quan

Báo Buổi Sáng | Michael Saylor Cập Nhật Thông Tin Bitcoin Tracker; Aave Công Bố Điều Tra Sự Kiện Tấn Công Cầu Kelp rsETH; Gravity Bridge Tạm Ngừng Dịch Vụ Sau Khi Bị Tấn Công

Dưới đây là tóm tắt những tin tức chính về tiền điện tử và blockchain trong 24 giờ qua: **Tin tức quan trọng:** * **Quy định & Chấp thuận:** Công ty tài sản số Laser Digital nhận được phê chuẩn có điều kiện từ OCC để thành lập một ngân hàng ủy thác liên bang. Việt Nam đang xem xét cho phép doanh nghiệp vừa và nhỏ dùng tài sản số, tài sản ảo làm tài sản thế chấp cho vay ngân hàng. * **Sự cố bảo mật:** Gravity Bridge thuộc hệ sinh thái Cosmos đã bị tấn công và tạm dừng dịch vụ. Aave đã công bố báo cáo điều tra sau sự cố tấn công vào cầu Kelp rsETH, nhấn mạnh lỗ hổng nằm ở cơ sở hạ tầng cầu của bên thứ ba. * **Thị trường & Cá nhân:** Chủ tịch Ủy ban Chứng khoán Hồng Kông cho biết khối lượng giao dịch trên 12 nền tảng tài sản ảo được cấp phép trong quý I/2026 tăng gần gấp ba lần. Michael Saylor tiếp tục đăng thông tin về Bitcoin Tracker, dự kiến công bố dữ liệu mua vào trong tuần tới. * **Quan điểm & Pháp lý:** Cố vấn Cục Dự trữ Liên bang Mỹ (Fed) Christopher Waller nhận định sự phổ biến của stablecoin có thể khuếch đại tầm ảnh hưởng chính sách của Fed. Một vụ án tại Trung Quốc xác định Bitcoin là tài sản có giá trị và kết án tù một đối tượng vì đánh cắp 107 BTC. SEC Mỹ đã khởi kiện người sáng lập Privvy về một vụ lừa đảo tiền điện tử trị giá 12,3 triệu USD. * **Phân tích thị trường:** Santiment chỉ ra tỷ lệ Long/Short Bitcoin đạt mức cao nhất trong năm, cảnh báo có thể điều chỉnh ngắn hạn. Tâm lý thị trường xung quanh Ethereum đã chuyển từ FOMO sang FUD. **Meme Token nổi bật (24h):** * **Ethereum:** HEX, SHIB, LINK, PEPE, UNI. * **Solana:** TROLL, WORLDCUP, neet, Buttcoin, PBTC. * **Base:** toby, ELSA, cbETH, CYPR, ALB. **Bài viết đáng chú ý:** Một bài viết nhìn lại các dự đoán về ChatGPT từ năm 2023 sau ba năm phát triển của AI.

链捕手38 phút trước

Báo Buổi Sáng | Michael Saylor Cập Nhật Thông Tin Bitcoin Tracker; Aave Công Bố Điều Tra Sự Kiện Tấn Công Cầu Kelp rsETH; Gravity Bridge Tạm Ngừng Dịch Vụ Sau Khi Bị Tấn Công

链捕手38 phút trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

Bản tóm tắt sự kiện Web3 đáng chú ý tháng 6: Thị trường tiền mã hóa tháng 6 tập trung vào các yếu tố chính: dữ liệu kinh tế vĩ mô của Mỹ (như CPI, phi nông nghiệp), quyết định lãi suất từ Cục Dự trữ Liên bang Mỹ (FOMC), Ngân hàng Trung ương Châu Âu và Ngân hàng Nhật Bản, tiếp tục ảnh hưởng đến kỳ vọng thanh khoản và tâm lý thị trường. Một số dự án như SUI, ENA sẽ có đợt mở khóa token, cần lưu ý rủi ro tiềm ẩn. Về tin tức sản phẩm, Coinbase dự kiến ra mắt hợp đồng tương lai chỉ số chứng khoán, trong khi CME Group lên kế hoạch cho hợp đồng tương lai chỉ số tiền mã hóa Nasdaq. Tình trạng thanh lý dự án vẫn tiếp diễn, với các dịch vụ như trình duyệt Bitcoin Ordinals (Ord.io) ngừng hoạt động, người dùng cần chú ý đến việc rút và di chuyển tài sản. Các sự kiện công nghệ và truyền thống đáng chú ý khác bao gồm World Cup, Hội nghị Nhà phát triển Toàn cầu của Apple (WWDC26), SpaceX lên sàn chứng khoán, và thượng hội IPO của công ty robot Unitree. Tóm lại, tháng 6 hứa hẹn tiếp tục là giai đoạn thị trường tìm kiếm phương hướng mới dưới tác động của kỳ vọng thanh khoản, biến động chính sách và sự luân chuyển trong hệ sinh thái.

marsbit1 giờ trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

Tuần cuối tháng 5, hai sự kiện AI liền kề đã phơi bày hai cách tiếp cận khác biệt của các gã khổng lồ công nghệ Trung Quốc. Alibaba tập trung vào tích hợp và thương mại hóa AI. Họ kết nối ứng dụng Qwen với Taobao, cho phép mua sắm và sử dụng các tính năng AI như thử đồ, so giá. Tổ chức được tái cấu trúc để tập trung vào AI, với động lực rõ ràng từ thị trường vốn. Doanh thu bên ngoài của Alibaba Cloud tăng 40%, cho thấy chiến lược "lắp AI vào quầy thu ngân" đang tạo ra dòng tiền. Tuy nhiên, cách tiếp cận thực dụng này có thể đi kèm rủi ro nếu có sự chênh lệch lớn về năng lực mô hình nền trong tương lai. Ngược lại, ByteDance theo đuổi giới hạn công nghệ thông qua bộ phận Seed. Họ đạt được thành tích đỉnh cao với mô hình tạo video Seedance 2.0 và đầu tư mạnh vào nghiên cứu cơ bản, thu hút nhân tài với các mục tiêu thuần túy học thuật. Ngân sách vốn (capex) của ByteDance được báo cáo là tăng vọt, lên tới 4700 tỷ NDT vào năm 2026, được tài trợ chủ yếu từ lợi nhuận. Lợi thế lớn của họ là không bị áp lực thị trường công khai, cho phép tập trung vào nghiên cứu dài hạn. Bài viết chỉ ra rằng sự khác biệt chiến lược này không chỉ là triết lý, mà chủ yếu bị chi phối bởi việc công ty có niêm yết hay không. Các công ty đại chúng như Alibaba chịu áp lực phải thể hiện kết quả tài chính ngắn hạn, dẫn đến chiến lược "bán AI". Các công ty chưa niêm yết như ByteDance có "sự xa xỉ" để "làm AI" và tập trung vào đột phá công nghệ. Tương lai của con đường nghiên cứu dài hạn tại ByteDance có thể được kiểm chứng nếu công ty này tiến hành IPO.

marsbit2 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

marsbit2 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit3 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 839Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2025.03.21

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片