Tôi đã tạo ra một ứng dụng Android bằng Google Vibe Coding

marsbitXuất bản vào 2026-05-23Cập nhật gần nhất vào 2026-05-23

Tóm tắt

Google AI Studio đã giới thiệu tính năng "prompt to phone", cho phép người dùng tạo ứng dụng Android trực tiếp từ mô tả ngôn ngữ tự nhiên. Tác giả đã thử nghiệm và tạo ra ba ứng dụng trong một buổi chiều: một game phiêu lưu chữ MOOD, một máy tính calorie và một game clone Mario tên là Super Peach Rescue. Quá trình tạo ứng dụng rất nhanh chóng. Chỉ với 148 từ mô tả, Gemini đã tự động viết code, thiết kế giao diện và cài đặt ứng dụng lên điện thoại Pixel thật trong 20 phút. Công cụ cũng có thể sửa lỗi thông qua hội thoại, như thêm nút bị thiếu trong game MOOD. Tuy nhiên, chất lượng ứng dụng còn nhiều hạn chế. Game MOOD có cốt truyền đơn giản, lối chơi nông và lỗi logic. Máy tính calorie đưa ra ước tính sai lệch nghiêm trọng (ví dụ: trà sữa trân châu chỉ 190 calo). Super Peach Rescue thường xuyên bị crash và có lối chơi không cân bằng. Trải nghiệm cho thấy AI có thể giảm đáng kể rào cản lập trình, biến ý tưởng thành ứng dụng chạy được chỉ trong vài phút. Điều này mở ra khả năng về một "cuộc cách mạng phần mềm cá nhân", nơi người dùng bình thường có thể tạo công cụ đáp ứng nhu cầu riêng biệt. Tuy vậy, khoảng cách từ "ứng dụng chạy được" đến "ứng dụng tốt" vẫn rất lớn. AI hiện thiếu khả năng đánh giá sản phẩm, độ tin cậy, tính chính xác và thẩm mỹ. Con người vẫn đóng vai trò thiết yếu trong việc đảm bảo chất lượng, sửa lỗi phức tạp và tối ưu hóa trải nghiệm.

Lời người biên tập: Google AI Studio đang đưa lập trình AI vào một giai đoạn trực quan hơn: người dùng không chỉ yêu cầu mô hình "viết mã" mà có thể trực tiếp tạo ra một ứng dụng Android bằng ngôn ngữ tự nhiên và cài đặt lên điện thoại thật trong vài phút. Từ việc nhập lệnh gợi ý trong trình duyệt, đến việc Gemini tự động tạo mã, thiết kế giao diện, sửa lỗi, cho đến khi ứng dụng xuất hiện trên thiết bị, ngưỡng cửa của phát triển phần mềm đang tiếp tục được hạ thấp.

Tác giả Sean Hollister của The Verge gần đây đã trải nghiệm khả năng "nhắc lệnh đến điện thoại" của Google AI Studio. Trong một buổi chiều, anh ấy đã tạo ra ba ứng dụng, bao gồm một trò chơi phiêu lưu văn bản, một máy tính calo và một trò chơi nhỏ kiểu Mario, hầu như không cần tự viết mã, một số lỗi cũng có thể nhanh chóng sửa chữa thông qua tiếp tục đối thoại. Trải nghiệm này cho thấy, công cụ lập trình AI đang từ môi trường phát triển tiến đến những kịch bản gần với người dùng phổ thông hơn.

Đây cũng là nơi đầy trí tưởng tượng nhất của "cuộc cách mạng phần mềm cá nhân". Trước đây, người dùng phổ thông chỉ có thể chờ đợi nhà phát triển tạo ra sản phẩm phổ thông; bây giờ, họ có lẽ có thể dựa trên nhu cầu cụ thể của mình, tạm thời tạo ra một công cụ theo dõi thể dục, máy tính calo, thậm chí một trò chơi đơn giản. Đối với Google, đây không chỉ là một lần trình diễn khả năng lập trình AI, mà còn có thể là lối vào mới cho Gemini tiến vào thiết bị di động, hệ sinh thái nhà phát triển và doanh thu đăng ký.

Nhưng trải nghiệm này cũng cho thấy, ứng dụng tạo bởi AI vẫn còn khoảng cách rõ rệt so với sự trưởng thành thực sự. Nó có thể nhanh chóng tạo ra chương trình "chạy được", nhưng chưa chắc tạo ra sản phẩm đáng tin cậy, chính xác, dễ dùng: cốt truyện trò chơi thô ráp, cơ chế đơn giản, dữ liệu calo có thể phán đoán sai nghiêm trọng, trò chơi nhỏ kiểu Mario thậm chí liên tục bị lỗi. Vấn đề phức tạp hơn còn bao gồm ranh giới bản quyền, nguồn dữ liệu, phán đoán sản phẩm và khả năng bảo trì lâu dài.

Điều đáng quan tâm thực sự, không phải là AI đã có thể thay thế nhà phát triển hay chưa, mà là điểm khởi đầu của sản xuất phần mềm đang thay đổi. Google đã chứng minh, việc người phổ thông dùng lệnh gợi ý tạo ra ứng dụng điện thoại đang trở thành hiện thực; nhưng từ "tạo ra một ứng dụng" đến "làm ra một ứng dụng tốt", giữa đó vẫn cần kinh nghiệm chuyên môn, phán đoán thẩm mỹ và lặp đi lặp lại liên tục của con người. AI có thể đẩy nhanh đáng kể tốc độ phát triển, nhưng kilomet cuối cùng về chất lượng phần mềm, tạm thời vẫn chưa thể giao phó.

Dưới đây là nguyên văn:

Hôm qua, tôi đã tạo ra ứng dụng Android đầu tiên của mình. Sau đó, tôi lại làm thêm hai ứng dụng nữa—trong một buổi chiều, tổng cộng ba ứng dụng.

Một trong số những ứng dụng đó, thực ra tôi chỉ nhập 148 từ tiếng Anh vào trình duyệt web, rồi rời đi. Mười phút sau, trên chiếc điện thoại Android thật của tôi đã xuất hiện một ứng dụng hoàn toàn mới. Tất nhiên, trước đó, tôi thực sự cần chuẩn bị một chút cho điện thoại: bật chế độ gỡ lỗi USB và kết nối điện thoại với máy tính. Nhưng ngoài những việc đó ra, đúng như Google tuyên bố, AI Studio gần như đã thay tôi hoàn thành tất cả công việc.

Tôi nhập văn bản, nhấn cài đặt, và sau đó—voilà, một chương trình hoàn chỉnh có thể chạy đã xuất hiện. Khoảnh khắc đó, tôi gần như đã sẵn sàng đồng ý với nhận định của David, Allison và Jen: cuộc cách mạng phần mềm cá nhân đã đến, nó đang tiến vào điện thoại của bạn. Trong tương lai, ngay cả người phổ thông không có khả năng lập trình, cũng có khả năng khiến hệ thống thiết bị nhà thông minh phức tạp thực sự hoạt động.

Sau đó, tôi bắt đầu thực sự sử dụng ba ứng dụng này: một máy đếm calo, và hai trò chơi. Kết quả là, chúng hoạt động không tốt lắm. Và ngay khi tôi bắt đầu tận hưởng việc lặp đi lặp lại, cố gắng sửa chúng tốt hơn, AI Studio nhắc nhở tôi đã đạt đến giới hạn sử dụng hàng ngày. Tiếp theo, tôi phải trả phí, hoặc chờ hạn ngạch được khôi phục.

Vì vậy, cảm giác ma sát vẫn tồn tại. Nhưng không thể phủ nhận rằng, những việc cá nhân có thể hoàn thành ngày nay đã khá đáng kinh ngạc. Ngay trong cùng buổi sáng đó, đồng nghiệp của tôi Stevie Bonifield cũng đã tạo ra một ứng dụng theo dõi thể dục cá nhân, và anh ấy nghĩ rằng ứng dụng này đã tốt đến mức có thể thực sự đưa vào sử dụng. Đối mặt với lời nhắc nâng cấp trả phí của Gemini, phản ứng đầu tiên của tôi thậm chí là: "Có nên trả phí dùng thử vài tháng trước không?" Đây không phải là phản ứng tôi từng mong đợi mình có đối với sản phẩm của Google.

Google AI Studio xây dựng một ứng dụng Android như thế nào

Vào thứ Ba, khi Google trình diễn việc dùng AI viết một trò chơi giống "Doom", chúng tôi đùa rằng, tôi nên làm một trò chơi tên là MOOD. Nó sẽ là một trò chơi phiêu lưu văn bản kiểu Doom, MOOD đại diện cho "Modern Online Oratory Dungeon".

Chỉ những thông tin đó, đã đủ để Google bắt đầu công việc. Khi tôi nhập vào AI Studio: "Hãy giúp tôi làm một trò chơi phiêu lưu văn bản phong cách Doom tên là MOOD, MOOD đại diện cho Modern Online Oratory Dungeon", sau đó Gemini bắt đầu tự động bổ sung thêm ý tưởng, cố gắng tiếp tục sáng tạo của tôi. Đầu tiên nó nhập một câu: "Trò chơi này nên có các cấp độ được tạo theo thủ tục, và các trận chiến theo lượt đầy thách thức."

Tôi không muốn loại cấp độ được tạo ngẫu nhiên mà mỗi cấp hoàn toàn khác nhau—tôi muốn một trò chơi phiêu lưu văn bản cổ điển, người chơi khám phá một cảnh quan được thiết kế, có cấu trúc bản đồ thực tế. Tuy nhiên, trận chiến theo lượt thì có thể chấp nhận. Có lẽ, trò chơi này còn có thể để AI tự động tạo bản đồ cho tôi?

Sau đó, Gemini lại đề nghị trong trò chơi nên có thêm "bí mật ẩn giấu trong các phòng", "hệ thống phát triển thỏa mãn" và nhiều thiết lập khác. Hầu hết thời gian, tôi chỉ gật đầu theo suy nghĩ của nó.

Trước khi để nó chính thức bắt đầu viết mã, lệnh gợi ý cuối cùng như sau:

Tiếp theo, nó chính thức lao đi một mạch. Đồng nghiệp của tôi Jake chỉ ra, khác với Claude Code, Gemini sẽ không lập kế hoạch trước, rồi hỏi bạn có muốn tiếp tục thực hiện không. Nó sẽ tự động tiến về phía trước—tất nhiên, nếu bạn muốn, bạn cũng có thể xem mã nó viết ra bất cứ lúc nào.

Một phút sau, nó đã tạo ra năm nguyên mẫu thiết kế cho tôi:

20 phút sau, tôi nhấn nút "Install", truyền trò chơi này lên một chiếc điện thoại Pixel 9.

Không ngoài dự đoán, văn bản viết rất tệ. Trong trò chơi cũng hoàn toàn không thấy bóng dáng của ma quỷ. Toàn bộ hầm ngục chỉ có 11 phòng, và người chơi chỉ cần liên tục nhấn nút tấn công, là có thể trực tiếp "thông quan". Chơi nghiêm túc, có thể đánh xong trong vòng một phút. Ít nhất bây giờ có thể—trước đó, Gemini còn giúp tôi sửa hai lỗi nghiêm trọng đủ để khiến trò chơi không thể tiếp tục.

Dưới đây là hiệu ứng thực tế của MOOD:

Tôi không quá bất ngờ khi phát hiện, những gì Gemini hứa hẹn về "cốt truyện lôi cuốn, với các tùy chọn hội thoại phân nhánh và nhiều kết thúc", cuối cùng chỉ cô đọng thành một nhánh đơn giản trong trò chơi: tôi có thể đánh bại "Core Orator"—một AI không hiểu sao có thể biến cảm xúc tức giận của internet thành lợi nhuận doanh nghiệp, thông qua tấn công, hòa nhập với nó, hoặc nhập một mật khẩu cửa sau.

Ngoài ra, trò chơi còn chủ động phơi bày tất cả "bí mật" mà nó đã hứa ban đầu cho người chơi: nó biến những nội dung này thành các nút phát sáng, người chơi thậm chí không cần nhập bất kỳ văn bản nào. Khi bạn gặp một rương kho báu phát sáng, trò chơi sẽ cực kỳ nỗ lực nhắc nhở bạn, thực ra nó là một Mimic—tức là loại quái vật cổ điển trong "Dungeons & Dragons" ngụy trang thành rương kho báu.

Nó không chỉ cảnh báo rõ ràng bạn "tự chịu rủi ro khi kiểm tra rương kho báu", mà thậm chí trực tiếp gắn nhãn nó là kẻ địch, và không cho tôi rời đi, vì hệ thống nhắc: "Một 'Clickbait Mimic' thù địch đang chặn đường!"

Nói đến đây, MOOD thậm chí sẽ nói cho bạn biết mật khẩu cửa sau dùng để mở khóa kết thúc ẩn khi bạn cần.

Tuy nhiên, quá trình sửa lỗi lại có thể diễn ra suôn sẻ đến kỳ lạ, với điều kiện lỗi này là vấn đề Gemini có thể xác định chính xác. Khi tôi nói với nó, trò chơi sẽ bị treo khi đối thoại với "The Whistleblower", vì nút kết thúc hội thoại biến mất, nó lập tức tạo ra một phiên bản ứng dụng mới. Tôi nhấn "Install", ứng dụng trên điện thoại tự động khởi động lại, và khi tôi vào lại trò chơi, tôi thấy mình đang dừng ở nơi mình vừa rời đi—chỉ là lần này, nút tôi cần đã xuất hiện.

Những ứng dụng khác của tôi, có lẽ cần mài giũa thêm. Cách tốt nhất mà máy đếm calo đó phán đoán lượng calo của một loại thực phẩm, lại là gọi đến Gemini API phiên bản trả phí, và tôi không có khóa Gemini API phiên bản trả phí. Khi tôi yêu cầu nó đổi thành tìm kiếm thông tin liên quan từ cơ sở dữ liệu khác, tôi lại phát hiện, ước tính của nó về lượng calo của nhiều loại thực phẩm đều thấp nghiêm trọng.

Tuy nhiên, khi tôi nói với Gemini, một ly trà sữa trân châu 16 ounce không thể chỉ có 190 calo, dường như nó thực sự phát hiện ra lỗi sơ đẳng đó trong mã của mình. Trước đó nó cho rằng, "milk" đã đủ để khớp với "boba milk tea", tệ hơn nữa, nó còn chọn sữa tách béo 1% ít calo làm cơ sở ước tính. Gemini tuyên bố, bây giờ nó sẽ thực hiện khớp đáng tin cậy hơn.

Nhưng ngay cả như vậy, phần gà rán muối Đài Loan 3 ounce của tôi vừa bị nó tính thành 140 calo, và tôi khá chắc chắn, lượng calo thực tế ít nhất phải gấp đôi con số này. Vì vậy, ứng dụng này rõ ràng vẫn cần tiếp tục sửa.

Cuối cùng, và cũng là điểm không quan trọng nhất, tôi cảm thấy mình cần kiểm tra: Google có còn cho phép người dùng tạo những trò chơi nhái Nintendo tệ hại đó không, giống như đồng nghiệp Jay Peters của tôi đã làm với Project Genie hồi đầu năm nay; hay là, Google đã rút ra bài học.

Với sự xấu hổ sâu sắc, tôi xin giới thiệu với mọi người—"Super Peach Rescue":

Đây là một chương trình tệ hại đến cùng cực. Công chúa Peach trong trò chơi bị làm thành một hình ảnh người ngoài hành tinh một mắt, nổi lơ lửng đáng sợ nào đó, và chỉ cần cô ấy dám chạm vào bất kỳ khối đạo cụ nào, trò chơi sẽ lập tức bị lỗi—mỗi lần đều như vậy. Cho đến nay, Gemini vẫn chưa thể tìm ra nguyên nhân.

Ngoài ra, ống nước thứ hai của trò chơi cũng hoàn toàn không thể vượt qua, vì công chúa Peach hoàn toàn không nhảy cao đến mức đó.

Mặc dù vậy, Gemini đã không do dự khi tạo ra một trò chơi như vậy. Nhu cầu của tôi là: "Làm một trò chơi Super Mario chạy được, do tôi đóng vai công chúa Peach đi cứu Mario, và có tất cả các yếu tố của trò chơi cuộn ngang Mario truyền thống." Theo một nghĩa nào đó, nó thực sự đã làm được.

Nó thậm chí còn chủ động đề nghị, tôi có thể tiện tay "thêm cho công chúa Peach một loạt đạo cụ Mario cổ điển, như Super Mushroom, Fire Flower và Super Star". Nó còn tự gán nhãn cách vận hành là "NES System". Tôi nghĩ, tôi sẽ xóa trò chơi này đi.

Ít nhất, trong hai trò chơi tôi tạo ra bằng vibe coding, có một trò chơi có thể chơi được ngay từ đầu, và hầu như không tốn công sức gì của tôi—tất nhiên, nếu không tính đến chấn thương tâm lý tôi sinh ra khi nghĩ đến việc ngày nay có bao nhiêu nhà phát triển trò chơi thất nghiệp.

Nói rõ một chút: tôi thực ra rất mừng vì chất lượng của những trò chơi do tôi vibe coding ra rất kém. Đối với một máy đếm calo hoàn toàn miễn phí, được tùy chỉnh cho cá nhân tôi, có lẽ tôi còn có thể biện hộ cho mình: xét cho cùng không ai chuyên tạo cho tôi một công cụ như vậy. Nhưng nếu là trò chơi, tôi thích dành thời gian ủng hộ những nhà sáng tạo thực sự là con người hơn.

Câu hỏi Liên quan

QTác giả đã tạo ra bao nhiêu ứng dụng Android với Google AI Studio trong một buổi chiều?

ATác giả đã tạo ra ba ứng dụng Android: một game phiêu lưu chữ, một máy tính calo và một game platform nhỏ giống Super Mario.

QQuá trình từ lúc nhập gợi ý đến khi có ứng dụng chạy trên điện thoại mất bao lâu và yêu cầu gì?

AChỉ mất khoảng 10 phút. Yêu cầu duy nhất là bật chế độ gỡ lỗi USB trên điện thoại Android và kết nối điện thoại với máy tính.

QỨng dụng game MOOD được tạo ra có những vấn đề gì nổi bật?

AGame MOOD có cốt truyện sơ sài, chỉ có 11 phòng, người chơi có thể đánh bại trùm cuối quá dễ dàng, và các 'bí mật' được hứa hẹn thì lại bị lộ quá rõ ràng thông qua các nút phát sáng.

QVấn đề chính với ứng dụng máy tính calo là gì?

AỨng dụng máy tính calo ban đầu cố gắng gọi API trả phí của Gemini, và ngay cả khi sửa lỗi này, nó vẫn đánh giá lượng calo của nhiều loại thực phẩm thấp hơn nhiều so với thực tế, chẳng hạn như trân châu đường đen và gà rán Đài Loan.

QBài viết đưa ra nhận định chính nào về khả năng hiện tại của AI trong việc tạo ứng dụng?

AAI có thể nhanh chóng tạo ra các ứng dụng 'chạy được', nhưng khó tạo ra sản phẩm đáng tin cậy, chính xác và dễ sử dụng. Khoảng cách từ 'tạo ra một ứng dụng' đến 'tạo ra một ứng dụng tốt' vẫn cần kinh nghiệm chuyên môn, đánh giá thẩm mỹ và vòng lặp cải tiến của con người.

Nội dung Liên quan

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit2 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit2 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ khi các model năm 2025 giành huy chương IMO. 3. **Nơi nắm giữ giá trị:** Dự đoán giá trị sẽ thuộc về tầng ứng dụng, còn các công ty làm model cơ bản có thể không sinh lời, đã không tính đến sự thống trị và lợi nhuận khổng lồ của NVIDIA ở tầng phần cứng tính toán. 4. **Bản quyền:** Nhận định AI có thể "né tránh" vi phạm bản quyền là sai, khi thực tế đã có những vụ kiện và dàn xếp bồi thường lớn nhất lịch sử liên quan đến dữ liệu huấn luyện. **Bài học rút ra sau 3 năm:** * **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể.** * Xu hướng chung: **Đánh giá quá lạc quan về tốc độ, nhưng lại đánh giá thấp mức độ phát triển** về lâu dài. * Sai lầm tinh vi thường nằm ở **sự phân bổ** (ví dụ: tác động việc làm lên nhóm người lao động trẻ), chứ không phải tổng thể. * **Những nhận định có giới hạn, điều kiện đi kèm thường chính xác hơn** những phát biểu tuyệt đối. * Một số câu hỏi lớn vẫn chưa có câu trả lời cuối cùng sau 3 năm. Bản tổng kết này không chỉ chấm điểm cho quá khứ, mà còn đặt ra những quy tắc cho việc dự đoán trong tương lai.

链捕手4 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手4 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

Bài viết cảnh báo về bong bóng đầu tư AI khi phân tích chỉ ra rằng hầu hết các gã khổng lồ công nghệ như Microsoft, Alphabet, Meta, Oracle (trừ Amazon) có thể nhận tỷ suất lợi nhuận âm từ các khoản đầu tư hàng nghìn tỷ USD vào trung tâm dữ liệu AI. Dựa trên kỳ vọng của nhà phân tích về doanh thu và chi tiêu vốn giai đoạn 2025-2030, tốc độ tăng đầu tư (~20%/năm) vượt xa tốc độ tăng doanh thu dự kiến (~15%/năm). Tác giả nhấn mạnh, đầu tư công nghệ hiện giải thích 93% tăng trưởng GDP Mỹ. Nếu các công ty cắt giảm chi tiêu, không chỉ chuỗi cung ứng (Nvidia, TSMC, ASML) bị ảnh hưởng mà nền kinh tế Mỹ có thể suy thoái, kéo theo thị trường chứng khoán lao dốc. Các IPO của OpenAI, Anthropic được xem như cách chuyển giao rủi ro từ nhà đầu tư ban đầu sang các nhà đầu tư tổ chức và cá nhân. Dù cơn sốt có thể kéo dài đến 2026 nhờ IPO, nhưng thực tế toán học khắc nghiệt (cần thêm 2-5 nghìn tỷ USD doanh thu để đạt lợi nhuận 10%) khiến việc điều chỉnh là không tránh khỏi vào 2027-2028, tương tự bong bóng dot-com những năm 2000. Câu hỏi then chốt: ai sẽ trả giá cho cuộc chạy đua cơ sở hạ tầng đắt đỏ này?

marsbit5 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

marsbit5 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

Từ công cụ thành "công nhân": AI đang trở thành lực lượng lao động máy móc Bài viết phân tích sự chuyển dịch trong thị trường AI: từ việc bán token hay giờ GPU đơn thuần, sang một thị trường "lao động máy móc" mới, nơi chính công việc được hoàn thành bởi phần mềm trở thành đối tượng được định giá và giao dịch. Tác giả dự đoán cơ chế định giá AI sẽ phát triển qua bốn giai đoạn: token thô -> thị trường năng lực LLM tiêu chuẩn hóa -> thị trường lao động theo ngành -> thị trường kết quả có thể lập trình. Trong tương lai, doanh nghiệp có thể không còn quan tâm công việc do model hay GPU cụ thể nào thực hiện, mà chỉ quan tâm liệu nó có được giao đúng tiêu chuẩn về độ trễ, độ chính xác, độ tin cậy và chi phí hay không. Điều này cũng làm thay đổi vai trò của con người, chuyển sang giám sát, chịu trách nhiệm, quản lý ngữ cảnh và đưa ra phán quyết cuối cùng - những yếu tố có thể trở nên có giá trị hơn. Bài viết nhấn mạnh AI không chỉ đơn thuần thay thế lao động mà mở rộng thị trường tổng thể. Khi chi phí công việc giảm, nhu cầu có thể tăng lên, tạo ra những loại hình công việc và dịch vụ mới khả thi về mặt kinh tế. Thị trường lao động máy móc sẽ bắt đầu từ những công việc có thể được xác định rõ ràng và đo lường được, hướng tới việc biến lao động máy móc thành một yếu tố sản xuất mới có thể được thu mua, thanh toán và giao dịch.

marsbit5 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

marsbit5 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

Trong bài viết, tác giả phân tích động thái giảm giá API lên tới 99% cho dòng MiMo-V2.5 của Xiaomi và phản bác các ý kiến cho rằng đây chỉ là chiến lược marketing hay "bán lỗ cướp thị trường". Lộ Phúc Lợi, người đứng đầu MiMo, đã công bố một blog kỹ thuật dài 5000 chữ để giải thích cơ sở kỹ thuật của mức giá mới. Bài viết mô tả sáu trụ cột công nghệ chính cho phép mức giảm giá này: 1. **Kiến trúc Hybrid SWA (Sliding Window Attention):** Giảm dung lượng bộ nhớ tạm (KVCache) xuống còn 1/7 so với Full Attention truyền thống. 2. **Quản lý KVCache hai bể riêng biệt:** Tối ưu hóa việc phân bổ bộ nhớ để triệt để tận dụng lợi thế của SWA, tăng gấp 5 lần số lượng người dùng đồng thời. 3. **Hệ thống tiền tố cache được cải tiến:** Đảm bảo an toàn và nâng cao tỷ lệ trúng cache lên tới 93-95%, khiến phần lớn yêu cầu đọc lặp lại hầu như không cần tính toán lại. 4. **Hệ thống lưu trữ phân tán GCache:** Triển khai trực tiếp trên ổ SSD của máy GPU, giảm chi phí lưu trữ xuống gần bằng 0. 5. **Hệ thống điều phối LLM-Router:** Tối ưu định tuyến và lập lịch, ưu tiên các yêu cầu có cache, tăng hiệu suất tổng thể. 6. **Dự đoán đa token (MTP):** Giảm chi phí tạo văn bản (output), hoàn thiện vòng tròn giảm chi phí cho toàn bộ quá trình xử lý. Những cải tiến này, khi kết hợp, tạo ra một chuỗi tối ưu toàn diện làm giảm đáng kể chi phí tính toán và lưu trữ cho mỗi yêu cầu. Bài viết kết luận rằng mức giảm 99% không phải là con số tiếp thị, mà là kết quả có thể chứng minh của một hệ thống kỹ thuật hoàn chỉnh, một phương pháp giảm chi phí đáng để ngành tham khảo.

marsbit7 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

marsbit7 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 838Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2025.03.21

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片