AI Trung Quốc bùng nổ: Trí Phổ vốn hóa vượt 430 tỷ HKD, mô hình bí ẩn đứng đầu bảng sinh video từ văn bản

marsbitXuất bản vào 2026-04-10Cập nhật gần nhất vào 2026-04-10

Tóm tắt

Cổ phiếu AI tại thị trường Trung Quốc và Hồng Kông bùng nổ, với thị giá của Trí Phổ (Zhipu) vượt 430 tỷ HKD. Nguyên nhân chính đến từ hai mô hình AI mới: GLM-5.1 của Trí Phổ và HappyHorse-1.0 ẩn danh. GLM-5.1 gây ấn tượng với khả năng làm việc liên tục 8 giờ như một kỹ sư phần mềm, tự lập kế hoạch, thực thi và sửa lỗi. Nó đạt 58.4 điểm trên bảng SWE-bench Pro, vượt qua các mô hình quốc tế như Claude Opus 4.6 và GPT-5.4. Đáng chú ý, nó được đào tạo hoàn toàn trên chip Huawei Ascend 910B, đánh dấu bước tiến trong hành trình tự chủ AI của Trung Quốc. HappyHorse-1.0, được cho là từ Alibaba, đã đứng đầu bảng xếp hạng Video Arena của Artificial Analysis với điểm Elo 1357, vượt Seedance 2.0 của ByteDance. Mô hình này tạo video có âm thanh đồng bộ từ văn bản, hỗ trợ đồng bộ môi cho 7 ngôn ngữ, với thời gian tạo video 1080p chỉ khoảng 38 giây. Ngành công nghiệp AI được cho là đã bước sang giai đoạn mới, chuyển từ “cạnh tranh công nghệ” sang “tạo ra giá trị” và “giải phóng lợi nhuận”. Trí Phổ đã tăng giá API 10%, ngang bằng với đối thủ nước ngoài, phản ánh sự chuyển hướng sang mô hình kinh doanh bền vững. Các mô hình hàng đầu đã có người dùng sẵn sàng trả phí và phải xếp hàng chờ, cho thấy thị trường đã vượt qua giai đoạn giáo dục miễn phí thuần túy.

Mảng AI tại A-share và H-shares đồng loạt sôi sục.

Ngày 9/4, phân khúc mô hình lớn AI tại H-shares duy trì xu hướng mạnh, Tấn Tắc Kỹ Thuật (03317.HK) và Trí Phổ (02513.HK) đồng thời lập đỉnh kể từ khi lên sàn. Tính đến khi đóng cửa, Tấn Tắc Kỹ Thuật báo giá 288 HKD/cổ phiếu, tăng 24.03% so với phiên giao dịch trước đó, cao nhất trong ngày đạt 289.4 HKD/cổ phiếu, vốn hóa thị trường đạt 92.94 tỷ HKD; Trí Phổ báo giá 933 HKD/cổ phiếu, tăng 8.74%, cao nhất trong ngày chạm 998.5 HKD/cổ phiếu, vốn hóa thị trường từng lúc vượt 430 tỷ HKD. Sáng ngày 10/4, giá cổ phiếu Tấn Tắc Kỹ Thuật và Trí Phổ tiếp tục tăng, tính đến thời điểm đưa tin Tấn Tắc Kỹ Thuật tăng hơn 10%.

Mảng AI A-share bùng nổ trước. Ngày 8/4, ETF Trí Tuệ Nhân Tạo Chiêu Thương GEM (159243.SZ) tăng mạnh 10.05% cả ngày với khối lượng giao dịch lớn, các cổ phiếu thành phần như BlueFocus (300058.SZ), Yeahmobi (301171.SZ) dẫn đầu tăng, tâm lý giao dịch thị trường sôi động. Ngày 9/4, BlueFocus tiếp tục tăng, đóng cửa ở mức 16.58 CNY/cổ phiếu, tăng 1.66% so với ngày trước; chỉ số cơ sở ETF Trí Tuệ Nhân Tạo Chiêu Thương GEM tăng 9.47% trong ngày.

Về mặt thông tin, một mô hình sinh video từ văn bản HappyHorse-1.0 đã đứng đầu bảng xếp hạng nền tảng đánh giá uy tín Artificial Analysis, vượt qua Seedance 2.0 của ByteDance; Trí Phổ công bố mô hình flagship GLM-5.1 có thể làm việc liên tục 8 giờ. Các mô hình lớn Trung Quốc thể hiện năng lực công nghệ vượt kỳ vọng, đồng thời bước thương mại hóa tăng tốc đáng kể. Nhiều yếu tố xúc tác chồng chéo đã châm ngòi cho hàng loạt biến động thị trường vốn từ cơ sở hạ tầng tính toán đến thiết bị đầu cuối ứng dụng AI.

Liên quan đến vấn đề tăng giá tập thể gần đây của phân khúc, phóng viên Thời Đại Chu Báo đã gửi thư tới Yeahmobi và gọi điện cho BlueFocus, nhưng đến thời điểm đưa tin đều chưa nhận được phản hồi.

Phó giáo sư Hướng An Linh, Học viện Báo chí và Truyền thông Đại học Dân tộc Trung ương, nói với phóng viên Thời Đại Chu Báo rằng nhịp độ lặp lại mô hình AI hiện nay rõ ràng đã tăng tốc, hầu như ngày nào cũng có chức năng mới được phát hành, và sau mỗi khoảng thời gian lại có mô hình mới đứng đầu bảng xếp hạng đánh giá, trong đó không thiếu thành phần đầu cơ thị trường. Tuy nhiên, bà cũng chỉ ra rằng GLM-5.1 và HappyHorse-1.0 được phát hành lần này thực sự thể hiện những điểm sáng đáng chú ý về năng lực mô hình. Hướng An Linh nghiên cứu về AIGC, dữ liệu lớn truyền thông, v.v., chủ trì dự án Quỹ Khoa học Tự nhiên Quốc gia "Nhận diện rủi ro AIGC".

Hai mô hình lớn dựa vào đâu khiến tâm lý thị trường phấn chấn?

"Hiện nay để đánh giá AI mạnh hay không, có một chỉ số rất quan trọng, đó là xem nó có cần con người can thiệp không, có thể làm việc độc lập hay không." Hướng An Linh nói.

Bà cho rằng, đột phá lớn nhất của Trí Phổ GLM-5.1 là nó có thể làm việc liên tục 8 giờ như một kỹ sư phần mềm thực thụ, tự lập kế hoạch, thực thi, kiểm tra, sửa lỗi, và cuối cùng giao thành quả kỹ thuật hoàn chỉnh, toàn bộ quá trình hầu như không cần con người can thiệp.

Mô hình lớn trước đây giống như "lao động tạm thời" hơn, người dùng hỏi một câu nó trả lời một câu, hoặc viết xong một đoạn code thì dừng lại chờ người kiểm duyệt. Nhưng GLM-5.1 thì khác, nó có thể hiểu nhiệm vụ hoàn chỉnh phức tạp và tự sắp xếp việc cần làm trong 8 giờ tiếp theo, gặp nút thắt thì chủ động đổi phương án, gặp lỗi có thể tự sửa.

Về năng lực lập trình, trong bài kiểm tra chuẩn SWE-bench Pro mô phỏng sát cảnh phát triển phần mềm thực tế, GLM-5.1 đạt 58.4 điểm, vượt qua Claude Opus 4.6 (57.3 điểm) và GPT-5.4 (57.7 điểm), lần đầu tiên một mô hình mã nguồn mở Trung Quốc vượt qua các mô hình đóng hàng đầu nước ngoài ở chỉ số này. Quan trọng hơn, mô hình này hoàn toàn được huấn luyện dựa trên chip Huawei Ascend 910B, không sử dụng bất kỳ GPU nào của Nvidia, đây là cột mốc quan trọng trong quá trình tự chủ hóa AI của Trung Quốc. Thị trường nhìn thấy không chỉ là sự tiến bộ của một mô hình, mà là một vòng khép kín hoàn chỉnh "chip tính toán Trung Quốc + mô hình Trung Quốc" đang được thông suốt.

Mã đen khác cũng thể hiện không kém phần sáng giá. HappyHorse-1.0 xuất hiện bất ngờ dưới dạng ẩn danh vào đầu tháng 4/2026, đêm ngày 7/4 đã đứng đầu bảng xếp hạng Video Arena của nền tảng đánh giá AI uy tín Artificial Analysis, trong phân khúc chuyển văn bản thành video (không âm thanh), điểm Elo của nó (điểm xếp hạng tổng hợp thông qua các trận "đấu tay đôi" lặp lại, có thể phản ánh trực quan độ mạnh yếu của mô hình trong sở thích người dùng thực) tăng vọt lên 1357 điểm, dẫn trước mô hình Seedance 2.0 tới 84 điểm.

HappyHorse-1.0 có thể hoàn thành việc chuyển từ văn bản thành video một lần, và đồng thời xuất ra hình ảnh và âm thanh. Phần lớn AI sinh video truyền thống chỉ có hình ảnh không âm thanh, hiệu ứng âm thanh cần xử lý riêng ở khâu hậu kỳ, khó có thể khớp chính xác. HappyHorse-1.0 có thể tự động thêm âm thanh băng nứt vỡ, âm thanh bóng rổ vào rổ dựa trên mô tả cảnh, và hỗ trợ đồng bộ khẩu hình cho bảy ngôn ngữ.

Về hiệu suất tạo, HappyHorse-1.0 áp dụng thiết kế nhẹ, tham số chỉ 15 tỷ, thấp hơn nhiều so với các đối thủ cạnh tranh cùng loại. Nhờ công nghệ chưng cất DMD-2, HappyHorse-1.0 chỉ mất khoảng 38 giây để tạo một video độ nét cao 1080p, và chỉ 2 giây để tạo bản xem trước độ phân giải thấp.

Về đội ngũ đằng sau, mặc dù ban đầu bên chính thức không phản hồi, nhưng nhiều phương tiện truyền thông cho rằng đội ngũ đằng sau là Phòng thí nghiệm Cuộc sống Tương lai thuộc tập đoàn Taotian của Alibaba, người phụ trách chính là Trương Địch "cha đẻ của Kling", anh trở về Alibaba từ Kuaishou và chỉ mất 5 tháng để nghiên cứu và phát triển sản phẩm này. Cổ phiếu Alibaba H-shares (09988.HK) chịu ảnh hưởng của tin này, chiều ngày 7/4 đã tăng vọt hơn 7%.

Về vấn đề này, phóng viên Thời Đại Chu Báo đã xác nhận với phía Alibaba, đến thời điểm đưa tin chưa nhận được phản hồi.

Hướng An Linh cho biết, có thể có sự khác biệt giữa điểm số trên bảng xếp hạng và nhiệm vụ triển khai thực tế, cần thử nghiệm nhiều kịch bản hơn để xác minh. Ngoài ra, tốc độ lặp lại công nghệ hiện nay rất nhanh, mô hình mới có thể sớm vượt qua thành quả hiện có, do đó vẫn cần kiểm tra và quan sát liên tục thông qua thực tiễn.

AI đã vượt qua giai đoạn giáo dục thị trường

Liệu ngành công nghiệp AI đã bước vào chu kỳ mới "đơn hàng triển khai và giải phóng lợi nhuận" hay chưa, thị trường đang đưa ra ngày càng nhiều tín hiệu khẳng định.

Trí Phổ khi phát hành GLM-5.1 đồng thời công bố sẽ tăng giá dịch vụ API 10%, định giá cho kịch bản mã hóa đã ngang bằng với Claude Sonnet 4.6 của Anthropic. Đây là lần đầu tiên một mô hình lớn Trung Quốc đạt được sự đồng đều về giá với các nhà sản xuất hàng đầu nước ngoài trong kịch bản cốt lõi.

Về lý do tăng giá, phía Trí Phổ nói với phóng viên Thời Đại Chu Báo rằng chuỗi suy luận dài hơn, tiêu thụ token tăng, cùng với việc mô hình trở nên lớn hơn, chi phí suy luận tăng tương ứng, tăng giá là để đưa mô hình trở về giá trị thương mại bình thường.

Đằng sau đó là sự thay đổi logic ngành, Trí Phổ không còn lỗ để đổi đắp thị phần, mà bắt đầu định giá dựa trên chi phí và giá trị.

Eeo Intelligence trong "Báo cáo Nghiên cứu Insight Giá trị Triển khai Thương mại AI Toàn cầu 2026" đề xuất, ngành AI toàn cầu năm 2026 đang chuyển từ "cuộc đua công nghệ" sang "đồng sáng tạo giá trị", từ logic quy mô "chồng tính toán, chồng tham số" hướng tới logic hiệu quả "canh tác tinh tế, tạo ra lợi nhuận". Báo cáo giới thiệu hệ thống đánh giá VPT (giá trị trên mỗi token), nhấn mạnh doanh nghiệp cần đạt được lợi nhuận thông qua nâng cao tỷ lệ giá trị kinh tế so với tiêu thụ token.

Nói cách khác, sự đồng thuận ngành đang hình thành: AI không thể mãi mãi dừng lại ở giai đoạn đốt tiền xác minh, mà phải hướng tới mô hình kinh doanh bền vững.

Đánh giá của Hướng An Linh tương đối thận trọng nhưng rõ ràng: ngành tuy mới chỉ bước vào giai đoạn đầu, nhưng không còn là trạng thái đốt tiền thuần túy xác minh thị trường, quảng bá miễn phí như năm ngoái hoặc trước đó. Hiện nay đặc biệt là một số mô hình AI hàng đầu hoặc có tính độc quyền, đã bắt đầu biến hiện giá trị một cách có quy mô. Bà đưa ra hai ví dụ thực tế: sau khi Seedance 2.0 phát hành, với tư cách là thành viên trả phí, việc tạo một video cũng phải xếp hàng bốn năm tiếng; còn mô hình lập trình của Trí Phổ, từ trước Tết bà đã muốn mua gói dịch vụ, đến giờ sáng nào 10 giờ cũng vào tranh mua nhưng không mua được. Những trải nghiệm này trực tiếp nói lên rằng, dịch vụ của các mô hình chất lượng cao đã không đủ cung, người dùng sẵn sàng trả phí, thậm chí trả phí rồi vẫn phải xếp hàng.

Điều này có nghĩa, các mô hình hàng đầu thông qua rào cản công nghệ và tính khan hiếm, đã bắt đầu có được người dùng trả phí thực sự. Nhà sản xuất cũng không còn ngại tăng giá, mà công khai lấy lý do chi phí và giá trị thương mại để điều chỉnh giá. Mặc dù điều này còn cách giai đoạn thu hoạch lợi nhuận bùng nổ toàn diện một khoảng cách, phần lớn các mô hình trung và dài đuôi vẫn đang tìm đường biến hiện, chi phí tính toán vẫn còn cao, nhưng điểm ngoặt ngành đã rõ ràng: ngành công nghiệp AI thực sự đã vượt qua "giai đoạn giáo dục thị trường" miễn phí thuần túy, và bước vào giai đoạn đầu của "đơn hàng triển khai và giải phóng lợi nhuận".

Bài viết từ tài khoản WeChat công cộng "Thời Đại Chu Báo" (ID: timeweekly), tác giả: Lý Gia Tuyên, biên tập: Vương Doanh

Câu hỏi Liên quan

QTại sao thị trường AI Trung Quốc lại bùng nổ vào đầu tháng 4?

AThị trường AI Trung Quốc bùng nổ do sự kiện mô hình HappyHorse-1.0 vô danh đứng đầu bảng xếp hạng Artificial Analysis về tạo video từ văn bản, vượt qua Seedance 2.0 của ByteDance, cùng với việc Zhipu ra mắt mô hình GLM-5.1 có khả năng làm việc liên tục 8 giờ. Những tiến bộ công nghệ này kết hợp với tốc độ thương mại hóa nhanh đã thúc đẩy mạnh mẽ tâm lý đầu tư.

QMô hình GLM-5.1 của Zhipu có những đột phá kỹ thuật nào?

AGLM-5.1 của Zhipu có thể làm việc liên tục 8 giờ như một kỹ sư phần mềm thực thụ, tự lập kế hoạch, thực thi, kiểm tra, sửa lỗi và giao thành phẩm mà hầu như không cần con người can thiệp. Trong bài kiểm tra SWE-bench Pro, nó đạt 58.4 điểm, vượt qua Claude Opus 4.6 và GPT-5.4. Đặc biệt, mô hình được đào tạo hoàn toàn trên chip Huawei Ascend 910B, không dùng GPU của Nvidia, đánh dấu cột mốc quan trọng cho tự chủ AI Trung Quốc.

QHappyHorse-1.0 có những ưu điểm nổi bật nào so với các mô hình tạo video AI khác?

AHappyHorse-1.0 tạo video từ văn bản kèm âm thanh đồng bộ, tự động thêm hiệu ứng âm thanh phù hợp như tiếng băng vỡ hoặc bóng rổ, hỗ trợ đồng bộ môi cho 7 ngôn ngữ. Với thiết kế nhẹ chỉ 15 tỷ tham số và sử dụng công nghệ cất cánh DMD-2, nó tạo video 1080p trong khoảng 38 giây và bản xem trước độ phân giải thấp chỉ trong 2 giây, hiệu suất vượt trội so với nhiều đối thủ.

QNgành công nghiệp AI hiện đang ở giai đoạn phát triển nào theo phân tích của bài báo?

ATheo bài báo, ngành AI đã vượt qua giai đoạn 'giáo dục thị trường' miễn phí thuần túy và bước vào giai đoạn đầu của 'triển khai đơn hàng và giải phóng lợi nhuận'. Các mô hình hàng đầu bắt đầu biến đổi giá trị quy mô lớn, người dùng sẵn sàng trả phí, dịch vụ khan hiếm, và nhà cung cấp công khai điều chỉnh giá dựa trên chi phí và giá trị thương mại, cho thấy một điểm ngoặt rõ ràng trong ngành.

QĐội ngũ đằng sau mô hình HappyHorse-1.0 được cho là thuộc về tổ chức nào?

ANhiều phương tiện truyền thông cho rằng đội ngũ đằng sau HappyHorse-1.0 là Phòng thí nghiệm Cuộc sống Tương lai thuộc Taotian Group của Alibaba, do Zhang Di - 'cha đẻ của Kling' dẫn đầu. Ông trở lại Alibaba từ Kuaishou và chỉ mất 5 tháng để phát triển sản phẩm này. Thông tin này đã góp phần đẩy cổ phiếu Alibaba (09988.HK) tăng hơn 7% vào chiều ngày 7/4.

Nội dung Liên quan

CPU, lặng lẽ trở lại vị trí trung tâm của sân khấu tính toán AI

Trong ba năm qua, AI đều xoay quanh GPU, nhưng câu chuyện bắt đầu thay đổi từ năm 2026. Intel ra mắt Xeon 6+ với 288 lõi E-core, tập trung vào tính toán mật độ cao, hiệu quả năng lượng cho tải công việc suy luận AI và tác nhân thông minh. Báo cáo từ SemiAnalysis chỉ ra rằng, khi AI chuyển từ đào tạo sang triển khai hàng loạt, các nhiệm vụ như điều phối, xử lý luồng dữ liệu và quản lý đồng thời trở thành nút thắt mới – lĩnh vực mà CPU tỏ ra vượt trội hơn GPU. Xeon 6+ được sản xuất trên quy trình Intel 18A, đánh dấu sự trở lại của Intel trong cuộc đua CPU máy chủ mật độ cao, cạnh tranh với AMD Bergamo và CPU tự nghiên cứu dựa trên ARM của các nhà cung cấp đám mây. Tuy nhiên, câu chuyện “CPU trở lại” vẫn đối mặt với thách thức từ NVIDIA (với giải pháp CPU+GPU tích hợp) và làn sóng tự nghiên cứu CPU của các gã khổng lồ đám mây. Tóm lại, CPU đang tìm thấy vị trí mới quan trọng với tư cách là “mặt phẳng điều khiển” trong cơ sở hạ tầng AI, chứ không phải là sự thay thế cho GPU. Sự thành công của Intel phụ thuộc vào hiệu suất của quy trình 18A và khả năng chiếm lĩnh thị trường bên ngoài các CPU tự nghiên cứu của nhà cung cấp đám mây. Cuộc cạnh tranh định hình lại vai trò của CPU trong kỷ nguyên AI vẫn đang tiếp diễn.

marsbit12 phút trước

CPU, lặng lẽ trở lại vị trí trung tâm của sân khấu tính toán AI

marsbit12 phút trước

TON Đổi Tên Token Gốc Thành Gram, Tái Sinh Tên Trong Sách Trắng Gốc

Toncoin, mạng lưới blockchain ban đầu được phát triển bởi Telegram với tên gọi Telegram Open Network (TON), đã chính thức đổi tên token gốc của mình thành "Gram". Đây là bước thứ tư trong lộ trình "Make TON Great Again" (MTONGA) do Pavel Durov, đồng sáng lập và CEO của Telegram, khởi xướng. Quá trình chuyển đổi tên dự kiến diễn ra trong khoảng ba tuần. Tên "Gram" là sự trở về với tên gọi nguyên bản được đề cập trong sách trắng đầu tiên của dự án, đi kèm với một logo mới. Durov nhấn mạnh đây là bước đệm quan trọng cho những phát triển tiếp theo của mạng lưới. Mặc dù Telegram đã chấm dứt sự tham gia chính thức vào năm 2020 sau tranh chấp pháp lý với SEC, nhưng mối quan hệ chưa bao giờ bị cắt đứt hoàn toàn. Năm 2023, Telegram tích hợp ví dựa trên TON vào ứng dụng. Gần đây, vào tháng 5, Telegram chính thức tái gia nhập với tư cách lực lượng dẫn dắt chính và trở thành trình xác thực (validator) lớn nhất của mạng lưới, một động thái được Durov cho là sẽ củng cố tính phi tập trung. Lộ trình MTONGA còn ba bước nữa chưa được tiết lộ. Về giá cả, tại thời điểm bài viết, Gram đang được giao dịch quanh mức 2,02 USD, tăng hơn 5% trong tuần qua.

bitcoinist24 phút trước

TON Đổi Tên Token Gốc Thành Gram, Tái Sinh Tên Trong Sách Trắng Gốc

bitcoinist24 phút trước

Sau Khi Hợp Tác Với Hơn 35 Dự Án DeFi, Pink Brains Phát Hiện Ra Quy Tắc Tiếp Thị KOL Mới Cho Năm 2026

Trong ba năm qua, Pink Brains - một studio marketing chuyên về DeFi - đã hợp tác với hơn 35 dự án hàng đầu và rút ra chiến lược KOL hiệu quả cho năm 2026: lấy góc nhìn người dùng làm trung tâm thay vì góc nhìn dự án. Người dùng DeFi thường khám phá giao thức mới qua mạng xã hội (như X), nhưng quyết định lại dựa trên dữ liệu xác minh (TVL, khối lượng giao dịch, tài liệu). Do đó, mục tiêu ở giai đoạn này là được nhắc đến bởi những KOL đáng tin cậy, đồng thời có số liệu minh bạch để thuyết phục. Năm 2026, người dùng tập trung vào các chủ đề có cơ chế xác minh được: 1. **Xu hướng mới:** Hợp đồng vĩnh viễn RWA, Tài sản thế giới thực (RWA), giao diện Crypto x AI với doanh thu thực. 2. **Airdrop yêu cầu đóng góp thực sự**, không còn dễ dàng. 3. **Lợi nhuận thực** từ phí giao dịch, cho vay... thay vì lạm phát token. 4. **Tokenomics gắn với giá trị sản phẩm** (như mua lại và đốt token từ doanh thu phí). 5. **Sàn giao dịch mới** như thị trường dự đoán, thẻ sưu tập và iGaming. Để giữ chân người dùng, một giao thức cần: sản phẩm hữu ích trong đời sống, trải nghiệm tốt, hỗ trợ nhanh chóng, tokenomics gắn với lợi ích cộng đồng và xây dựng cộng đồng chiến lược. Khi hợp tác với KOL, cần chọn đúng loại (nhà giáo dục, chuyên gia, v.v.) cho từng giai đoạn hành trình người dùng. Nội dung hiệu quả nhất thường cụ thể, có thể xác minh được. Cần tránh các lỗi phổ biến như dùng KOL không hiểu sản phẩm, nội dung chung chung, hoặc phụ thuộc quá mức vào một vài KOL lớn. Tóm lại, chiến dịch marketing DeFi hiệu quả phải phản ánh đúng hành vi người dùng: nhận biết từ nguồn đáng tin, quan tâm nhờ cơ chế rõ ràng, và ở lại nhờ giá trị thực từ sản phẩm và tokenomics.

marsbit30 phút trước

Sau Khi Hợp Tác Với Hơn 35 Dự Án DeFi, Pink Brains Phát Hiện Ra Quy Tắc Tiếp Thị KOL Mới Cho Năm 2026

marsbit30 phút trước

a16z: Tương lai của AI thị giác không phải là hình ảnh, mà là mã code

Tác giả bài viết từ a16z cho rằng tương lai của AI thị giác không nằm ở việc tạo ra hình ảnh hay video (tạo sinh dựa trên pixel), mà là tạo ra các "sản phẩm mã nguồn" (code artifacts) đằng sau chúng - các tệp có cấu trúc có thể chỉnh sửa, kiểm tra và giao hàng được. Bài viết phân biệt hai hướng tiếp cận: 1. **Tạo sinh gốc pixel:** Tạo ra hình ảnh/video trực tiếp, phù hợp cho cảm xúc, bầu không khí và khám phá. 2. **Tạo sinh gốc mã nguồn:** Tạo ra các biểu diễn cấu trúc (như SVG, HTML/CSS, script Blender, cảnh USD...) sau đó được một công cụ khác hiển thị. Cách tiếp cận này tạo ra vòng lặp "mã → hiển thị → kiểm tra → sửa đổi", cho phép lặp lại chính xác và phù hợp hơn cho quy trình sản xuất. Lợi ích chính là khả năng chỉnh sửa và tích hợp. Một logo SVG có thể sửa đường cong dễ dàng, một giao diện HTML/CSS có thể kiểm tra và tích hợp vào ứng dụng thực tế, một tài sản 3D có cấu trúc đúng có thể dùng trong game hoặc mô phỏng. Lĩnh vực 3D được nhấn mạnh là tiền tuyến quan trọng tiếp theo, vì giá trị nằm ở việc tạo ra các cấu trúc 3D nhất quán, có chức năng (như cửa có thể mở, bánh xe có thể quay) chứ không chỉ là hình ảnh đẹp. Tóm lại, làn sóng AI thị giác đầu tiên giải quyết vấn đề "tạo sinh", làn sóng tiếp theo sẽ giải quyết vấn đề "sản xuất" bằng cách chuyển từ đầu ra cuối cùng sang mã nguồn, thay đổi toàn bộ chuỗi sản xuất nội dung trực quan.

marsbit1 giờ trước

a16z: Tương lai của AI thị giác không phải là hình ảnh, mà là mã code

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 846Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片