# Bài viết Liên quan AI

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "AI", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Xuất hiện tín hiệu thị trường gấu 70% tại Mỹ, có nên chạy không?

TL;DR Nhà đầu tư chứng khoán Mỹ hiện đang đối mặt với một vấn đề phức tạp hơn là chỉ đơn thuần tăng hay giảm. Một bên, nhóm chiến lược định lượng tại Bank of America cảnh báo, 70% trong số 10 tín hiệu cảnh báo thị trường gấu mà họ theo dõi đã được kích hoạt, tỷ lệ này tương tự thời điểm đỉnh lịch sử. Họ khuyến nghị chốt lời, vì xác suất thắng (tỷ lệ cược) trên thị trường đã xấu đi, được phản ánh qua định giá cao, phạm vi thị trường hẹp (chỉ một số ít cổ phiếu AI dẫn dắt đà tăng), và sự phân hóa mạnh về phong cách đầu tư. Cấu trúc này làm giảm khả năng chịu đựng rủi ro của danh mục. Mặt khác, cơ bản của AI vẫn mạnh mẽ, khác biệt rõ so với bong bóng dotcom năm 2000. Các gã khổng lồ như Microsoft, Google, Amazon, Meta đều có dòng tiền, lợi nhuận và doanh thu đám mây thực tế, trong khi nhu cầu trung tâm dữ liệu từ NVIDIA vẫn là trụ cột. Báo cáo lợi nhuận mạnh mẽ của NVIDIA cho thấy nhu cầu AI là có thật. Vấn đề cốt lõi hiện nay không còn là "AI có phải bong bóng không", mà là: Khi tín hiệu đỉnh lịch sử và tăng trưởng AI thực tế cùng tồn tại, nhà đầu tư nên hiểu rủi ro như thế nào? Câu trả lời là: Thị trường AI có thể chưa kết thúc, nhưng đã chuyển từ giai đoạn "mua vào kỳ vọng tăng trưởng" sang giai đoạn "kiểm chứng tốc độ hiện thực hóa tăng trưởng". Áp lực giờ đây dồn vào doanh thu và dòng tiền. Thị trường yêu cầu bằng chứng rằng mức chi tiêu vốn lớn cho AI của các công ty công nghệ có thể chuyển hóa thành tăng trưởng doanh thu và dòng tiền tự do đủ mạnh, để bù đắp cho định giá cao. Các báo cáo tài chính nửa cuối năm 2026 sẽ là cơ hội then chốt để chứng minh điều này. Sự mở rộng của phạm vi thị trường (nhiều cổ phiếu cùng tham gia đà tăng) cũng là yếu tố cần theo dõi. Đối với nhà đầu tư cá nhân, đây là thời điểm thích hợp để kiểm tra lại danh mục và mức độ tập trung. Tiếp tục nắm giữ AI đồng nghĩa với việc đặt cược vào tốc độ hiện thực hóa tăng trưởng trong bối cảnh rủi ro định giá và cấu trúc thị trường đã gia tăng.

marsbit06/10 09:04

Xuất hiện tín hiệu thị trường gấu 70% tại Mỹ, có nên chạy không?

marsbit06/10 09:04

Giờ Giao Dịch: Bitcoin Tiếp Tục Chịu Áp Lực, Vàng Rơi Xuống Dưới Đường Trung Bình Quan Trọng, Thị Trường Tập Trung Vào CPI Tối Nay

**TÓM TẮT THỊ TRƯỜNG** Thị trường toàn cầu chịu áp lực giảm mạnh trước dữ liệu lạm phát CPI quan trọng của Mỹ sẽ được công bố vào tối nay (dự kiến tăng cao). Căng thẳng địa chính trị leo thang ở Trung Đông khiến dầu thô WTI lao dốc hơn 3%. **Vàng** giảm xuống dưới mức 4.200 USD, phá vỡ đường trung bình động 200 ngày. Trên thị trường chứng khoán Mỹ, cổ phiếu công nghệ bị bán tháo dữ dội, đặc biệt là nhóm bán dẫn và quang học, sau một báo cáo nghiên cứu gây lo ngại về sự chậm trễ trong công nghệ CPO. **Apple** và **SMCI** là những cổ phiếu giảm mạnh. **Bitcoin** tiếp tục chịu áp lực, với dòng tiền ròng rút khỏi ETF. Các nhà phân tích cảnh báo nếu mất mốc 60.000 USD, mức tiếp theo có thể là 50.000 USD. **Ethereum** cũng yếu đi. Hai vụ tấn công vào các dự án **Sahara AI** và **Humanity** làm gia tăng tâm lý hoảng loạn trên thị trường tiền mã hóa. Thị trường chứng khoán Châu Á Thái Bình Dương cũng sụt giảm mạnh, với **Hàn Quốc** và **Nhật Bản** dẫn đầu đà bán tháo. Tuy nhiên, thị trường **Trung Quốc** thể hiện khả biệt nhờ dữ liệu xuất khẩu mạnh mẽ và kỳ vọng từ World Cup sắp tới.

marsbit06/10 08:22

Giờ Giao Dịch: Bitcoin Tiếp Tục Chịu Áp Lực, Vàng Rơi Xuống Dưới Đường Trung Bình Quan Trọng, Thị Trường Tập Trung Vào CPI Tối Nay

marsbit06/10 08:22

Cơ quan hot chiến thần cổ phiếu tóc bạc, báo cáo giảm sàn CPO ủng hộ mã nào?

Tóm tắt: Đợt sụt giảm của cổ phiếu quang học gần đây, bề ngoài là do câu chuyện CPO bị "hắt nước lạnh", thực chất là thị trường đang chiết khấu lại một vấn đề nhạy cảm hơn: Giai đoạn mở rộng quy mô 2027-2028 sẽ là thời kỳ hiện thực hóa lợi nhuận hay vẫn chỉ là giai đoạn thử nghiệm và giới thiệu. Nguyên nhân chính đến từ báo cáo ngày 9/6 của SemiAnalysis, cho rằng thời điểm sản xuất hàng loạt CPO (Đóng gói quang học chung) và 800V DC của NVIDIA có thể bị trì hoãn đến khoảng 2028-2029, dẫn đến đợt điều chỉnh cho các mã liên quan. Tuy nhiên, nhà phân tích Serenity (aleabitoreddit) phản bác, cho rằng báo cáo đánh giá thấp khả năng rút ngắn chu kỳ phần cứng của NVIDIA và nhấn mạnh CPO vẫn đang trên lộ trình mở rộng từ nửa cuối 2026 đến 2028. Cuộc tranh luận làm nổi bật sự dịch chuyển trong định giá: từ câu chuyện cuối cùng sang việc xác minh lộ trình thời gian. CPO vẫn sẽ đến, nhưng tốc độ và độ dốc của nó sẽ quyết định sự phân bổ giá trị giữa các giải pháp thay thế như NPO (Quang học đóng gói gần), mô-đun có thể cắm rút truyền thống, nguồn sáng và chip chuyển mạch. Báo cáo của SemiAnalysis nhấn mạnh đến những thách thức kỹ thuật hệ thống trong việc tích hợp và độ tin cậy của CPO, trong khi Serenity tin tưởng vào năng lực tổ chức chuỗi cung ứng mạnh mẽ của NVIDIA. Giải pháp NPO trở nên quan trọng như một lựa chọn trung gian, cân bằng giữa lợi ích về hiệu suất và tính linh hoạt. Điểm xác minh tiếp theo sẽ nằm ở dữ liệu cấp độ sản xuất: liệu việc "đưa vào sản xuất" có chuyển thành khối lượng bền vững hay không, được phản ánh qua đơn đặt hàng, biên lợi nhuận và tốc độ triển khai của khách hàng. Dù đưa ra quan ngại, SemiAnalysis vẫn đưa ra năm phân khúc bán dẫn được đánh giá cao, bao gồm cáp đồng/AEC/ACC, quang học có thể cắm rút/DSP, thiết bị kiểm tra CPO, hệ thống điện/UPS và các linh kiện công suất.

marsbit06/10 04:53

Cơ quan hot chiến thần cổ phiếu tóc bạc, báo cáo giảm sàn CPO ủng hộ mã nào?

marsbit06/10 04:53

Từ ChatGPT đến Cuộc Chiến Tư Bản: Những Cơ Hội Crypto ẩn Giấu Phía Sau Đợt IPO Của OpenAI?

Tác giả: Climber, CryptoPulse Labs Ngày 9/6, OpenAI chính thức xác nhận đã nộp đơn đăng ký IPO bí mật cho SEC Hoa Kỳ. Đồng thời, lộ trình công nghệ dài hạn của công ty lần đầu tiên được tiết lộ: đến năm 2028, AI sẽ đảm nhận phần lớn công việc nghiên cứu và phát triển của chính nó. Sự kiện này không chỉ là một động thái niêm yết thông thường mà còn báo hiệu sự thay đổi trong logic ngành AI. Cạnh tranh công nghệ đang biến thành cạnh tranh vốn, và cạnh tranh vốn sẽ tiếp tục phát triển thành chiến tranh hệ sinh thái. Đối với thị trường tiền mã hóa, đây có thể là sự khởi đầu của một luận điểm vốn mới. Bài viết điểm qua lịch sử phát triển của OpenAI từ một phòng thí nghiệm phi lợi nhuận thành một gã khổng lồ công nghệ, với bước ngoặt là sự bùng nổ của ChatGPT vào năm 2022. Hiện tại, OpenAI đã trở thành một nền tảng siêu cấp trải dài từ ứng dụng AI, dịch vụ đám mây đến hạ tầng điện toán, với kế hoạch đầu tư khoảng 6000 tỷ USD vào cơ sở hạ tầng AI trước năm 2030. Ngành công nghiệp AI đang bước vào một cuộc chạy đua vũ trang, nơi cạnh tranh về vốn, sức mạnh tính toán và hệ sinh thái ngày càng quan trọng. Việc OpenAI chuẩn bị IPO phần nào phản ánh nhu cầu vốn khổng lồ cho cuộc chiến này. Đối với thị trường Crypto, sự kiện IPO của OpenAI có thể chuyển trọng tâm chú ý từ các ứng dụng AI sang **tư liệu sản xuất AI**. Các lĩnh vực có thể hưởng lợi bao gồm: 1. **Mạng lưới điện toán phi tập trung (DePIN):** Các dự án như Render, Bittensor, Akash, io.net nhằm tận dụng GPU nhàn rỗi để xây dựng thị trường tính toán phân tán, có thể được quan tâm trở lại. 2. **AI Agent:** Kế hoạch "nhà nghiên cứu AI tự động" của OpenAI có thể thúc đẩy các dự án xây dựng hệ thống kinh tế AI trên nền tảng crypto. 3. **Lớp dữ liệu AI & RWA kết hợp AI:** Việc token hóa các tài sản cơ sở hạ tầng AI (như trung tâm dữ liệu, tài nguyên điện toán) trên chuỗi có thể trở thành xu hướng mới. Tuy nhiên, cần lưu ý rằng IPO của OpenAI cũng có thể tạo ra hiệu ứng hút vốn từ thị trường crypto vào các gã khổng lồ AI. Do đó, những dự án có nhu cầu thực, nghiệp vụ thực và năng lực hạ tầng vững chắc mới có thể là người chiến thắng thực sự. Tóm lại, cuộc cách mạng AI đang bước sang một giai đoạn mới, nơi vốn, điện toán và hệ sinh thái quyết định thắng thua. Câu hỏi quan trọng cho thị trường crypto không phải là AI sẽ thay đổi thế giới ra sao, mà là ai sẽ trở thành nhà cung cấp "nước, điện và than" - những yếu tố nền tảng thiết yếu - trong kỷ nguyên AI mới này.

marsbit06/10 04:34

Từ ChatGPT đến Cuộc Chiến Tư Bản: Những Cơ Hội Crypto ẩn Giấu Phía Sau Đợt IPO Của OpenAI?

marsbit06/10 04:34

5000 Tỷ Đô La, Hợp Đồng Thuê 20 Năm: OpenAI Đàm Phán Trung Tâm Dữ Liệu 10 Gigawatt ở Ohio, Nvidia Sẵn Sàng Làm 'Hậu Thuẫn' Tín Dụng

OpenAI đang đàm phán một hợp đồng thuê lớn với SB Energy (thuộc SoftBank) để xây dựng một khuôn viên trung tâm dữ liệu AI công suất 10 gigawatt tại Ohio, Mỹ. Thỏa thuận dự kiến kéo dài 20 năm với tổng chi phí thuê lên tới hàng trăm tỷ USD. Đáng chú ý, NVIDIA được cho là sẽ đóng vai trò bảo lãnh tín dụng cho các nghĩa vụ thanh toán của OpenAI, đánh dấu lần đầu tiên hãng này tham gia với tư cách "bên bảo lãnh tài chính" vào một dự án hạ tầng quy mô lớn. Dự án nằm trên khu đất thuộc Bộ Năng lượng Mỹ và là một phần của thỏa thuận đầu tư Nhật-Mỹ. SB Energy sẽ xây dựng các nhà máy điện khí đốt để cung cấp năng lượng cho khuôn viên. Tuy nhiên, chi phí mua chip và máy chủ (ước tính khoảng 350 tỷ USD) vẫn là một thách thức tài chính lớn đối với OpenAI. Động thái này diễn ra trong bối cảnh OpenAI được cho là đã từ bỏ kế hoạch liên doanh "Stargate" trị giá 500 tỷ USD với Oracle và SoftBank, thay vào đó chuyển hướng sang các thỏa thuận song phương để xây dựng năng lực tính toán riêng. Việc này cũng làm dấy lên câu hỏi về các nghĩa vụ thuê đám mây khổng lồ (hơn 6650 tỷ USD) của OpenAI khi công ty chuẩn bị cho đợt IPO có thể định giá lên tới 1 nghìn tỷ USD vào cuối năm nay.

marsbit06/10 03:37

5000 Tỷ Đô La, Hợp Đồng Thuê 20 Năm: OpenAI Đàm Phán Trung Tâm Dữ Liệu 10 Gigawatt ở Ohio, Nvidia Sẵn Sàng Làm 'Hậu Thuẫn' Tín Dụng

marsbit06/10 03:37

CEO Micron mới nhất phỏng vấn: 'Lưu trữ' là điểm nghẽn bị bỏ qua của AI, tình trạng cung ứng căng thẳng vẫn sẽ tiếp tục

CEO Micron Sanjay Mehrotra nhấn mạnh: “Cuộc đua AI không chỉ là cuộc đua sức mạnh tính toán, mà còn là cuộc đua bộ nhớ.” Ông cho rằng lưu trữ là nút thắt cổ chai bị đánh giá thấp trong AI, khi các mô hình lớn hơn, cửa sổ ngữ cảnh dài hơn và lượng token tiêu thụ tăng đều thúc đẩy nhu cầu về khả năng "ghi nhớ" mạnh mẽ. Về phía cung, ông chỉ ra các hạn chế cấu trúc: sản phẩm bộ nhớ tiên tiến tiêu thụ nhiều wafer hơn, trong khi việc xây dựng nhà máy wafer mới mất 3-4 năm và quá trình tăng công suất cũng kéo dài. Hơn nữa, tiến bộ công nghệ đang làm giảm mức tăng sản lượng bit trên mỗi wafer. Do đó, tình trạng cung căng thẳng dự kiến sẽ kéo dài ít nhất đến sau năm 2026. Mehrotra giải thích rằng bộ nhớ thường bị đánh giá thấp vì mọi người không hiểu hết độ khó chế tạo, liên quan đến vật lý, hóa học, khoa học vật liệu và đảm bảo độ chính xác cho hàng nghìn tỷ bit trong sản xuất hàng loạt. Ông cũng chia sẻ triết lý thành công dựa trên tính kiên cường, kỷ luật và chủ nghĩa dài hạn, được phản ánh trong kế hoạch đầu tư 2000 tỷ USD của Micron. Kế hoạch này dựa trên dữ liệu, phân tích cơ bản và sự hợp tác chặt chẽ với khách hàng để hiểu xu hướng tương lai. Ông khẳng định sự tự tin vào cơ hội của ngành bộ nhớ và tầm quan trọng của khả năng thích ứng.

marsbit06/10 02:11

CEO Micron mới nhất phỏng vấn: 'Lưu trữ' là điểm nghẽn bị bỏ qua của AI, tình trạng cung ứng căng thẳng vẫn sẽ tiếp tục

marsbit06/10 02:11

Báo cáo SemiAnalysis cho biết hai công nghệ then chốt bị trì hoãn, gây ra "quang điện" giảm mạnh, cư dân mạng tranh luận về CPO

Báo cáo từ SemiAnalysis chỉ ra sự trì hoãn của hai công nghệ then chốt là kiến trúc nguồn 800VDC và CPO (Co-Packaged Optics) trong data center AI, dự kiến lần lượt bị lùi đến sau năm 2028 và năm 2028-2029, gây ra biến động mạnh trên thị trường. Cổ phiếu quang học như AAOI giảm 17%, Lumentum giảm 8%. Trái ngược với báo cáo, Phó chủ tịch cấp cao phụ trách mạng lưới của NVIDIA, Gilad Shainer, bày tỏ sự lạc quan về CPO, khẳng định công nghệ này sẽ bắt đầu xuất xưởng vào nửa cuối năm nay và là hướng đi đầy hứa hẹn. Trên mạng xã hội nổ ra tranh luận sôi nổi. Phe bi quan cho rằng vấn đề tỷ lệ lỗi và độ tin cậy là rào cản thực tế. Phe lạc quan cho rằng sự chậm trễ của CPO sẽ có lợi cho các mô-đun quang có thể cắm rút (pluggable) truyền thống và công nghệ NPO (Near-Packaged Optics), vì nhu cầu truyền dữ liệu AI vẫn rất cao, vốn sẽ chỉ chuyển hướng sang các lĩnh vực này. Một số ý kiến khác nghi ngờ tính nhất quán trong logic của báo cáo. Phân tích chung nhận định, sự điều chỉnh này chủ yếu liên quan đến lộ trình kỹ thuật, không phải là sự đảo ngược nhu cầu tổng thể về hạ tầng data center AI. Các cơ hội đầu tư ngắn hạn có thể chuyển sang các lĩnh vực như mô-đun 1.6T có thể cắm rút, NPO, và kiến trúc nguồn 400VDC.

marsbit06/10 02:11

Báo cáo SemiAnalysis cho biết hai công nghệ then chốt bị trì hoãn, gây ra "quang điện" giảm mạnh, cư dân mạng tranh luận về CPO

marsbit06/10 02:11

Đứng sau GPU và lưu trữ: MLCC đang trở thành cơn sốt nghìn tỷ tiếp theo trong điện toán AI

**MLCC: Yếu tố chi phí AI tiếp theo tỷ đô, sau GPU và bộ nhớ** Thị trường MLCC (tụ điện nhiều lớp) đang bước vào một chu kỳ tăng trưởng siêu cấp do sức kéo cấu trúc từ AI và xe điện. Giá cả, đặc biệt cho các mẫu cao cấp dùng cho máy chủ AI, đã tăng mạnh (từ 10% đến 275%) từ tháng 7 do cung không đáp ứng cầu. **Nhu cầu bùng nổ từ AI:** Lượng MLCC trong một máy chủ AI (ví dụ: GB300 NVL72) có thể lên tới 440.000 chiếc, cao hơn hàng trăm lần so với máy chủ thông thường (2.000 chiếc). Nguyên nhân là do GPU công suất cao cần ổn định điện áp cực nhanh, dẫn đến nhu cầu MLCC nhỏ gọn, dung lượng cao tăng theo cấp số nhân. Giá trị MLCC trên mỗi khung máy chủ cũng tăng mạnh, trở thành khoản chi phí lớn thứ ba sau GPU và bộ nhớ. **Nguồn cung hạn chế:** Việc mở rộng sản xuất MLCC cao cấp gặp nhiều rào cản: công nghệ, thiết bị và công thức vật liệu độc quyền (do các công ty Nhật Bản như Murata nắm giữ), chu kỳ chứng nhận khách hàng dài (12-18 tháng cho AI), đầu tư vốn lớn và ký ức về chu kỳ dư thừa trước đây. Tăng trưởng công suất toàn ngành chỉ khoảng 10%/năm, trong khi nhu cầu MLCC cho AI dự kiến tăng 34%/năm. **Ba công ty dẫn đầu thị trường:** 1. **Murata (Nhật Bản):** Gã khổng lồ tuyệt đối, thị phần ~40%, lợi nhuận ổn định, là lựa chọn an toàn. 2. **Samsung Electro-Mechanics (Hàn Quốc):** Có đòn bẩy tăng trưởng cao nhất với kế hoạch đầu tư mở rộng mạnh mẽ và lợi nhuận tăng nhanh. 3. **Taiyo Yuden (Nhật Bản):** Có "độ tinh khiết" MLCC cao nhất (70,9% doanh thu), là công cụ đầu cơ thuần túy nhất vào chủ đề này, với triển vọng phục hồi lợi nhuận rõ ràng. Chu kỳ siêu cấp này, được dự báo kéo dài đến năm 2030, được thúc đẩy bởi khoảng cách cung-cầu ngày càng lớn và đòn bẩy hoạt động mạnh mẽ (giá tăng nhỏ dẫn đến lợi nhuận tăng lớn). Tuy nhiên, rủi ro bao gồm: cắt giảm chi tiêu AI, định giá cao, khả năng mở rộng sản xuất từ Trung Quốc và biến động tỷ giá.

marsbit06/10 01:11

Đứng sau GPU và lưu trữ: MLCC đang trở thành cơn sốt nghìn tỷ tiếp theo trong điện toán AI

marsbit06/10 01:11

Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

Anthropic đã chính thức công bố Claude Fable 5 và Claude Mythos 5, hai phiên bản mạnh mẽ nhất từ trước đến nay của họ. Fable 5 là phiên bản có "lưới bảo vệ", tự động chuyển sang Claude Opus 4.8 khi phát hiện câu hỏi rủi ro (như viết phần mềm độc hại), và được mở cho tất cả người dùng. Mythos 5 là phiên bản đầy đủ năng lực, tập trung vào an ninh mạng và nghiên cứu sinh học, nhưng chỉ dành cho một số ít người dùng được tin cậy. Về hiệu suất, Fable 5 thể hiện sự vượt trội trong nhiều lĩnh vực: * **Kỹ thuật phần mềm:** Đạt điểm cao trong các bài kiểm tra SWE-bench Pro và Frontier Code. Đáng chú ý, nó hoàn thành việc di chuyển kho code Ruby 50 triệu dòng chỉ trong 1 ngày. * **Thị giác máy tính:** Có thể tự chơi và hoàn thành game "Pokémon" chỉ dựa trên ảnh chụp màn hình mà không cần công cụ hỗ trợ. * **Bộ nhớ dài hạn & Ngữ cảnh dài:** Khả năng duy trì tập trung và sử dụng ghi chú trong các nhiệm vụ kéo dài được cải thiện, nâng cao hiệu quả hoạt động tự chủ (Agent). * **Tài chính & Phân tích:** Là mô hình đầu tiên đạt trên 90% trong một bài benchmark phân tích phức tạp, cho thấy khả năng suy luận ở cấp độ chuyên gia. * **Nghiên cứu khoa học:** Mythos 5 có thể tự động hóa toàn bộ quy trình nghiên cứu sinh học. 9 trong số 14 hợp chất do nó thiết kế đã được đưa vào quy trình phát triển thuốc thực tế. Một điểm đáng chú ý là cơ chế an toàn mới: thay vì từ chối trả lời, Fable 5 sẽ chuyển hướng câu hỏi nhạy cảm sang Opus 4.8. Tuy nhiên, cơ chế này đôi khi có thể "bắt nhầm" các yêu cầu hợp pháp. Anthropic cũng áp dụng chính sách lưu giữ dữ liệu 30 ngày cho lưu lượng truy cập của các mô hình cấp Mythos. Giá API cho cả hai mô hình là 10 USD/token đầu vào và 50 USD/token đầu ra (tính theo triệu). Giáo sư Ethan Mollick, người dùng thử nghiệm, nhận xét rằng với Fable 5, con người giống như "khách hàng" (patron) đưa ra yêu cầu tổng thể, trong khi AI tự động phân chia công việc và hoàn thành mà ít cần can thiệp, đánh dấu sự thay đổi lớn trong hình thức hợp tác giữa người và máy.

marsbit06/10 00:27

Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

marsbit06/10 00:27

Đột phá bất ngờ trong AI thiết bị đầu cuối mà Apple khao khát: Mô hình nhận thức đầu tiên ra đời, 4B ngang tầm GPT-5.4

**Apple mong muốn về AI ở thiết bị đầu cuối đã có đột phá: Mô hình nhận thức đầu tiên ra đời, 4B thách thức GPT-5.4** Bài viết thảo luận về xu hướng và thách thức của AI trên thiết bị đầu cuối (edge AI), đặc biệt nhấn mạnh đến vấn đề chi phí điện toán (token cost) ngày càng tăng khi triển khai các mô hình lớn (LLM). Giải pháp được đề xuất bởi Andrej Karpathy là tách rời "lõi nhận thức" (khả năng suy luận, lập kế hoạch) khỏi "kiến thức" thuần túy trong mô hình, tạo ra các mô hình nhỏ gọn hơn nhưng hiệu quả. Công ty Trung Quốc Nextie (Minh Nhật Tân Trình) được giới thiệu là đã hiện thực hóa ý tưởng này với **Nextie Alpha**, được gọi là mô hình nhận thức đầu tiên trong ngành, với chỉ 4 tỷ tham số. Mô hình này được cho là đạt hiệu quả tương đương với các mô hình nghìn tỷ tham số như GPT-5.4 trong các nhiệm vụ trí tuệ tập thể (ví dụ: tranh luận, phản ánh), đồng thời có thể triển khai trên thiết bị đầu cuối (như MacBook, robot). Bài viết nêu bật ba lợi ích chính: 1. **Nâng cao chất lượng ra quyết định đa tác tử:** Cải thiện hiệu quả trong các hệ thống nhiều tác nhân AI hợp tác. 2. **Giảm chi phí điện toán đáng kể:** Chuyển từ chi phí điện toán đám mây sang chi phí điện năng thấp khi chạy trên thiết bị. 3. **Mở khóa các kịch bản chủ động (Proactive):** Cho phép các tác nhân AI hoạt động liên tục, tự chủ thay vì chỉ phản hồi lệnh, mở ra không gian thương mại lớn hơn. Nextie, với đội ngũ sáng lập từ Microsoft Xiaoice, có thành tích tạo ra các mô hình nhỏ hiệu quả cao. Họ đang tập trung vào lĩnh vực đa tác tử và trí tuệ tập thể, một lĩnh vực được các nhà đầu tư như OpenAI công nhận có tiềm năng lớn. Bài viết kết luận rằng mô hình nhận thức như Nextie Alpha không chỉ thay đổi quy mô tham số mà còn tái cấu trúc mô hình kinh tế của AI, khiến các sản phẩm AI chủ động, chi phí thấp trở nên khả thi và có thể định hình lại toàn bộ ngành.

marsbit06/09 12:08

Đột phá bất ngờ trong AI thiết bị đầu cuối mà Apple khao khát: Mô hình nhận thức đầu tiên ra đời, 4B ngang tầm GPT-5.4

marsbit06/09 12:08

活动图片