# Bài viết Liên quan LLM

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "LLM", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

AI PC đã tới, chạy mô hình lớn 120B ngay trên máy! NVIDIA định nghĩa lại nền tảng 'Máy tính Cá nhân AI' với RTX Spark

Trong hai năm qua, các nhà sản xuất PC thường xuyên nhắc đến thông số "TOPS của NPU" khi quảng bá "AI PC", nhưng những con số này vẫn ở mức tương đối khiêm tốn, chỉ phù hợp cho các tác vụ AI nhẹ. Tại GTC 2026, NVIDIA đã giới thiệu siêu chip RTX Spark với hiệu năng AI lên tới 1 petaflop (1000 TOPS), vượt trội hơn hẳn một bậc so với các giải pháp NPU trước đây. RTX Spark tích hợp GPU kiến trúc Blackwell, CPU Arm Grace 20 nhân do MediaTek đồng thiết kế và sử dụng bộ nhớ thống nhất lên đến 128GB, cho phép CPU và GPU chia sẻ chung một nhóm bộ nhớ. Sự thay đổi kiến trúc này giúp thiết bị có khả năng chạy mô hình lớn (LLM) 120B tham số ngay tại本地 (on-device) với cửa sổ ngữ cảnh lên tới triệu token. Ngoài ra, nó còn hỗ trợ chỉnh sửa video 12K, render cảnh 3D và chơi game ray-tracing ở mức khung hình cao. NVIDIA cũng công bố hợp tác với Microsoft để tăng cường bảo mật cho Windows, tích hợp thời gian chạy sandbox mã nguồn mở OpenShell để cô lập và quản lý hành vi của AI agent, giúp các doanh nghiệp triển khai thiết bị này một cách an toàn. Về phía phần mềm, Adobe tuyên bố sẽ tái cấu trúc Photoshop và Premiere từ gốc để tối ưu hóa cho kiến trúc bộ nhớ thống nhất của RTX Spark, hứa hẹn tăng hiệu suất lên gấp đôi. Sáu OEM hàng đầu bao gồm ASUS, Dell, HP, Lenovo, Microsoft Surface và MSI sẽ ra mắt máy tính xách tay mỏng nhẹ và máy tính để bàn nhỏ gọn tích hợp RTX Spark vào mùa thu năm nay, Acer và Gigabyte sẽ theo sau. Tuy nhiên, các câu hỏi về giá cả, khả năng tản nhiệt, hiệu suất thực tế và thời lượng pin vẫn cần được làm rõ khi sản phẩm chính thức ra mắt. Sự xuất hiện của RTX Spark đánh dấu sự dịch chuyển quyền lực trong ngành công nghiệp PC, từ mô hình truyền thống lấy CPU x86 làm trung tâm sang mô hình nền tảng SoC mới lấy GPU làm chủ đạo.

marsbit12 giờ trước

AI PC đã tới, chạy mô hình lớn 120B ngay trên máy! NVIDIA định nghĩa lại nền tảng 'Máy tính Cá nhân AI' với RTX Spark

marsbit12 giờ trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

Trong những năm gần đây, Mô hình Chuyên gia Hỗn hợp (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên điện thoại, Kiến trúc Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc. Meta đã đề xuất MobileMoE, lần đầu tiên triển khai suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trên 14 bài kiểm tra cơ bản, MobileMoE-S/M đạt độ chính xác trung bình tương đương hoặc cao hơn với chỉ 1/2 đến 1/4 lượng tính toán suy luận so với mô hình dày đặc cơ sở, trong khi sử dụng bộ nhớ tương tự. Trong thử nghiệm thực tế, MobileMoE-S trên iPhone 16 Pro (backend GPU/MLX) tăng tốc độ đáng kể, tăng tốc lên đến 3.8 lần trong giai đoạn đầu vào. MobileMoE là một loại mô hình ngôn ngữ MoE được thiết kế cho triển khai trên thiết bị đầu cuối, thay thế các lớp feed-forward dày đặc bằng các lớp MoE trong kiến trúc Transformer decoder-only. Quy trình đào tạo bao gồm bốn giai đoạn: tiền đào tạo, đào tạo trung gian, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa. Các thí nghiệm cho thấy cấu hình tối ưu sử dụng 8 chuyên gia (E=8), độ hạt chuyên gia 8 (g=8), với một chuyên gia được chia sẻ. MobileMoE thiết lập một biên giới Pareto mới cho LLM trên thiết bị đầu cuối, cân bằng tốt hơn giữa độ chính xác và chi phí suy luận. Sau khi lượng tử hóa INT4, mô hình vẫn duy trì tính cạnh tranh. Khi triển khai trên Samsung Galaxy S25 và iPhone 16 Pro, MobileMoE-S cho thấy tốc độ nhanh hơn đáng kể và mức sử dụng bộ nhớ thấp hơn so với các mô hình so sánh. Hướng phát triển trong tương lai bao gồm củng cố quá trình hậu đào tạo, mở rộng đa phương thức và tối ưu hóa việc triển khai trên NPU di động để tiếp tục cải thiện hiệu quả.

marsbit12 giờ trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

marsbit12 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbitHôm qua 16:07

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbitHôm qua 16:07

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ khi các model năm 2025 giành huy chương IMO. 3. **Nơi nắm giữ giá trị:** Dự đoán giá trị sẽ thuộc về tầng ứng dụng, còn các công ty làm model cơ bản có thể không sinh lời, đã không tính đến sự thống trị và lợi nhuận khổng lồ của NVIDIA ở tầng phần cứng tính toán. 4. **Bản quyền:** Nhận định AI có thể "né tránh" vi phạm bản quyền là sai, khi thực tế đã có những vụ kiện và dàn xếp bồi thường lớn nhất lịch sử liên quan đến dữ liệu huấn luyện. **Bài học rút ra sau 3 năm:** * **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể.** * Xu hướng chung: **Đánh giá quá lạc quan về tốc độ, nhưng lại đánh giá thấp mức độ phát triển** về lâu dài. * Sai lầm tinh vi thường nằm ở **sự phân bổ** (ví dụ: tác động việc làm lên nhóm người lao động trẻ), chứ không phải tổng thể. * **Những nhận định có giới hạn, điều kiện đi kèm thường chính xác hơn** những phát biểu tuyệt đối. * Một số câu hỏi lớn vẫn chưa có câu trả lời cuối cùng sau 3 năm. Bản tổng kết này không chỉ chấm điểm cho quá khứ, mà còn đặt ra những quy tắc cho việc dự đoán trong tương lai.

链捕手Hôm qua 13:39

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手Hôm qua 13:39

6 câu hỏi, hiểu xu hướng thương mại của AI

**Tóm tắt:** AI đang bước vào "mùa hè" thương mại hóa, chuyển từ giai đoạn kể chuyện (narrative) sang tập trung vào khả năng giao hàng cụ thể và hiệu quả tài chính. Điều này được phản ánh qua 6 khía cạnh, mỗi khía cạnh đạt 1 điểm theo "Khung chấm điểm 6 chiều để đánh giá chu kỳ", tổng 6 điểm thuộc mùa hè. Các tín hiệu rõ ràng bao gồm: **Doubao (Đậu Bao)** của ByteDance bắt đầu thu phí đăng ký, và **OpenAI** ra mắt nền tảng quảng cáo. Động lực chính là áp lực chi phí (điện, GPU, vận hành) từ việc người dùng tăng trưởng khổng lồ và cơ hội thương mại hóa đã chín muồi. Để thành công trong giai đoạn này, doanh nghiệp cần: 1. **Tìm một điểm cắt nhỏ, chạy thông vòng lặp giá trị:** Bắt đầu với 1-2 kịch bản có điểm đau rõ, dữ liệu đủ và đo lường được ROI cụ thể (ví dụ: dịch vụ khách hàng tự động, tạo nội dung marketing). Đặt mốc thời gian ngắn và ngừng nếu không đạt kết quả. 2. **Nhân rộng từ dự án thí điểm, xây dựng năng lực tổ chức:** Chuẩn hóa quy trình thành công, xây dựng nền tảng chia sẻ năng lực AI và cơ sở dữ liệu prompt. Điều chỉnh cơ cấu tổ chức (cần lãnh đạo cấp cao dẫn dắt), đào tạo nhân sự và gắn động lực với kết quả tài chính từ AI. 3. **Tái cấu trúc có hệ thống, dùng AI làm lại quy trình:** Chuyển từ quy trình tuần tự sang song song với AI, sử dụng bảng điều khiển thời gian thực để giám sát và tạo chuỗi kích hoạt tự động. Mục tiêu: sự kiện xảy ra, AI tự động xử lý, con người chỉ phê duyệt. Tóm lại, lộ trình là: chạy thông một điểm, mở rộng thành một mặt trận, sau đó để AI thiết kế lại toàn bộ cục diện kinh doanh.

marsbitHôm qua 00:28

6 câu hỏi, hiểu xu hướng thương mại của AI

marsbitHôm qua 00:28

Gã khổng lồ mô hình lớn Thượng Hải bắt đầu niêm yết trên thị trường A-share

MiniMax, công ty hàng đầu về mô hình lớn AI của Thượng Hải, đã nộp báo cáo đăng ký tư vấn niêm yết lên Ủy ban Giám sát Chứng khoán Thượng Hải vào ngày 29/5, khởi động quá trình niêm yết A-shares với CITIC Securities là cố vấn. Sau khi IPO trên sàn HKEx vào tháng 1, giá cổ phiếu MiniMax đã tăng 409,09%, đạt vốn hóa thị trường khoảng 227,55 tỷ nhân dân tệ. Hiệu suất kinh doanh phát triển mạnh: ARR (Doanh thu thường xuyên hàng năm) trong hai tháng qua tăng hơn 100%, vượt 300 triệu USD. Năm 2025, doanh thu đạt 79,038 triệu USD (khoảng 535 triệu nhân dân tệ), trong đó sản phẩm gốc AI chiếm 53,075 triệu USD. Lợi nhuận gộp tăng lên 25,4%, lỗ ròng điều chỉnh thu hẹp đáng kể. Về sản phẩm, công ty đã liên tục ra mắt các mô hình ngôn ngữ lớn hàng đầu như M2.5, M2.6, M2.7 và mở nguồn hai mô hình. Mô hình M3 sắp tới sẽ áp dụng cơ chế Chú Ý Thưa MiniMax, tăng tốc độ suy luận lên 9,7 lần và 15,6 lần tương ứng. Cùng với MiniMax, các công ty hàng đầu về mô hình lớn trong nước như ZhiPu cũng đang đẩy nhanh các động thái trên thị trường vốn. Việc niêm yết mở ra kênh huy động vốn phong phú hơn cho các công ty này trong bối cảnh đầu tư điện toán cao và con đường thương mại hóa chưa hoàn toàn khép kín.

marsbit2 ngày trước 02:46

Gã khổng lồ mô hình lớn Thượng Hải bắt đầu niêm yết trên thị trường A-share

marsbit2 ngày trước 02:46

Bong bóng đại thị trường AI Mỹ có thể sụp đổ?

346 tỷ USD là số tiền thực tế mà SoftBank đã đầu tư vào OpenAI. Để gom vốn, Masayoshi Son đã bán hết cổ phần tại NVIDIA, Deutsche Telekom, Alibaba và T-Mobile. Ông vẫn chưa hài lòng và dự định đầu tư thêm 300 tỷ USD trong năm nay, nâng cổ phần từ 11% lên 13%, thậm chí sẵn sàng vay nợ. Động lực thúc đẩy nhà đầu tư 69 tuổi này là lợi nhuận kếch xù: với định giá của OpenAI đạt 8520 tỷ USD vào tháng 2, SoftBank đã có lãi trên giấy hơn 450 tỷ USD. Hiệu ứng tài sản khổng lồ này khiến vốn đổ ào ạt vào AI. Gần đây, Anthropic cũng đang đàm phán vòng gọi vốn mới với mục tiêu định giá khoảng 9000 tỷ USD. Bài viết so sánh cơn sốt AI hiện nay với bong bóng dot-com những năm 2000, khi Yahoo đạt đỉnh rồi sụp đổ. OpenAI và Anthropic ngày nay giống như Yahoo của kỷ nguyên AI: họ bán token và API, được định giá dựa trên giả định rằng mọi ứng dụng AI đều phải mua sức mạnh tính toán và trí tuệ từ họ. Tuy nhiên, khi AI trở thành một tiện ích phổ biến và giá cả, "cổng vào" mô hình thuần túy có thể mất quyền định giá. Về mặt tài chính, để biện minh cho định giá nghìn tỷ USD với hệ số P/E 30-40, OpenAI và Anthropic cần kiếm được 250-300 tỷ USD lợi nhuận ròng mỗi năm. Thực tế, doanh thu thường niên hóa (ARR) của họ hiện thấp hơn nhiều và còn chứa nhiều yếu tố không ổn định như nhu cầu dùng thử hay khuyến mãi. Cuộc chiến giảm giá token càng làm mờ đi triển vọng lợi nhuận. Lợi nhuận cuối cùng của toàn bộ chuỗi AI được quyết định bởi việc thương mại hóa ở tầng ứng dụng. Hiện tại, vẫn thiếu những "siêu ứng dụng" AI tạo ra doanh thu khổng lồ. Nếu các doanh nghiệp nhận thấy AI không mang lại lợi nhuận vượt trội, họ có thể ngừng chi tiêu, đe dọa nền tảng định giá của các công ty mô hình lớn. Bài viết đưa ra hai kịch bản có thể xảy ra: một là sự sụp đổ kiểu Yahoo, khi định giá nghìn tỷ lao dốc và các công ty mô hình lớn trở thành một ngành kinh doanh cơ sở hạ tầng bình thường; hai là tái cấu trúc vòng lặp thương mại, tìm ra mô hình khiến doanh nghiệp sẵn sàng trả phí lớn. Dù con đường nào, cần cảnh giác với việc chiết khấu lợi ích cuối cùng của ngành cho những người dẫn đầu hiện tại - đặc điểm điển hình của bong bóng. Sự sụp đổ của bong bóng dot-com đã gây ra tổn thất kinh tế thực tế đáng kể. Nếu định giá nghìn tỷ USD của các mô hình AI sụp đổ, tác động hệ thống có thể còn nghiêm trọng hơn. Cách mạng công nghệ không phải là một đường thẳng đi lên. Nếu AI định giá nghìn tỷ sụp đổ, không có nghĩa là AI kết thúc, mà có nghĩa là nó sẽ mất đi màu sắc đầu cơ tài chính và hòa nhập sâu sắc vào mọi ngành nghề như một cơ sở hạ tầng thiết yếu.

marsbit05/29 09:13

Bong bóng đại thị trường AI Mỹ có thể sụp đổ?

marsbit05/29 09:13

TechFlow Tình Báo Cục: Vàng hiện vật vượt dưới 4400 USD, thị trường mã hóa toàn tuyến giảm mạnh

Cập nhật TechFlow: Thị trường tiền mã hóa đồng loạt lao dốc, vàng giảm xuống dưới 4400 USD. **AI & Công nghệ:** * Claude và ChatGPT được cho là đã tìm thấy "PMF", chuyển từ "đồ chơi đắt tiền" thành công cụ hàng ngày cho nhà phát triển, dù có tranh cãi về chất lượng code. * Lỗ hổng nghiêm trọng trong các công cụ LLM phổ biến như VLLM có nguy cơ làm hàng triệu AI agent bị tấn công. * Google Gemini Omni Flash bị chỉ trích có mức độ kiểm duyệt quá mức, vượt cả một số mô hình Trung Quốc. * Mô hình định vị thị giác mới của Nvidia, LocateAnything, được công bố có tốc độ nhanh gấp 10 lần so với Qwen3-VL. * Dữ liệu nội bộ Microsoft cho thấy trong nhiều trường hợp, sử dụng AI thực tế đắt hơn so với thuê con người. **Tiền mã hóa/Web3:** * Một nhân viên Google bị truy tố vì sử dụng dữ liệu tìm kiếm nội bộ để đặt cược kiếm triệu đô trên Polymarket. * Các tài khoản bất thường trên Polymarket đạt tỷ lệ thắng cược 98%, gây nghi ngờ thao túng. * Một công ty tiền mã hóa liên quan đến Trump đứng trước bờ vực phá sản sau khi thiêu rụi 1.5 tỷ USD. **Thị trường & Tài chính:** * Vàng giảm mạnh xuống dưới 4400 USD/ounce do tín hiệu chính sách thắt chặt từ Fed. * Giá dầu tăng lên 97 USD/thùng sau khi Mỹ không kích các mục tiêu của Iran. * Chỉ số KOSPI của Hàn Quốc được dự báo tăng mạnh vào năm 2026, dẫn đầu bởi cổ phiếu chip AI như SK Hynix. * Cổ phiếu Meta tăng giá sau khi công bố dịch vụ thuê bao trả phí cho Facebook và Instagram. **Điểm nhấn khác:** * YouTube sẽ tự động gắn nhãn video được tạo bằng AI. * Lượng truy cập DuckDuckGo tăng 28% trong tuần sau khi Google thúc đẩy tìm kiếm AI, cho thấy phản ứng của người dùng. * Mô hình Qwen3.6-35B của Alibaba cho thấy khả năng lập trình được cải thiện vượt bậc khi nâng cấp từ lượng tử hóa 4-bit lên 6-bit. **Chủ đề xuyên suốt:** Ranh giới của thông tin nội bộ đang được định nghĩa lại giữa bối cảnh AI và thị trường dự đoán. Đồng thời, những tuyên bố về lợi ích công nghệ đang bị thách thức bởi chi phí thực tế và sự phản ứng của người dùng.

marsbit05/28 11:04

TechFlow Tình Báo Cục: Vàng hiện vật vượt dưới 4400 USD, thị trường mã hóa toàn tuyến giảm mạnh

marsbit05/28 11:04

Mô hình lớn quét sạch mọi kỳ thi, nhưng lại càng xa rời AGI hơn: Bài báo này đã vạch trần điều gì?

Nếu ai đó nói rằng AGI (Trí tuệ nhân tạo phổ quát) đã đạt được, làm sao để phân biệt thật hư? Ngành công nghiệp AI đang chạy đua hướng tới một mục tiêu không có đường kết thúc rõ ràng. Một bài báo gần đây của nhà nghiên cứu Michael Timothy Bennett đã đề xuất một thước đo mới cho AGI: không phải là khả năng bắt chước con người, mà là khả năng thích ứng và khám phá tri thức mới như một "nhà khoa học nhân tạo". Bài báo chỉ ra rằng các bài kiểm tra chuẩn cũ như bài kiểm tra Turing đã bị các mô hình lớn (large models) vượt qua, nhưng chúng ta lại càng xa rời trí thông minh phổ quát thực sự. Các mô hình hiện tại chủ yếu dựa vào "Scale-maxing" - tối đa hóa quy mô dữ liệu và tham số, lưu trữ các câu trả lời gần đúng trong trọng số mạng. Chúng thiếu khả năng chủ động thử nghiệm, hiểu biết nhân quả và cân bằng giữa khám phá (exploration) và khai thác (exploitation) trong điều kiện tài nguyên hạn chế (như năng lượng). Một AGI thực sự, theo định nghĩa mới này, cần có ba đặc điểm cốt lõi: (1) Chủ động thử nghiệm để thu thập thông tin, thay vì thụ động học từ dữ liệu có sẵn. (2) Hiểu được quan hệ nhân quả, không chỉ là tương quan. (3) Biết cách phân bổ tài nguyên tính toán một cách khôn ngoan để cân bằng giữa việc tìm kiếm thông tin mới và sử dụng kiến thức đã biết. Điều này đòi hỏi một sự chuyển dịch mô hình trong ngành AI. Tiêu chí đánh giá sẽ chuyển từ bảng xếp hạng điểm số sang các "điểm chuẩn thích ứng", nơi AI được đặt vào môi trường hoàn toàn mới để kiểm tra khả năng khám phá quy luật. Lộ trình kỹ thuật cũng cần kết hợp nhiều phương pháp (Scale-maxing, Simp-maxing, W-maxing) thay vì chỉ phụ thuộc vào một luật duy nhất. Tóm lại, bài báo nhấn mạnh rằng con đường đến AGI không phải là sự lặp lại tuyến tính của các mô hình lớn, mà là một sự thiết lập lại lộ trình, hướng tới việc xây dựng những hệ thống có tinh thần của một nhà khoa học: biết đặt câu hỏi "tại sao" và chủ động tìm kiếm câu trả lời.

marsbit05/28 00:26

Mô hình lớn quét sạch mọi kỳ thi, nhưng lại càng xa rời AGI hơn: Bài báo này đã vạch trần điều gì?

marsbit05/28 00:26

活动图片