Dwarkesh Patel: Thế hệ AI tiếp theo có thể được tạo ra từ công việc thực tế

marsbitXuất bản vào 2026-06-28Cập nhật gần nhất vào 2026-06-28

Tóm tắt

Bài viết trình bày phân tích của Dwarkesh Patel về hướng phát triển tiếp theo của AI, vượt ra ngoài khuôn khổ "Huấn luyện Củng cố với Phần thưởng có thể Xác minh" (RLVR) hiện tại. Ông chỉ ra rằng RLVR thành công trong các lĩnh vực như viết mã, toán học vì chúng có tính "có thể mài mòn" cao - dễ dàng nhân bản, thiết lập lại và kiểm tra song song. Tuy nhiên, nhiều nhiệm vụ thế giới thực như khởi nghiệp, vận động tranh cử hay nghiên cứu khoa học lại thiếu các thuộc tính này, khiến việc huấn luyện trở nên khó khăn. Điểm mấu chốt mà Patel đưa ra là sự cần thiết phải chuyển từ mô hình chỉ huấn luyện trước khi triển khai sang khả năng học tập liên tục từ kinh nghiệm triển khai thực tế. Ông cho rằng kiến thức giá trị nhất thường nảy sinh từ tương tác thực, lỗi thực và bối cảnh cụ thể, nhưng hiện tại việc học ngữ cảnh (in-context learning) của các mô hình lớn chỉ là tạm thời và không lưu lại trọng số. Bài viết đề xuất hai hướng tiếp cận chính cho mô hình học tập tiếp theo: 1. **Tự chưng cất theo chính sách (OPSD):** Nén kiến thức mà một mô hình đã học được trong một phiên làm việc dài (như một "nhân viên kỳ cựu") trở lại trọng số của mô hình cơ sở. 2. **Mơ mộng (Dreaming):** Mô hình tự xây dựng môi trường mô phỏng dựa trên quan sát thế giới thực để luyện tập và thử nghiệm chiến lược, sau đó nén kinh nghiệm thu được. Tầm nhìn cuối cùng là một quy trình huấn luyện mới: AI đầu tiên đạt được năng lực cơ bản thông qua RLVR, sau đó được triển khai để thực hiện công việc thực. Kinh nghi...

Dwarkesh Patel, người dẫn chương trình podcast công nghệ nổi tiếng ở Thung lũng Silicon, gần đây đã đặt ra một câu hỏi: Phương thức huấn luyện tiếp theo cho AI sẽ là gì?

Dwarkesh Patel là người dẫn chương trình podcast và nhà văn công nghệ nổi lên nhanh chóng ở Thung lũng Silicon trong vài năm gần đây, mới 25 tuổi nhưng đã thâm nhập vào vòng tròn lõi của các cuộc thảo luận về AI nhờ Dwarkesh Podcast. Những người ông phỏng vấn bao gồm Ilya Sutskever, Andrej Karpathy, Dario Amodei, Demis Hassabis, Mark Zuckerberg và nhiều nhân vật hàng đầu khác trong lĩnh vực AI và công nghệ. TIME đã liệt kê ông vào danh sách TIME100 AI năm 2024, cho rằng podcast của ông đã trở thành nội dung nghe quan trọng của nhiều người làm việc trong lĩnh vực AI.

Trong tập podcast mới nhất, ông tóm tắt hướng đi mà các phòng thí nghiệm AI tiên phong hiện nay đang đặt cược vào bằng một từ khóa: RLVR, tức là Reinforcement Learning with Verifiable Rewards (Học Tăng Cường với Phần Thưởng Có Thể Xác Minh).

Nói một cách đơn giản, đó là để mô hình thử và sai lặp đi lặp lại trong một loạt nhiệm vụ có thể tự động đánh giá đúng sai, từ đó huấn luyện ra khả năng lập kế hoạch, sửa lỗi, lặp lại và thực thi dài hạn. Những tiến bộ nhanh chóng ngày nay trong lĩnh vực mã code, toán học, phần lớn đều đến từ cách suy nghĩ này.

Nhưng điều Dwarkesh thực sự muốn hỏi là: Nếu thế hệ AI tiếp theo chỉ dựa vào loại "huấn luyện nhiệm vụ có thể xác minh" này, có đủ không?

Câu trả lời của ông là: Có lẽ là không đủ.

Bởi vì một nhiệm vụ chỉ "có thể xác minh" là chưa đủ, nó còn phải "có thể luyện" được.

Khái niệm chính ở đây là grindability, khả năng có thể mài giũa (hoặc trong ngữ cảnh huấn luyện AI, có thể hiểu là "tính chất có thể luyện tập lặp lại"). Trong ngữ cảnh huấn luyện AI, đó là "khả năng làm đi làm lại bài tập" hay "khả năng triển khai quy mô lớn".

Nhiệm vụ về mã code là một nhiệm vụ điển hình có thể "luyện" được. Bạn có thể chuẩn bị một kho lưu trữ phần mềm, một lỗi cần sửa, một bộ kiểm thử, sau đó sao chép cùng một môi trường đó thành hàng ngàn bản, để hàng ngàn agent thử cùng một lúc. Agent nào vượt qua kiểm thử thì được điểm. Quá trình này có thể thực hiện song song, tái tạo, đặt lại, đặc biệt phù hợp với RLVR.

Bài toán toán học cũng tương tự. Có thể xác minh đáp án đúng hay sai, môi trường huấn luyện cũng dễ sao chép.

Nhưng Dwarkesh đặt ra một câu hỏi rất thú vị: Tại sao tiến bộ của AI trong việc "sử dụng máy tính" lại chậm hơn so với mã code và toán học?

Thoạt nhìn, việc sử dụng máy tính cũng có thể xác minh. Ví dụ, đơn hàng có thành công hay không, địa điểm tổ chức sự kiện có đặt được không, biểu mẫu thuế có nộp chưa, những kết quả này đều có thể đánh giá. Nhưng vấn đề nằm ở chỗ, rất khó sao chép và phát lại chúng trên quy mô lớn. Bạn không thể để một nghìn agent đồng thời chạy cùng một quy trình thanh toán trên Amazon lặp đi lặp lại, vì trang web thực sẽ nhận diện bot, cấm tài khoản, thay đổi trạng thái. Tất nhiên bạn có thể tạo bản sao các ứng dụng như Slack, Gmail, Amazon để làm môi trường mô phỏng, nhưng ở giai đoạn hiện tại, đây vẫn là một công trình có chi phí cao và khả năng mở rộng thấp.

Dwarkesh chỉ ra: AI tiến bộ nhanh trong một lĩnh vực không chỉ vì kết quả trong lĩnh vực đó có thể xác minh, mà còn vì lĩnh vực đó có thể được đóng gói thành một môi trường huấn luyện có thể sao chép, phát lại và thử sai song song.

Điều này cũng giải thích tại sao các nhiệm vụ về mã code, toán học, trò chơi lại trở thành "vùng đất màu mỡ" tự nhiên cho RLVR, trong khi nhiều nhiệm vụ thế giới thực lại khó trực tiếp đưa vào phương thức huấn luyện này.

Sau đó, ông đẩy câu hỏi tới thế giới thực phức tạp hơn.

Nếu chúng ta muốn huấn luyện một AI khởi nghiệp từ số 0, phải làm sao?
Nếu muốn huấn luyện nó thắng một vụ kiện, phải làm sao?
Nếu muốn huấn luyện nó kiếm tiền ổn định trên thị trường, hoặc giúp một ứng viên giành chiến thắng trong cuộc bầu cử, phải làm sao?

Những nhiệm vụ này tất nhiên cũng có kết quả. Công ty có phát triển hay không, vụ kiện có thắng hay không, giao dịch có sinh lời hay không, cuộc bầu cử có thắng hay không, cuối cùng đều có thể đánh giá.

Nhưng vấn đề của chúng là: Phản hồi quá chậm, biến số quá nhiều, thế giới không thể đặt lại, cũng không thể sao chép thành một nghìn bản trong trung tâm dữ liệu.

Một lần khởi nghiệp có thể kéo dài nhiều năm. Một chiến dịch chính trị phụ thuộc vào khu vực cụ thể, ứng viên, tâm trạng cử tri, môi trường truyền thông và sự kiện ngẫu nhiên. Một vụ án pháp lý cũng không thể sao chép từ một điểm xuất phát giống nhau thành một nghìn vũ trụ song song để các agent khác nhau thử sai.

Loại môi trường này trong học tăng cường gần với cái gọi là môi trường không thể đặt lại (reset-free) và không ổn định (non-stationary environment): không thể tùy ý đặt lại, và bản thân môi trường còn đang liên tục thay đổi.

Vì vậy, Dwarkesh đặt câu hỏi: Agent được huấn luyện bởi RLVR trong môi trường có thể xác minh, có thể "luyện", liệu có thể tổng quát hóa cho những nhiệm vụ thế giới thực này không?

Đây không phải là một câu hỏi có thể trả lời bằng khẩu hiệu, mà là một vấn đề thực chứng.

Những người lạc quan sẽ nói rằng, chỉ cần môi trường RLVR đủ nhiều, đủ phức tạp, cuối cùng mô hình sẽ học được năng lực agent tổng quát. Khả năng lập kế hoạch và thử sai mà nó rèn luyện được trong mã code, toán học, trang web, sử dụng công cụ, cuối cùng sẽ chuyển giao sang các lĩnh vực như khởi nghiệp, quản lý tổ chức, chính trị, pháp luật, nghiên cứu khoa học.

Nhưng Dwarkesh vẫn hoài nghi về điều này.

Bởi vì trong thế giới thực, tri thức có giá trị nhất thường không xuất hiện dưới dạng rõ ràng, có thể xác minh, có thể lặp lại. Chúng có thể đến từ một phản hồi mơ hồ của khách hàng, một cuộc họp thất bại, một quy trình ngầm trong nội bộ tổ chức, một kiểu thất bại chỉ xuất hiện khi thực hiện nhiệm vụ thực tế. Để mô hình học được những điều này, nó không thể chỉ dựa vào "luyện bài tập", mà còn phải có hiệu suất mẫu thực sự.

Điều này đưa cuộc thảo luận đến điểm quan trọng nhất của toàn bài: learning back to the weights, tức là viết lại việc học vào trọng số.

Các mô hình lớn ngày nay đã rất giỏi trong việc học trong ngữ cảnh (in-context learning). Nó có thể đọc nhiều tài liệu trong một ngữ cảnh dài, hiểu bối cảnh của một dự án, tạm thời thích ứng với nhu cầu của một người dùng hoặc tổ chức. Nhưng vấn đề là, việc học này chủ yếu chỉ nằm trong cửa sổ ngữ cảnh. Sau khi phiên làm việc kết thúc, mô hình không nhất thiết thực sự "ghi nhớ".

Dwarkesh cho rằng, đây là một sự lãng phí lớn.

Bởi vì tín hiệu huấn luyện thực sự có giá trị của mô hình lại xuất hiện chính sau khi được triển khai. Mô hình được người dùng thực sử dụng, bước vào tổ chức thực, tham gia nhiệm vụ thực, phơi bày lỗi sai thực. Nó sẽ thấy công ty vận hành như thế nào, mọi người thực tế dùng nó để làm gì, những chỗ nào thường xuyên thất bại, những đề xuất nào trong thực tế hoàn toàn không khả thi.

Nhưng nếu những kinh nghiệm này không thể lắng đọng lại vào trọng số mô hình, thì nó chỉ là một sự thích ứng tạm thời trong một phiên làm việc, chứ không phải là sự tăng trưởng năng lực dài hạn.

Ông dùng việc học của con người để làm một phép loại suy: Con người không trở nên mạnh mẽ bằng cách ghi nhớ nguyên văn mọi sự việc xảy ra mỗi ngày. Một nhân viên trở nên hữu ích sau nửa năm làm việc, không phải vì anh ta nhớ từng email, từng ghi chú cuộc họp, mà vì anh ta đã nén những trải nghiệm đó thành khả năng phán đoán, trực giác, hiểu biết về quy trình và các mẫu vấn đề.

Mô hình cũng nên như vậy.

Học liên tục thực sự (continual learning), không phải là mở rộng vô hạn bộ nhớ KV cache, cũng không phải nhồi nhét tất cả lịch sử vào ngữ cảnh, mà là từ kinh nghiệm thực tế tinh lọc ra một lượng nhỏ kiến thức thực sự hữu ích, rồi nén chúng vào trọng số.

Đây chính là vấn đề mà Dwarkesh cho rằng phương thức huấn luyện thế hệ tiếp theo phải giải quyết.

Vậy, cụ thể làm thế nào?

Ông đề cập đến một hướng đang được thảo luận: on-policy self-distillation, viết tắt là OPSD.

Có thể hiểu đại khái là: Để một mô hình đã tích lũy nhiều kinh nghiệm trong các phiên làm việc dài, đóng vai "nhân viên kỳ cựu" hoặc giáo viên (teacher); sau đó huấn luyện mô hình cơ sở, để ngay cả khi không có đầy đủ ngữ cảnh đó, nó cũng có thể đưa ra phán đoán tương tự như teacher.

Nói cách khác, chưng cất những thứ mô hình học được trong ngữ cảnh qua một nhiệm vụ thực tế, quay trở lại trọng số của chính mô hình đó.

Điều này khác với SFT thông thường. SFT đơn giản nhất có thể chỉ là để mô hình dự đoán token đã xuất hiện trong phiên làm việc, tương đương với việc để nó kể lại toàn bộ nhật ký công việc. Nhưng đây không phải là học hiệu quả. Điều quan trọng thực sự không phải là ghi nhớ mọi chi tiết, mà là tinh lọc ra những hiểu biết then chốt có thể giúp mô hình làm tốt hơn vào lần sau.

Ưu điểm của OPSD là nó không nhất thiết cần một phần thưởng có thể xác minh bên ngoài. Chỉ cần mô hình có thể học được điều gì đó hữu ích trong ngữ cảnh, thì có thể lấy "mô hình sau khi học" làm teacher, để mô hình cơ sở tiến gần tới nó.

Đồng thời, so với RL thông thường chỉ có phần thưởng cuối cùng, OPSD có thể cung cấp tín hiệu giám sát dày đặc hơn. Nó có thể so sánh sự khác biệt về phân bố xác suất giữa teacher và student ở cấp độ token, từ đó nén kinh nghiệm khan hiếm từ một nhiệm vụ thực tế thành những cập nhật trọng số nhỏ hơn, chính xác hơn.

Ngoài OPSD, Dwarkesh còn đề xuất một hướng khác: dreaming (mơ).

Dreaming ở đây là chỉ việc AI dựa trên quan sát thế giới thực, tự xây dựng một môi trường mô phỏng, sau đó luyện tập lặp đi lặp lại, thử nghiệm chiến lược, củng cố hành vi hiệu quả bên trong đó.

Nghe có vẻ giống với model-based RL trong truyền thống học tăng cường, cũng giống như Sutton luôn nhấn mạnh về agent tích lũy kinh nghiệm thông qua tương tác với môi trường. Điều khác biệt là, Dwarkesh đặt nó vào ngữ cảnh của mô hình lớn và triển khai thực tế.

Ví dụ, một AI sau khi quan sát một quy trình kinh doanh cụ thể trong một công ty thực, không chỉ viết một bản tóm tắt, mà còn sử dụng lượng tính toán lớn để xây dựng "phiên bản trò chơi mô phỏng" của quy trình này. Sau đó nó thử nghiệm các chiến lược giao tiếp, đường dẫn thực thi và cách thức thúc đẩy dự án khác nhau trong đó, xem cái gì có khả năng thành công hơn. Cuối cùng, nén những kinh nghiệm có được từ các bài tập mô phỏng này trở lại mô hình.

Nếu hướng đi này thành lập, nó có thể trở thành một trục mở rộng mới (scaling axis).

Trong quá khứ, sự mở rộng của AI chủ yếu đến từ ba trục: huấn luyện trước (pretraining), RL và tính toán tại thời điểm suy luận (inference-time compute). Dwarkesh hình dung, tương lai có thể sẽ có thêm trục thứ tư: test-time training, hay còn gọi là dreaming. Mô hình không chỉ suy luận, mà trong quá trình suy luận và thực thi nhiệm vụ, nó còn xây dựng môi trường mô phỏng cho người dùng, tổ chức, dự án cụ thể, và huấn luyện chính mình trong đó.

Đây cũng là lý do tại sao có người trong phần bình luận đề cập đến bài viết "Welcome to the Era of Experience" của David Silver và Richard Sutton: bài viết đó cũng nhấn mạnh, AI không thể mãi mãi phụ thuộc vào dữ liệu của con người, chìa khóa cho giai đoạn tiếp theo sẽ là tác nhân thông minh (agent) thu được kinh nghiệm từ sự tương tác của chính nó với môi trường.

Dwarkesh thì cụ thể hóa phán đoán vĩ mô đó thành vấn đề huấn luyện mô hình lớn ngày nay: RLVR là một giai đoạn chuyển tiếp quan trọng, nó để mô hình rèn luyện năng lực agent trong các nhiệm vụ có thể xác minh; nhưng để bước vào thế giới thực phức tạp hơn, mô hình phải học cách liên tục học hỏi từ quá trình triển khai thực tế, và viết kinh nghiệm trở lại trọng số.

Trong viễn cảnh năm 2027 hoặc 2028 mà Dwarkesh hình dung, quy trình huấn luyện có thể sẽ trở thành như thế này:

Đầu tiên, RLVR huấn luyện ra một agent có năng lực cơ bản. Agent này được đưa vào một vấn đề xa lạ, ít nhất là có thể nắm bắt tình hình, thử các chiến lược khác nhau, tiếp tục lặp lại sau khi gặp trở ngại;
Sau đó, agent này được triển khai vào thế giới thực, bắt đầu làm công việc thực. Nó có thể làm việc liên tục với người dùng trong một tuần, tham gia một dự án không nằm trong phân phối huấn luyện ban đầu;
Sau khi kết thúc một tuần, người dùng cho nó một "ngón tay cái giơ lên" hoặc "ngón tay cái chỉ xuống", thậm chí viết một đoạn đánh giá công việc. Nếu kết quả là tích cực, mô hình sẽ chưng cất những thứ học được từ nhiệm vụ này trở lại mô hình cơ sở. Quá trình này có thể sử dụng OPSD, có thể sử dụng dreaming, cũng có thể sử dụng một công nghệ mới nào đó hiện chưa xuất hiện.

Một khi con đường này chạy thông, ranh giới năng lực của AI sẽ không còn bị giới hạn bởi những "nhiệm vụ có thể xác minh" ban đầu nữa.

Nó có thể trước tiên thông qua RLVR để học mã code, toán học, nhiệm vụ trang web, gọi công cụ; sau đó thông qua triển khai thực tế để học quản lý tổ chức, quy trình kinh doanh, hợp tác phức tạp; rồi từ những kinh nghiệm đó, tiếp tục mở rộng sang các lĩnh vực liền kề.

Điều này cũng có nghĩa là, nguồn chính cho sự tiến bộ của AI có thể sẽ thay đổi.

Trước đây, một mô hình được huấn luyện xong trước khi phát hành, người dùng chỉ sử dụng nó. Mô hình thế hệ tiếp theo có thể là: trước khi phát hành, trước tiên huấn luyện ra agent cơ sở, sau khi phát hành, tiếp tục học thông qua lượng lớn nhiệm vụ thực tế. Mỗi lần tương tác với người dùng, mỗi lần thực thi dự án thực, mỗi lần thất bại và sửa chữa, đều có thể trở thành nguyên liệu để nâng cấp năng lực cho vòng tiếp theo.

Vì vậy, cái gọi là "phương thức huấn luyện thế hệ tiếp theo" của Dwarkesh, không đơn giản chỉ nói rằng mô hình phải lớn hơn, dữ liệu phải nhiều hơn, RL phải mạnh hơn.

Nó thực sự hướng tới: AI từ huấn luyện trước khi phát hành, tiến tới học hỏi sau khi phát hành; từ dữ liệu của con người, tiến tới kinh nghiệm từ môi trường; từ sự thích ứng tạm thời trong ngữ cảnh, tiến tới năng lực dài hạn trong trọng số.

Dữ liệu huấn luyện AI quan trọng nhất trong tương lai, có thể không còn chỉ là văn bản đã có trên internet, cũng không chỉ là các nhiệm vụ có thể xác minh được xây dựng sẵn trong phòng thí nghiệm, mà là kinh nghiệm mà chính AI tích lũy được khi hoàn thành các nhiệm vụ thực tế trong thế giới thực.

Liên kết tham khảo:

https://x.com/dwarkesh_sp/status/2070551894674555081

Bài viết này đến từ tài khoản WeChat công cộng "机器之心" (ID:almosthuman2014), tác giả: 关注AI训练

Tiền kỹ thuật số thịnh hành

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Câu hỏi Liên quan

QDwarkesh Patel là ai và ý tưởng chính của ông ấy về hướng phát triển tiếp theo của AI là gì?

ADwarkesh Patel là một nhà báo, người dẫn podcast công nghệ nổi tiếng ở Thung lũng Silicon, 25 tuổi, được tạp chí TIME đưa vào danh sách TIME100 AI 2024. Ý tưởng chính của ông là thế hệ AI tiếp theo cần chuyển từ mô hình huấn luyện truyền thống dựa trên dữ liệu có sẵn và nhiệm vụ 'có thể xác minh' (RLVR) sang mô hình học tập liên tục từ kinh nghiệm thực tế khi triển khai, và nén những kiến thức đó vào trọng số của mô hình thông qua các phương pháp như OPSD (on-policy self-distillation) và 'mơ mộng' (dreaming).

QRLVR là gì và tại sao nó được coi là quan trọng nhưng có thể không đủ cho tương lai của AI?

ARLVR (Reinforcement Learning with Verifiable Rewards) là Học tăng cường với Phần thưởng Có thể Xác minh. Đây là phương pháp huấn luyện mô hình bằng cách để nó thử-sai lặp lại trong một số lượng lớn các nhiệm vụ mà kết quả đúng/sai có thể được đánh giá tự động (như viết mã, toán học). Nó quan trọng vì giúp mô hình phát triển khả năng lập kế hoạch, sửa lỗi. Tuy nhiên, nó có thể không đủ vì nhiều nhiệm vụ thực tế phức tạp (như khởi nghiệp, tranh tụng) thiếu tính 'có thể mài giũa' (grindability) - tức là không dễ dàng sao chép, phát lại song song hàng nghìn lần để huấn luyện, và phản hồi quá chậm, biến số quá nhiều.

QKhái niệm 'learning back to the weights' (học đưa lại vào trọng số) nghĩa là gì và tại sao nó quan trọng?

A'Learning back to the weights' đề cập đến việc nén những kiến thức và kinh nghiệm quý giá mà AI thu được trong quá trình tương tác thực tế với thế giới (khi được triển khai) trở lại thành những thay đổi vĩnh viễn trong trọng số (parameters) của mô hình cơ sở. Điều này quan trọng vì hiện tại, phần lớn việc học của AI trong một phiên làm việc (in-context learning) chỉ tồn tại trong bộ nhớ ngắn hạn (context window) và biến mất sau đó. Để AI thực sự 'trưởng thành' và tích lũy năng lực lâu dài từ kinh nghiệm thực tế, nó cần cơ chế này.

QOPSD (On-policy Self-Distillation) và 'Dreaming' được đề xuất như thế nào để giải quyết vấn đề học tập liên tục?

AHai hướng được đề xuất là: 1) OPSD (On-policy Self-Distillation - Tự chưng cất theo chính sách): Một mô hình 'giáo viên' đã tích lũy kinh nghiệm qua một phiên làm việc dài sẽ dạy lại cho mô hình cơ sở (học sinh), giúp mô hình cơ sở nắm bắt những hiểu biết then chốt mà không cần ghi nhớ toàn bộ ngữ cảnh. 2) 'Dreaming' (Mơ mộng): AI quan sát thế giới thực, sau đó tự xây dựng một môi trường mô phỏng để thử nghiệm các chiến lược khác nhau bên trong đó, rồi nén kinh nghiệm từ các lần thử nghiệm mô phỏng này vào trọng số của chính nó.

QQuy trình huấn luyện AI trong tương lai theo dự đoán của Dwarkesh Patel sẽ diễn ra như thế nào?

ATheo dự đoán của Dwarkesh Patel, quy trình vào khoảng năm 2027-2028 có thể là: Đầu tiên, mô hình được huấn luyện cơ bản bằng RLVR trên các nhiệm vụ 'có thể xác minh' (như mã, toán) để trở thành một tác nhân có năng lực cơ bản. Sau đó, nó được triển khai vào thế giới thực để thực hiện các nhiệm vụ thực (ví dụ: làm việc trong một dự án một tuần). Cuối nhiệm vụ, dựa trên phản hồi của người dùng (như đánh giá tích cực), kinh nghiệm thu được từ nhiệm vụ thực đó sẽ được chưng cất (ví dụ qua OPSD) hoặc xử lý (qua 'dreaming') để cập nhật vào trọng số của mô hình cơ sở, giúp nó mạnh hơn cho những lần sau.

Nội dung Liên quan

Một nhóm người chơi trên chain không xem World Cup, đã làm giàu từ ANSEM

Bài báo chia sẻ câu chuyện về sự bùng nổ của memecoin ANSEM trên mạng Solana. Trong vòng chưa đầy một ngày, vốn hóa của ANSEM đã tăng từ khoảng 4 triệu USD lên hơn 100 triệu USD, tạo ra những câu chuyện làm giàu nhanh chóng, như trường hợp một nhà đầu tư thu về lợi nhuận gấp 135 lần. ANSEM không phải do KOL nổi tiếng Ansem (Zion Thomas) phát hành hay bảo trợ, mà là một đồng memecoin cộng đồng có tên "The Black Bull". Tuy nhiên, mối liên hệ trong tâm trí cộng đồng được củng cố khi người tạo ra ANSEM gửi khoảng 65% tổng nguồn cung vào ví công khai của Ansem. Đợt tăng giá mạnh bắt đầu sau khi Ansem thông báo trên X rằng anh sẽ sử dụng phí sáng tạo kiếm được từ Pump.fun (khoảng 200.000 USD/tuần) để airdrop ngẫu nhiên cho người hâm mộ. Thông điệp này đã đánh trúng tâm lý thất vọng của nhiều người chơi đang chờ đợi airdrop từ PUMP, biến ANSEM thành tài sản được giao dịch để "thể hiện cảm xúc" này. Bài báo nhấn mạnh rằng đà tăng của ANSEM chủ yếu được thúc đẩy bởi cảm xúc, sự chú ý và cấu trúc nguồn cung (phần lớn bị khóa trong ví của Ansem, làm giảm nguồn cung lưu hành thực tế). Trong khi nó mang lại cảm giác phấn khích cho thị trường memecoin Solana, bài viết cũng cảnh báo rằng đây là một động thái mang tính đầu cơ cao, dễ biến động và phụ thuộc vào việc cộng đồng có tiếp tục duy trì câu chuyện hay không.

Odaily星球日报1 giờ trước

Một nhóm người chơi trên chain không xem World Cup, đã làm giàu từ ANSEM

Odaily星球日报1 giờ trước

KAITO chuyển 10,33 triệu USD tiền ảo – Phe bò có thể đẩy giá lên 0,65 USD không?

KAITO đã chuyển 18 triệu token, trị giá 10,33 triệu USD vào một ví mới, thu hút sự chú ý của thị trường và tạo ra đồn đoán về mục đích. Mặc dù động thái này gây phấn khích, dữ liệu thị trường giao ngay (Spot Taker CVD) cho thấy áp lực bán vẫn chiếm ưu thế, nhiều nhà giao dịch có vẻ thận trọng và muốn chốt lời. Trong khi đó, thị trường phái sinh lại lạc quan hơn khi lãi suất mở (Open Interest) tăng 14.02%, lên khoảng 55,95 triệu USD, cho thấy sự gia tăng mở vị thế mua. Về kỹ thuật, KAITO đã phá vỡ vùng kháng cự quan trọng ở mức $0.5325 và giao dịch quanh $0.5794, hướng đến thử thách vùng kháng cự tiếp theo ở $0.6500. Chỉ số RSI đạt 70.42, báo hiệu vùng quá mua. Tóm lại, cấu trúc kỹ thuật tích cực và sự tham gia của phái sinh tạo cơ hội tăng giá. Tuy nhiên, áp lực bán trên thị trường giao ngay vẫn là yếu tố cần theo dõi. Khả năng tăng lên $0.6500 phụ thuộc vào việc giá có giữ được trên mức hỗ trợ $0.5325 hay không.

ambcrypto1 giờ trước

KAITO chuyển 10,33 triệu USD tiền ảo – Phe bò có thể đẩy giá lên 0,65 USD không?

ambcrypto1 giờ trước

Tại sao mức tăng 558% khối lượng giao dịch của Sonic có thể không chỉ là một đợt phục hồi tạm thời

Giá Sonic (S) đã tăng hơn 18% trong 24 giờ qua, cùng với khối lượng giao dịch tăng 558% lên khoảng 60 triệu USD. Động thái này diễn ra sau thông báo của Sonic Labs về việc tạm dừng kế hoạch phát hành token hàng năm nhằm ổn định giá trị lâu dài, khôi phục lòng tin của nhà đầu tư. Hoạt động mạng lưới cũng tăng mạnh, với số lượng địa chỉ ví duy nhất đạt mức kỷ lục 7,20 triệu và giao dịch hàng ngày tăng hơn 17%. Về mặt kỹ thuật, giá S đang tiếp cận vùng kháng cự quan trọng của một kênh xu hướng giảm. Khả năng phá vỡ ngưỡng này sẽ quyết định xu hướng tiếp theo. Mặc dù sức mua đang chiếm ưu thế, nhưng áp lực bán vẫn tồn tại, cho thấy đà tăng có thể chưa bền vững trong ngắn hạn nếu không vượt qua được kháng cự.

ambcrypto2 giờ trước

Tại sao mức tăng 558% khối lượng giao dịch của Sonic có thể không chỉ là một đợt phục hồi tạm thời

ambcrypto2 giờ trước

Sức mạnh xử lý sắp cạn: Google thầm áp đặt hạn mức sử dụng Gemini đối với Meta

Cuộc khủng hoảng hạ tầng AI đang leo thang giữa các gã khổng lồ công nghệ. Theo các nguồn tin, từ khoảng tháng 3, Google đã thông báo với Meta rằng họ không thể đáp ứng toàn bộ nhu cầu sử dụng mô hình Gemini và áp dụng giới hạn sử dụng, gây ra sự chậm trễ cho một số dự án AI nội bộ của Meta. Cả hai công ty từ chối bình luận. Tình trạng thiếu hụt năng lực tính toán (compute) buộc Google phải đẩy nhanh việc mở rộng, bao gồm ký hợp đồng thuê năng lực tính toán trị giá 920 triệu USD mỗi tháng với SpaceX của Elon Musk. Giám đốc điều hành Google Sundar Pichai thừa nhận hạn chế về compute đang ảnh hưởng đến doanh thu đám mây. Meta, một trong những khách hàng doanh nghiệp lớn nhất của Google, bị ảnh hưởng nặng nề nhất. Công ty này sử dụng Gemini cho nhiều mục đích như kiểm duyệt nội dung, chatbot hỗ trợ và phát triển mã nguồn. Để giảm phụ thuộc, Meta đang đẩy mạnh chuyển sang sử dụng mô hình tự phát triển như Muse Spark và tăng cường đầu tư vào hạ tầng data center riêng. Sự việc cho thấy áp lực ngày càng tăng từ khối lượng công việc suy luận (AI inference) sau khi mô hình được huấn luyện, trở thành một trong những thách thức lớn nhất của ngành, bất chấp hàng trăm tỷ USD đã được đổ vào chip và trung tâm dữ liệu.

marsbit2 giờ trước

Sức mạnh xử lý sắp cạn: Google thầm áp đặt hạn mức sử dụng Gemini đối với Meta

marsbit2 giờ trước

Câu hỏi "Anh có chắc không?" khiến mô hình lớn AI bộc lộ "tính cách xu nịnh"?

Ngay cả các mô hình AI mạnh mẽ nhất cũng khó cưỡng lại sự nghi ngờ lặp đi lặp lại từ người dùng. Một bài đăng gần đây trên X của shadcn@shadcn đã gây bão trong cộng đồng phát triển và nghiên cứu AI: "Không có mô hình nào có thể đứng vững trước câu hỏi 'Bạn có chắc không?' - tất cả đều nhanh chóng đầu hàng." Điều này phản ánh một tình huống phổ biến: người dùng chỉ cần hỏi lại "Bạn có chắc không?" mà không cung cấp thông tin mới, nhiều mô hình lớn (LLM) lập tức xin lỗi, sửa đổi câu trả lời, thậm chí biến một đáp án đúng thành sai. Trong phần bình luận, nhiều người dùng chia sẻ trải nghiệm tương tự, nơi AI dễ dàng bị "gaslight" (thao túng tâm lý) để đưa ra câu trả lời kém hơn dù ban đầu nó đúng. Họ nhận xét các mô hình thiếu sự tự tin thực sự; sự chắc chắn của chúng chỉ là cảm giác được đóng gói thành sự tự tin. Tuy nhiên, một số người dùng chỉ ra rằng không phải tất cả mô hình đều như vậy. Ví dụ, AI trợ lý Poke của The Interaction Company và Claude Opus 4.8 của Anthropic có thể giữ vững lập trường khi bị chất vấn. Claude Opus 4.6 cũng được khen ngợi nhờ khả năng "chịu được áp lực" nếu được hướng dẫn trong prompt hệ thống rằng nên phản đối khi chắc chắn. Nguyên nhân sâu xa của hành vi "xu nịnh" này thường được quy cho "lời nguyền" từ quá trình Huấn luyện Củng cố bằng Phản hồi Con người (RLHF). Trong quá trình căn chỉnh, các mô hình được khen thưởng vì an toàn, lịch sự và tuân theo mong đợi của con người. Việc "cãi lại" hoặc kiên định có thể bị trừng phạt, trong khi xin lỗi và tuân theo người dùng là con đường an toàn để đạt điểm cao, vô hình trung tạo ra "nhân cách xu nịnh" ở AI. Hiện tượng này còn được gọi là "AI sycophancy" - sự hy sinh tính nhất quán thực tế để chiều theo khuynh hướng người dùng. Một số ý kiến cho rằng cần có một tiêu chuẩn đánh giá (benchmark) mới, chẳng hạn như benchmark "Bạn có chắc không?", để đo lường khả năng giữ vững lập trường của mô hình khi bị người dùng chất vấn sau khi đã đưa ra câu trả lời đúng. Một trợ lý AI đủ tiêu chuẩn không chỉ cần chính xác trong các bài kiểm tra tĩnh mà còn phải có khả năng chống nhiễu và duy trì ranh giới phán đoán trong đối thoại thực tế.

marsbit2 giờ trước

Câu hỏi "Anh có chắc không?" khiến mô hình lớn AI bộc lộ "tính cách xu nịnh"?

marsbit2 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

GROK AI là gì

Grok AI: Cách mạng hóa Công nghệ Đối thoại trong Kỷ nguyên Web3 Giới thiệu Trong bối cảnh trí tuệ nhân tạo đang phát triển nhanh chóng, Grok AI nổi bật như một dự án đáng chú ý kết nối các lĩnh vực công nghệ tiên tiến và tương tác người dùng. Được phát triển bởi xAI, một công ty do doanh nhân nổi tiếng Elon Musk dẫn dắt, Grok AI nhằm định nghĩa lại cách chúng ta tương tác với trí tuệ nhân tạo. Khi phong trào Web3 tiếp tục phát triển mạnh mẽ, Grok AI hướng tới việc tận dụng sức mạnh của AI đối thoại để trả lời các câu hỏi phức tạp, mang đến cho người dùng một trải nghiệm không chỉ thông tin mà còn giải trí. Grok AI là gì? Grok AI là một chatbot AI đối thoại tinh vi được thiết kế để tương tác với người dùng một cách linh hoạt. Khác với nhiều hệ thống AI truyền thống, Grok AI chấp nhận một loạt các câu hỏi rộng hơn, bao gồm những câu hỏi thường được coi là không phù hợp hoặc ngoài các phản hồi tiêu chuẩn. Các mục tiêu cốt lõi của dự án bao gồm: Lập luận đáng tin cậy: Grok AI nhấn mạnh lập luận theo lẽ thường để cung cấp các câu trả lời hợp lý dựa trên sự hiểu biết về ngữ cảnh. Giám sát có thể mở rộng: Việc tích hợp công cụ hỗ trợ đảm bảo rằng các tương tác của người dùng được theo dõi và tối ưu hóa về chất lượng. Xác minh chính thức: An toàn là điều tối quan trọng; Grok AI tích hợp các phương pháp xác minh chính thức để nâng cao độ tin cậy của các đầu ra của nó. Hiểu biết về ngữ cảnh dài: Mô hình AI xuất sắc trong việc giữ lại và nhớ lại lịch sử cuộc trò chuyện dài, tạo điều kiện cho các cuộc thảo luận có ý nghĩa và nhận thức về ngữ cảnh. Khả năng chống lại các cuộc tấn công: Bằng cách tập trung vào việc cải thiện khả năng phòng thủ chống lại các đầu vào bị thao túng hoặc độc hại, Grok AI nhằm duy trì tính toàn vẹn của các tương tác của người dùng. Nói tóm lại, Grok AI không chỉ là một thiết bị truy xuất thông tin; nó là một đối tác đối thoại hấp dẫn khuyến khích cuộc trò chuyện năng động. Người sáng tạo Grok AI Bộ óc đứng sau Grok AI không ai khác chính là Elon Musk, một cá nhân gắn liền với sự đổi mới trong nhiều lĩnh vực, bao gồm ô tô, du hành vũ trụ và công nghệ. Dưới sự bảo trợ của xAI, một công ty tập trung vào việc phát triển công nghệ AI theo những cách có lợi, tầm nhìn của Musk nhằm định hình lại cách hiểu về các tương tác AI. Sự lãnh đạo và tinh thần nền tảng bị ảnh hưởng sâu sắc bởi cam kết của Musk trong việc thúc đẩy các ranh giới công nghệ. Các nhà đầu tư của Grok AI Mặc dù các chi tiết cụ thể về các nhà đầu tư hỗ trợ Grok AI vẫn còn hạn chế, nhưng đã được công nhận công khai rằng xAI, vườn ươm của dự án, được thành lập và hỗ trợ chủ yếu bởi chính Elon Musk. Các dự án và tài sản trước đây của Musk cung cấp một nền tảng vững chắc, tăng cường thêm độ tin cậy và tiềm năng phát triển của Grok AI. Tuy nhiên, tính đến thời điểm hiện tại, thông tin về các quỹ đầu tư hoặc tổ chức bổ sung hỗ trợ Grok AI vẫn chưa dễ dàng tiếp cận, đánh dấu một lĩnh vực có thể khám phá trong tương lai. Grok AI hoạt động như thế nào? Cơ chế hoạt động của Grok AI sáng tạo không kém gì khung khái niệm của nó. Dự án tích hợp một số công nghệ tiên tiến giúp tạo ra các chức năng độc đáo của nó: Hạ tầng mạnh mẽ: Grok AI được xây dựng bằng Kubernetes cho việc điều phối container, Rust cho hiệu suất và an toàn, và JAX cho tính toán số hiệu suất cao. Bộ ba này đảm bảo rằng chatbot hoạt động hiệu quả, mở rộng hiệu quả và phục vụ người dùng kịp thời. Truy cập kiến thức theo thời gian thực: Một trong những tính năng nổi bật của Grok AI là khả năng truy cập dữ liệu theo thời gian thực thông qua nền tảng X—trước đây được biết đến với tên gọi Twitter. Khả năng này cho phép AI truy cập thông tin mới nhất, giúp nó cung cấp các câu trả lời và khuyến nghị kịp thời mà các mô hình AI khác có thể bỏ lỡ. Hai chế độ tương tác: Grok AI cung cấp cho người dùng sự lựa chọn giữa “Chế độ Vui” và “Chế độ Thông thường.” Chế độ Vui cho phép một phong cách tương tác vui tươi và hài hước hơn, trong khi Chế độ Thông thường tập trung vào việc cung cấp các câu trả lời chính xác và đúng đắn. Sự linh hoạt này đảm bảo một trải nghiệm được cá nhân hóa phù hợp với sở thích của từng người dùng. Nói tóm lại, Grok AI kết hợp hiệu suất với sự tương tác, tạo ra một trải nghiệm vừa phong phú vừa giải trí. Thời gian phát triển của Grok AI Hành trình của Grok AI được đánh dấu bởi các cột mốc quan trọng phản ánh các giai đoạn phát triển và triển khai của nó: Phát triển ban đầu: Giai đoạn nền tảng của Grok AI diễn ra trong khoảng hai tháng, trong đó việc đào tạo và tinh chỉnh ban đầu của mô hình được thực hiện. Phát hành Beta Grok-2: Trong một bước tiến quan trọng, beta Grok-2 đã được công bố. Phiên bản này giới thiệu hai phiên bản của chatbot—Grok-2 và Grok-2 mini—mỗi phiên bản đều có khả năng trò chuyện, lập trình và lập luận. Truy cập công khai: Sau khi phát triển beta, Grok AI đã trở thành có sẵn cho người dùng nền tảng X. Những người có tài khoản được xác minh bằng số điện thoại và hoạt động ít nhất bảy ngày có thể truy cập phiên bản giới hạn, giúp công nghệ có sẵn cho một đối tượng rộng lớn hơn. Thời gian này tóm tắt sự phát triển có hệ thống của Grok AI từ lúc khởi đầu đến khi công khai, nhấn mạnh cam kết của nó đối với việc cải tiến liên tục và tương tác người dùng. Các tính năng chính của Grok AI Grok AI bao gồm một số tính năng chính góp phần vào bản sắc đổi mới của nó: Tích hợp kiến thức theo thời gian thực: Truy cập thông tin hiện tại và liên quan phân biệt Grok AI với nhiều mô hình tĩnh, cho phép một trải nghiệm người dùng hấp dẫn và chính xác. Phong cách tương tác đa dạng: Bằng cách cung cấp các chế độ tương tác khác nhau, Grok AI phục vụ cho sở thích đa dạng của người dùng, khuyến khích sự sáng tạo và cá nhân hóa trong việc trò chuyện với AI. Cơ sở công nghệ tiên tiến: Việc sử dụng Kubernetes, Rust và JAX cung cấp cho dự án một khung vững chắc để đảm bảo độ tin cậy và hiệu suất tối ưu. Xem xét về đạo đức trong đối thoại: Việc bao gồm chức năng tạo hình ảnh thể hiện tinh thần đổi mới của dự án. Tuy nhiên, nó cũng đặt ra các vấn đề đạo đức liên quan đến bản quyền và việc thể hiện tôn trọng các nhân vật dễ nhận biết—một cuộc thảo luận đang diễn ra trong cộng đồng AI. Kết luận Như một thực thể tiên phong trong lĩnh vực AI đối thoại, Grok AI khái quát tiềm năng cho những trải nghiệm người dùng chuyển đổi trong kỷ nguyên số. Được phát triển bởi xAI và được thúc đẩy bởi cách tiếp cận tầm nhìn của Elon Musk, Grok AI tích hợp kiến thức theo thời gian thực với khả năng tương tác tiên tiến. Nó cố gắng mở rộng ranh giới của những gì trí tuệ nhân tạo có thể đạt được trong khi vẫn giữ trọng tâm vào các vấn đề đạo đức và an toàn cho người dùng. Grok AI không chỉ thể hiện sự tiến bộ công nghệ mà còn thể hiện một mô hình đối thoại mới trong bối cảnh Web3, hứa hẹn sẽ thu hút người dùng bằng cả kiến thức sâu sắc và sự tương tác vui tươi. Khi dự án tiếp tục phát triển, nó đứng như một minh chứng cho những gì giao thoa giữa công nghệ, sáng tạo và tương tác giống như con người có thể đạt được.

Tổng lượt xem 672Xuất bản vào 2024.12.26Cập nhật vào 2024.12.26

ERC AI là gì

Euruka Tech: Tổng Quan về $erc ai và Những Tham Vọng trong Web3 Giới thiệu Trong bối cảnh công nghệ blockchain và ứng dụng phi tập trung đang phát triển nhanh chóng, các dự án mới thường xuyên xuất hiện, mỗi dự án đều có những mục tiêu và phương pháp độc đáo. Một trong những dự án đó là Euruka Tech, hoạt động trong lĩnh vực tiền điện tử và Web3 rộng lớn. Mục tiêu chính của Euruka Tech, đặc biệt là token $erc ai của nó, là cung cấp các giải pháp sáng tạo nhằm khai thác những khả năng đang phát triển của công nghệ phi tập trung. Bài viết này nhằm cung cấp một cái nhìn tổng quan về Euruka Tech, khám phá các mục tiêu, chức năng, danh tính của người sáng lập, các nhà đầu tư tiềm năng và tầm quan trọng của nó trong bối cảnh rộng lớn hơn của Web3. Euruka Tech, $erc ai là gì? Euruka Tech được mô tả như một dự án tận dụng các công cụ và chức năng mà môi trường Web3 cung cấp, tập trung vào việc tích hợp trí tuệ nhân tạo trong các hoạt động của nó. Mặc dù các chi tiết cụ thể về khung của dự án vẫn còn mơ hồ, nhưng nó được thiết kế để nâng cao sự tham gia của người dùng và tự động hóa các quy trình trong không gian tiền điện tử. Dự án nhằm tạo ra một hệ sinh thái phi tập trung không chỉ tạo điều kiện cho các giao dịch mà còn tích hợp các chức năng dự đoán thông qua trí tuệ nhân tạo, do đó tên gọi của token, $erc ai. Mục tiêu là cung cấp một nền tảng trực quan giúp tạo ra các tương tác thông minh hơn và xử lý giao dịch hiệu quả hơn trong lĩnh vực Web3 đang phát triển. Ai là Người Sáng Lập Euruka Tech, $erc ai? Hiện tại, thông tin về người sáng lập hoặc đội ngũ sáng lập đứng sau Euruka Tech vẫn chưa được xác định và có phần mờ mịt. Sự thiếu hụt dữ liệu này gây ra lo ngại, vì kiến thức về nền tảng của đội ngũ thường rất quan trọng để thiết lập độ tin cậy trong lĩnh vực blockchain. Do đó, chúng tôi đã phân loại thông tin này là không rõ cho đến khi có các chi tiết cụ thể được công bố trong lĩnh vực công cộng. Ai là Các Nhà Đầu Tư của Euruka Tech, $erc ai? Tương tự, việc xác định các nhà đầu tư hoặc tổ chức hỗ trợ cho dự án Euruka Tech không được cung cấp dễ dàng qua các nghiên cứu hiện có. Một khía cạnh quan trọng đối với các bên liên quan tiềm năng hoặc người dùng đang xem xét tham gia vào Euruka Tech là sự đảm bảo đến từ các quan hệ đối tác tài chính đã được thiết lập hoặc sự hỗ trợ từ các công ty đầu tư uy tín. Thiếu thông tin về các mối quan hệ đầu tư, rất khó để rút ra những kết luận toàn diện về sự an toàn tài chính hoặc độ bền vững của dự án. Theo thông tin đã tìm thấy, phần này cũng đang ở trạng thái không rõ. Euruka Tech, $erc ai hoạt động như thế nào? Mặc dù thiếu các thông số kỹ thuật chi tiết cho Euruka Tech, nhưng điều quan trọng là phải xem xét những tham vọng đổi mới của nó. Dự án tìm cách tận dụng sức mạnh tính toán của trí tuệ nhân tạo để tự động hóa và nâng cao trải nghiệm người dùng trong môi trường tiền điện tử. Bằng cách tích hợp AI với công nghệ blockchain, Euruka Tech nhằm cung cấp các tính năng như giao dịch tự động, đánh giá rủi ro và giao diện người dùng cá nhân hóa. Bản chất đổi mới của Euruka Tech nằm ở mục tiêu tạo ra một kết nối liền mạch giữa người dùng và những khả năng rộng lớn mà các mạng phi tập trung mang lại. Thông qua việc sử dụng các thuật toán học máy và AI, nó nhằm giảm thiểu những thách thức mà người dùng lần đầu gặp phải và tinh giản trải nghiệm giao dịch trong khuôn khổ Web3. Sự cộng sinh giữa AI và blockchain nhấn mạnh tầm quan trọng của token $erc ai, đứng như một cầu nối giữa các giao diện người dùng truyền thống và các khả năng tiên tiến của công nghệ phi tập trung. Thời Gian của Euruka Tech, $erc ai Thật không may, do thông tin hạn chế hiện có về Euruka Tech, chúng tôi không thể trình bày một thời gian biểu chi tiết về các phát triển chính hoặc cột mốc trong hành trình của dự án. Thời gian biểu này, thường rất quý giá trong việc vạch ra sự tiến triển của một dự án và hiểu được quỹ đạo phát triển của nó, hiện không có sẵn. Khi thông tin về các sự kiện đáng chú ý, quan hệ đối tác hoặc các bổ sung chức năng trở nên rõ ràng, các cập nhật chắc chắn sẽ nâng cao sự hiện diện của Euruka Tech trong lĩnh vực tiền điện tử. Làm rõ về Các Dự Án “Eureka” Khác Điều đáng lưu ý là nhiều dự án và công ty chia sẻ một tên gọi tương tự với “Eureka.” Nghiên cứu đã xác định các sáng kiến như một đại lý AI từ NVIDIA Research, tập trung vào việc dạy robot thực hiện các nhiệm vụ phức tạp bằng các phương pháp sinh tạo, cũng như Eureka Labs và Eureka AI, cải thiện trải nghiệm người dùng trong giáo dục và phân tích dịch vụ khách hàng, tương ứng. Tuy nhiên, những dự án này là khác biệt với Euruka Tech và không nên bị nhầm lẫn với các mục tiêu hoặc chức năng của nó. Kết luận Euruka Tech, cùng với token $erc ai của nó, đại diện cho một người chơi hứa hẹn nhưng hiện tại còn mờ mịt trong bối cảnh Web3. Trong khi chi tiết về người sáng lập và các nhà đầu tư vẫn chưa được công bố, tham vọng cốt lõi của việc kết hợp trí tuệ nhân tạo với công nghệ blockchain vẫn là một điểm thu hút sự chú ý. Các phương pháp độc đáo của dự án trong việc thúc đẩy sự tham gia của người dùng thông qua tự động hóa tiên tiến có thể giúp nó nổi bật khi hệ sinh thái Web3 tiến triển. Khi thị trường tiền điện tử tiếp tục phát triển, các bên liên quan nên theo dõi chặt chẽ những tiến bộ xung quanh Euruka Tech, vì sự phát triển của các đổi mới đã được ghi chép, các quan hệ đối tác hoặc một lộ trình rõ ràng có thể mang lại những cơ hội đáng kể trong tương lai gần. Hiện tại, chúng tôi đang chờ đợi những hiểu biết sâu sắc hơn có thể tiết lộ tiềm năng của Euruka Tech và vị trí của nó trong bối cảnh cạnh tranh của tiền điện tử.

Tổng lượt xem 680Xuất bản vào 2025.01.02Cập nhật vào 2025.01.02

DUOLINGO AI là gì

DUOLINGO AI: Tích hợp Học ngôn ngữ với Web3 và Đổi mới AI Trong một kỷ nguyên mà công nghệ định hình lại giáo dục, việc tích hợp trí tuệ nhân tạo (AI) và các mạng blockchain báo hiệu một biên giới mới cho việc học ngôn ngữ. Giới thiệu DUOLINGO AI và đồng tiền điện tử liên quan của nó, $DUOLINGO AI. Dự án này mong muốn kết hợp sức mạnh giáo dục của các nền tảng học ngôn ngữ hàng đầu với những lợi ích của công nghệ Web3 phi tập trung. Bài viết này đi sâu vào các khía cạnh chính của DUOLINGO AI, khám phá các mục tiêu, khung công nghệ, sự phát triển lịch sử và tiềm năng tương lai trong khi duy trì sự rõ ràng giữa tài nguyên giáo dục gốc và sáng kiến tiền điện tử độc lập này. Tổng quan về DUOLINGO AI Cốt lõi của DUOLINGO AI là thiết lập một môi trường phi tập trung nơi người học có thể kiếm được phần thưởng mã hóa cho việc đạt được các cột mốc giáo dục trong khả năng ngôn ngữ. Bằng cách áp dụng hợp đồng thông minh, dự án nhằm tự động hóa các quy trình xác minh kỹ năng và phân bổ token, tuân thủ các nguyên tắc Web3 nhấn mạnh tính minh bạch và quyền sở hữu của người dùng. Mô hình này khác biệt so với các phương pháp truyền thống trong việc tiếp cận ngôn ngữ bằng cách dựa nhiều vào cấu trúc quản trị do cộng đồng điều hành, cho phép những người nắm giữ token đề xuất cải tiến nội dung khóa học và phân phối phần thưởng. Một số mục tiêu đáng chú ý của DUOLINGO AI bao gồm: Học tập gamified: Dự án tích hợp các thành tựu blockchain và token không thể thay thế (NFT) để đại diện cho các cấp độ thành thạo ngôn ngữ, thúc đẩy động lực thông qua các phần thưởng kỹ thuật số hấp dẫn. Tạo nội dung phi tập trung: Nó mở ra cơ hội cho các nhà giáo dục và những người yêu thích ngôn ngữ đóng góp khóa học của họ, tạo điều kiện cho một mô hình chia sẻ doanh thu có lợi cho tất cả các bên đóng góp. Cá nhân hóa dựa trên AI: Bằng cách sử dụng các mô hình học máy tiên tiến, DUOLINGO AI cá nhân hóa các bài học để thích ứng với tiến trình học tập của từng cá nhân, tương tự như các tính năng thích ứng có trong các nền tảng đã được thiết lập. Người sáng lập dự án và Quản trị Tính đến tháng 4 năm 2025, đội ngũ đứng sau $DUOLINGO AI vẫn giữ bí danh, một thực tiễn phổ biến trong lĩnh vực tiền điện tử phi tập trung. Sự ẩn danh này nhằm thúc đẩy sự phát triển tập thể và sự tham gia của các bên liên quan thay vì tập trung vào các nhà phát triển cá nhân. Hợp đồng thông minh được triển khai trên blockchain Solana ghi chú địa chỉ ví của nhà phát triển, điều này thể hiện cam kết về tính minh bạch liên quan đến các giao dịch mặc dù danh tính của các nhà sáng lập vẫn chưa được biết đến. Theo lộ trình của nó, DUOLINGO AI dự định phát triển thành một Tổ chức Tự trị Phi tập trung (DAO). Cấu trúc quản trị này cho phép những người nắm giữ token bỏ phiếu về các vấn đề quan trọng như triển khai tính năng và phân bổ ngân quỹ. Mô hình này phù hợp với tinh thần trao quyền cho cộng đồng có trong nhiều ứng dụng phi tập trung, nhấn mạnh tầm quan trọng của việc ra quyết định tập thể. Nhà đầu tư và Đối tác chiến lược Hiện tại, không có nhà đầu tư tổ chức hoặc nhà đầu tư mạo hiểm nào được xác định công khai liên quan đến $DUOLINGO AI. Thay vào đó, tính thanh khoản của dự án chủ yếu đến từ các sàn giao dịch phi tập trung (DEX), đánh dấu một sự tương phản rõ rệt với các chiến lược tài trợ của các công ty công nghệ giáo dục truyền thống. Mô hình cơ sở này cho thấy một cách tiếp cận do cộng đồng điều hành, phản ánh cam kết của dự án đối với sự phi tập trung. Trong tài liệu trắng của mình, DUOLINGO AI đề cập đến việc hình thành các hợp tác với các “nền tảng giáo dục blockchain” không xác định nhằm làm phong phú thêm các khóa học của mình. Mặc dù các đối tác cụ thể vẫn chưa được công bố, những nỗ lực hợp tác này gợi ý về một chiến lược kết hợp đổi mới blockchain với các sáng kiến giáo dục, mở rộng quyền truy cập và sự tham gia của người dùng qua nhiều con đường học tập khác nhau. Kiến trúc công nghệ Tích hợp AI DUOLINGO AI tích hợp hai thành phần chính dựa trên AI để nâng cao các đề xuất giáo dục của mình: Công cụ học tập thích ứng: Công cụ tinh vi này học từ các tương tác của người dùng, tương tự như các mô hình độc quyền từ các nền tảng giáo dục lớn. Nó điều chỉnh độ khó của bài học một cách linh hoạt để giải quyết các thách thức cụ thể của người học, củng cố các lĩnh vực yếu thông qua các bài tập có mục tiêu. Đại lý hội thoại: Bằng cách sử dụng chatbot được hỗ trợ bởi GPT-4, DUOLINGO AI cung cấp một nền tảng cho người dùng tham gia vào các cuộc hội thoại mô phỏng, thúc đẩy một trải nghiệm học ngôn ngữ tương tác và thực tiễn hơn. Hạ tầng Blockchain Được xây dựng trên blockchain Solana, $DUOLINGO AI sử dụng một khung công nghệ toàn diện bao gồm: Hợp đồng thông minh xác minh kỹ năng: Tính năng này tự động trao token cho người dùng đã vượt qua các bài kiểm tra thành thạo, củng cố cấu trúc khuyến khích cho các kết quả học tập thực sự. Huy hiệu NFT: Những token kỹ thuật số này biểu thị các cột mốc khác nhau mà người học đạt được, chẳng hạn như hoàn thành một phần của khóa học hoặc thành thạo các kỹ năng cụ thể, cho phép họ giao dịch hoặc trưng bày thành tích của mình một cách kỹ thuật số. Quản trị DAO: Các thành viên cộng đồng nắm giữ token có thể tham gia vào quản trị bằng cách bỏ phiếu về các đề xuất chính, tạo điều kiện cho một văn hóa tham gia khuyến khích đổi mới trong các đề xuất khóa học và tính năng của nền tảng. Dòng thời gian lịch sử 2022–2023: Khái niệm Công việc chuẩn bị cho DUOLINGO AI bắt đầu với việc tạo ra một tài liệu trắng, nêu bật sự phối hợp giữa những tiến bộ AI trong học ngôn ngữ và tiềm năng phi tập trung của công nghệ blockchain. 2024: Ra mắt Beta Một phiên bản beta giới hạn giới thiệu các đề xuất trong các ngôn ngữ phổ biến, thưởng cho người dùng sớm bằng các phần thưởng token như một phần của chiến lược tham gia cộng đồng của dự án. 2025: Chuyển đổi DAO Vào tháng 4, một lần ra mắt mainnet đầy đủ diễn ra với sự lưu thông của các token, thúc đẩy các cuộc thảo luận trong cộng đồng về khả năng mở rộng sang các ngôn ngữ châu Á và các phát triển khóa học khác. Thách thức và Hướng đi tương lai Khó khăn kỹ thuật Mặc dù có những mục tiêu tham vọng, DUOLINGO AI phải đối mặt với những thách thức đáng kể. Khả năng mở rộng vẫn là một mối quan tâm liên tục, đặc biệt là trong việc cân bằng chi phí liên quan đến xử lý AI và duy trì một mạng lưới phi tập trung phản hồi. Ngoài ra, việc đảm bảo chất lượng tạo nội dung và quản lý trong bối cảnh cung cấp phi tập trung đặt ra những phức tạp trong việc duy trì tiêu chuẩn giáo dục. Cơ hội chiến lược Nhìn về phía trước, DUOLINGO AI có tiềm năng tận dụng các quan hệ đối tác cấp chứng chỉ vi mô với các tổ chức học thuật, cung cấp các xác nhận kỹ năng ngôn ngữ được xác minh bằng blockchain. Hơn nữa, việc mở rộng chuỗi chéo có thể cho phép dự án tiếp cận các cơ sở người dùng rộng hơn và các hệ sinh thái blockchain bổ sung, nâng cao khả năng tương tác và phạm vi tiếp cận của nó. Kết luận DUOLINGO AI đại diện cho một sự kết hợp đổi mới giữa trí tuệ nhân tạo và công nghệ blockchain, cung cấp một lựa chọn tập trung vào cộng đồng thay thế cho các hệ thống học ngôn ngữ truyền thống. Mặc dù sự phát triển bí danh và mô hình kinh tế mới nổi của nó mang lại một số rủi ro, cam kết của dự án đối với học tập gamified, giáo dục cá nhân hóa và quản trị phi tập trung mở ra một con đường phía trước cho công nghệ giáo dục trong lĩnh vực Web3. Khi AI tiếp tục phát triển và hệ sinh thái blockchain tiến hóa, các sáng kiến như DUOLINGO AI có thể định hình lại cách người dùng tương tác với giáo dục ngôn ngữ, trao quyền cho cộng đồng và thưởng cho sự tham gia thông qua các cơ chế học tập đổi mới.

Tổng lượt xem 708Xuất bản vào 2025.04.11Cập nhật vào 2025.04.11

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của AI (AI) được trình bày dưới đây.

Dwarkesh Patel: Thế hệ AI tiếp theo có thể được tạo ra từ công việc thực tế

Tóm tắt

Liên kết tham khảo:

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

Nội dung Liên quan

Một nhóm người chơi trên chain không xem World Cup, đã làm giàu từ ANSEM

KAITO chuyển 10,33 triệu USD tiền ảo – Phe bò có thể đẩy giá lên 0,65 USD không?

Tại sao mức tăng 558% khối lượng giao dịch của Sonic có thể không chỉ là một đợt phục hồi tạm thời

Sức mạnh xử lý sắp cạn: Google thầm áp đặt hạn mức sử dụng Gemini đối với Meta

Câu hỏi "Anh có chắc không?" khiến mô hình lớn AI bộc lộ "tính cách xu nịnh"?

Giao dịch

Bài viết Nổi bật

GROK AI là gì

ERC AI là gì

DUOLINGO AI là gì

Thảo luận

Danh mục Phổ biến

Thẻ Nổi bật