Tại sao các xưởng farm vàng nuôi sống World of Warcraft, nhưng lại 'giết chết' mọi Web3 Game?

marsbitXuất bản vào 2026-01-30Cập nhật gần nhất vào 2026-01-30

Tóm tắt

Tại sao các studio "farm vàng" có thể duy trì World of Warcraft nhưng lại "giết chết" các trò chơi Web3? Bài viết phân tích sự khác biệt giữa các nền kinh tế trong game Web2 thành công như WoW và Roblox so với Web3 Game. WoW tồn tại được nhờ việc vàng không phải là giá trị cuối cùng: trang bị, thành tích hay địa vị xã hội không thể mua trực tiếp bằng vàng. Blizzard cũng kiểm soát studio farm vàng thông qua cơ chế chính thức, rào cản thời gian và tập trung vào trải nghiệm cốt lõi. Roblox thì khuyến khích sáng tạo nội dung hơn là lao động lặp lại, với hệ thống kinh tế khép kín, khó rút tiền mặt. Ngược lại, Web3 Game tập trung vào "kiếm tiền" với hành động lặp lại và tài sản có thể rút tự do, khiến chúng bị chi phối bởi vốn và bot. Tác giả kết luận rằng bản chất của Web3 Game khiến chúng không thể vừa vui vừa bền vững, vì những thứ ý nghĩa nhất trong game không nên bị "tài chính hóa".

Tác giả: Lao Bai

Cách đây không lâu, tôi có đăng Tweet kể chuyện con trai tôi nạp tiền điên cuồng vào Roblox để mua Robux và trộm đồ của người khác, cảm thán rằng trò chơi này còn đỉnh hơn cả gacha của Genshin Impact và blind box của Pop Mart, thực sự là vị thần hao tiền, thu hút sự đồng cảm của nhiều anh em, đó cũng là bài có lượng tương tác lớn nhất gần đây.

Ngày hôm sau đột nhiên nghĩ - tại sao một trò chơi hao tiền như Roblox, bên trong dường như lại không có "xưởng farm vàng"? Hoặc nếu có, tại sao hầu như hoàn toàn không ảnh hưởng đến vòng đời của trò chơi? Đúng lúc hai ngày trước @j0hnwang cũng đào lại bài viết về Roblox mà anh ấy đã viết trước đây, có nói đến chuyện này, tôi trước đó có lưu lại, nên lại quay về đọc một lần nữa.

Quan điểm của John là - Roblox coi hệ thống kinh tế là một phần của trò chơi. Còn game Web3 thì coi trò chơi là cái cớ cho hệ thống kinh tế. Cho rằng cơ chế kinh tế tập trung giúp xây dựng trải nghiệm chơi game có thể kiểm soát được hơn.

Điều này có lý, việc Web3 Game không đủ hay cũng là điều mọi người chê trách trước đây, nhưng đợt Web3 Game lần này thực ra khả năng chơi đã được cải thiện rất nhiều, cơ chế kinh tế cũng là điều chỉnh rất tập trung, kết quả lại không có gì khác biệt, chắc chắn có những nguyên nhân khác.

Sau đó tôi lại nghĩ đến World of Warcraft và Kaito, hôm X khóa API của Kaito đó, tôi có nói những lời dưới đây.

Hành vi một khi có thể được mở rộng quy mô, thì ắt sẽ bị công nghiệp hóa

Từ "Nông dân Trung Quốc" trong World of Warcraft thời Web2, đến script X2Earn sau này của Web3, các xưởng farm vàng, giờ đây việc farm bằng miệng (嘴撸) mang lại thì tất yếu xuất hiện "tạo tài khoản hàng loạt bằng AI, farm bằng miệng ma trận nhiều người".

Vì vậy farm bằng miệng không bị phá hỏng bởi các nhà đầu tư nhỏ lẻ thông minh hay KOL, mà bị phá hỏng bởi thuộc tính 'có thể sao chép', đây cũng không phải là vấn đề của riêng dự án Kaito, mà về cơ bản là số phận cuối cùng của tất cả các hệ thống khuyến khích.

Vậy bí quyết của World of Warcraft và Roblox rốt cuộc là gì? Tại sao xưởng farm không giết được họ, tại sao sau khi lần đầu xuất hiện Chinese Farmer ở máy chủ Mỹ, tiền vàng trong World of Warcraft lạm phát, người chơi oán thán một thời gian, sau đó lại dần dần chấp nhận, trở thành một hệ sinh thái cố định trong trò chơi?

Chắc chắn có những thứ mà Web3 Game không có, không chỉ đơn giản là cơ chế kinh tế tập trung.

Hãy nói về World of Warcraft trước

1. Vàng không phải là "giá trị cuối cùng"

Điều này những người chơi sâu WOW chắc đều biết, trong trò chơi, tiền vàng về cơ bản không liên quan đến địa vị của bạn, thành tựu, thứ hạng, danh tiếng,... của bạn không thể mua trực tiếp bằng tiền vàng, đánh raid ra một trang bị đỉnh cao, hoặc là Roll, hoặc là mọi người dùng DKP, dùng điểm cống hiến để đấu giá. Cuối cùng người chơi nhặt được còn bind trực tiếp, không thể mang ra ngoài bán lấy tiền.

Vì vậy tiền vàng nhiều lắm là giúp bạn tiết kiệm chút thời gian, nhưng không thể khiến bạn nhảy cóc thành người chơi cốt lõi. Hồi đó nhiều web game trong nước hoàn toàn ngược lại, đại R nạp tiền RMB giết trời giết đất giết tất cả, khá giống với phong cách game Web3 hiện nay.

Xét về bản chất, trong World of Warcraft, tất cả những thứ "có ý nghĩa" - trang bị đỉnh cao, thành tựu, danh hiệu, điểm cống hiến raid,... đều không thể mua trực tiếp bằng tiền vàng. Vì vậy mặc dù hành động farm vàng có thể được mở rộng quy mô dẫn đến công nghiệp hóa của lứa Chinese Farmer đầu tiên, nhưng nó luôn không thể chi phối trải nghiệm cốt lõi của trò chơi. Nói cách khác, sự "công nghiệp hóa" này bị giới hạn ở "lớp rìa" của trò chơi.

2. "Hấp thụ chứ không đối kháng" của chính thức

Blizzard sau khi xưởng farm vàng xuất hiện đã thực hiện một loạt động thái, nhìn lại đều rất thông minh:

  • Một là chính thức có thể kiểm soát - cho phép bạn lấy tiền thật mua vàng, nhưng giá cả do hệ thống điều chỉnh, và không có lối thoát tài chính tự do, biến chợ đen thành đổi ngoại tệ chính thức;
  • Hai là thêm các rào cản - như daily, weekly, các khóa CD...... bạn có nhiều tài khoản, level cao cỡ nào cũng phải ngoan ngoãn dựa vào thời gian chờ đợi, làm loãng lợi thế công nghiệp hóa;
  • Ba là thêm nhiều thứ "có ý nghĩa" không mua được bằng vàng, như đã nói ở trên guild, raid, danh tiếng xã hội...... dẫn đến sau này có gold run và GKP, nhưng các server first kill đều do các guild đỉnh cao hoàn thành trước, tuyệt đối không thể do gold run làm được, vì vậy farm vàng trong World of Warcraft mãi mãi là một "công dân hạng hai".

Còn Roblox, logic hơi khác một chút

1. Khuyến khích sáng tạo chứ không phải lao động lặp đi lặp lại

Bạn xem bài tôi dẫn trong bài viết về Roblox trước đây thì biết, trong Roblox, kiếm tiền nhất không phải là刷资源刷 tài nguyên kiểu lao động lặp đi lặp lại này, những cái này đều ít dầu mỡ.

Kiếm tiền thực sự, là làm map, thiết kế lối chơi, vận hành cộng đồng và các hành vi khác.

Những thứ này đều khó bị xưởng sao chép mở rộng quy mô, bạn刷再多资源刷 nhiều tài nguyên cỡ nào, cũng không刷 ra được một lối chơi được trẻ con yêu thích (nhưng giờ có AI, chuyện này liệu cũng có thể "thiết kế hàng loạt").

2. Hệ thống kinh tế vòng tuần hoàn kín bên trong, trao đổi tài sản không tự do

Cái này hơi giống ý tưởng John nói, bạn dùng thẻ tín dụng mua Robux thì rất nhanh, nhưng ngược lại đổi Robux lấy tiền mặt thì không mượt mà như vậy, có rào cản, độ trễ và tỷ lệ hao hụt, vì vậy các thủ thuật như arbitrage,搬砖 chuyển tiền ở đây không dễ sử dụng.

Và tiền trong Roblox phần lớn chảy về phí nền tảng, các nhà sáng tạo hàng đầu như đã nói ở trên và tiêu hao trong game, là một hệ thống kinh tế vòng tuần hoàn kín, không có gì tràn ra ngoài.

Tất nhiên, dù là World of Warcraft hay Roblox, hay + có nhiều người chơi, là nền tảng quan trọng nhất cấu thành nên họ, điểm này không cần nghi ngờ.

Ngược lại, nguyên nhân thực sự khiến Web3 Game chết tập thể ở đâu?

Nhớ lại, bỏ qua yếu tố hay hay không, có lẽ ý đồ thiết kế ban đầu của chain game đã định trước kết quả ngày hôm nay.

Hầu như tất cả chain game, cho phép đều là "hành vi có thể lặp lại" + "tài sản có thể rút ra tự do".

Vậy ở thời đại hệ thống game Web2 đã chín muồi, điều này tất nhiên sẽ biến người chơi cuối cùng của chain game thành tư bản + script, chứ không phải con người.

Nói cách khác, hễ Play và Earn liên quan với nhau, thì việc này ắt sẽ là kết quả này.

Dù bạn là Play 2 Earn, hay Move 2 Earn cải tiến sau này, hay Play & Earn, đều là thay汤不换药đổi nước canh không đổi thuốc, không có sự khác biệt về bản chất.

Điều này hơi giống một tam giác bất khả thi của trò chơi, giữa hay, nhà đầu cơ có thể kiếm tiền, xưởng có thể mở rộng quy mô, bạn nhiều nhất chỉ có thể đạt được hai góc.

Từ góc độ này, Web3 Game không phải là vấn đề chất lượng đội ngũ, quy mô vốn, mà là từ gen tầng dưới cùng, đã không thể làm được "hay".

World of Warcraft lên chain, khả thi không? Có ý nghĩa không?

Nhớ hồi chain game nổi, chúng tôi thường mơ mộng một cảnh tượng, đó là World of Warcraft lên chain, sẽ như thế nào?

Không phải game lên chain, mà là đưa hệ thống kinh tế trong World of Warcraft lên chain, bao gồm tiền vàng, đạo cụ, mount,... tất cả lên chain, để những thứ này có thể giao dịch tự do, có thể rút ra tự do, có thể tài chính hóa.

Giờ nghĩ lại, lúc đó non nớt lắm, một khi làm vậy, WOW chắc chắn sẽ bị hệ thống hủy hoại.

Công lý nền tảng thành công của World of Warcraft:

  • Ý nghĩa không thể giao dịch - những thứ có giá trị nhất, trang bị đỉnh cao, thành tựu, danh hiệu...... hầu như全部绑定 toàn bộ bind, không thể giao dịch không thể chuyển nhượng, những thứ này đại diện cho việc bạn đã làm gì, chứ không phải bạn sở hữu cái gì;
  • Tiến độ không bằng của cải - thời gian bạn bỏ ra, kỹ năng thao tác, sự phối hợp đội nhóm mới là cái gốc an thân lập mệnh của bạn, tiền vàng nhiều lắm là giúp bạn thoải mái một chút, không thể giúp bạn vượt qua giai cấp;
  • Người chơi không phải là chủ sở hữu tài sản, mà là người nhập vai - trang bị này là tôi đánh ra / đổi bằng DKP, Boss này là guild chúng tôi server first kill, nhân vật này là tôi luyện 10 năm tâm huyết...... một khi chuyện này biến thành "đây là tôi mua, đầu tư", nhân vật gắn kết tình cảm với bạn này sẽ bị giáng cấp thành một skin tài khoản tài sản.

Nếu nhất định phải nói lên chain, thứ thực sự đáng lên chain trong World of Warcraft ngược lại là những thứ này - như chứng nhận server first kill của một Boss nào đó, lịch sử guild, dấu thời gian thành tựu của bạn, ghi chép chứng kiến sự kiện thế giới...... thứ lên chain không phải là tài sản và giá trị, mà là ký ức và dấu vết.

World of Warcraft之所以伟大 vĩ đại,恰恰在于恰恰在于 điều quan trọng nhất của nó,永远不能被卖掉 mãi mãi không thể bán đi.

Từ góc độ này, "chain game phải chết".

Thậm chí không chỉ chain game, chúng ta từng coi blockchain như một cái búa, nhìn cái gì cũng giống đinh, muốn qua gõ một cái. Nào ngờ trên thế giới này có quá nhiều thứ,根本不需要被「金融化」 căn bản không cần bị "tài chính hóa", ý nghĩa tồn tại của chúng,就是被体验、被记住、被讲述 chính là được trải nghiệm, được ghi nhớ, được kể lại.

Câu hỏi Liên quan

QTại sao các xưởng farm vàng (gold farming) có thể tồn tại trong World of Warcraft nhưng lại phá hủy các trò chơi Web3?

AVì trong World of Warcraft, vàng không phải là giá trị cuối cùng, không thể mua được những thứ quan trọng nhất như trang bị hàng đầu, thành tựu hoặc danh hiệu. Trong khi đó, các trò chơi Web3 được thiết kế với cốt lõi là hệ thống kinh tế, nơi tài sản có thể tự do giao dịch và rút ra, khiến nó dễ bị khai thác bởi các xưởng farm và bot.

QRoblox chống lại các xưởng farm vàng bằng cách nào?

ARoblox tập trung vào sáng tạo (như tạo bản đồ, thiết kế gameplay) thay vì các hành vi lặp lại có thể farm được. Hệ thống kinh tế của nó là một vòng khép kín, việc chuyển đổi Robux sang tiền mặt không dễ dàng, có độ trễ và hao hụt, làm giảm động lực cho các hoạt động đầu cơ.

QSự khác biệt cốt lõi trong thiết kế hệ thống kinh tế giữa game Web2 thành công và Web3 là gì?

ACác game Web2 thành công như WOW và Roblox tách biệt 'kiếm tiền' (earn) khỏi trải nghiệm chơi game chính (play). Những thứ có giá trị nhất (trang bị, thành tựu) thường không thể giao dịch. Ngược lại, Web3 Game gắn liền 'Play' và 'Earn', cho phép tài sản trong game tự do giao dịch và rút ra ngoài, biến người chơi thành nhà đầu tư và thu hút sự khai thác của các xưởng farm.

QTác giả đề xuất điều gì thực sự nên được đưu trên chuỗi (on-chain) từ một game như World of Warcraft?

ATác giả cho rằng thứ đáng được đưa lên chuỗi không phải là tài sản có giá trị (vàng, trang bị) mà là những kỷ niệm và dấu ấn, như chứng nhận lần đầu tiên hạ boss, lịch sử guild, thành tựu cá nhân, hoặc ghi chép về các sự kiện trong thế giới game. Điều này giữ được ý nghĩa và cảm xúc gắn liền với trải nghiệm người chơi.

QTheo bài viết, tại sao 'Play-to-Earn' được coi là một thiết kế không bền vững cho game?

AVì bất kỳ hình thức nào kết hợp 'Play' và 'Earn' (chơi để kiếm tiền) đều tạo ra một hành vi có thể lặp lại và có thể được mở rộng quy mô công nghiệp bởi các xưởng farm và bot. Điều này phá vỡ nền kinh tế trong game, thu hút những người tham gia chỉ vì lợi nhuận thay vì trải nghiệm chơi game, và cuối cùng làm game 'chết'.

Nội dung Liên quan

Bản tin sáng | Tập đoàn truyền thông Trump công bố báo cáo tài chính quý I; Ba ứng dụng DeFi lớn hoàn trả gần 100 triệu USD doanh thu cho người nắm giữ token trong 30 ngày; Michael Saylor lại đăng thông tin Bitcoin Tracker

ChainCatcher tổng hợp các tin tức quan trọng trong 24 giờ qua: **Tin tức chính:** - Tập đoàn Trump Media báo lỗi đầu tư khoảng 4 tỷ USD từ tài sản tiền mã hóa như BTC trong báo cáo Q1. - Michael Saylor của MicroStrategy một lần nữa đăng thông tin theo dõi Bitcoin, dự kiến công bố dữ liệu mua thêm vào tuần tới. - Thống đốc Ngân hàng Anh cảnh báo quy định stablecoin có thể gây ra căng thẳng giữa Mỹ và các cơ quan quản lý quốc tế. - Dữ liệu từ DefiLlama cho thấy ba ứng dụng DeFi (Hyperliquid, Pump.fun, EdgeX) đã phân phối gần 1 tỷ USD doanh thu cho chủ sở hữu token trong 30 ngày qua. Hyperliquid dẫn đầu với 50,95 triệu USD. - Giám đốc điều hành MicroStrategy tuyên bố sẽ chỉ bán Bitcoin khi có lợi cho cổ đông. **Phát triển thị trường:** - Goldman Sachs dự báo Cục Dự trữ Liên bang Mỹ (Fed) sẽ trì hoãn cắt giảm lãi suất đến tháng 12/2026 và tháng 3/2027 do áp lực lạm phát dai dẳng. Điều này có thể hạn chế thanh khoản chảy vào tài sản rủi ro như tiền mã hóa. - Nền tảng dự đoán thị trường Polymarket thông báo đã xác định và cấm nhiều cụm tài khoản thực hiện giao dịch "ma", đồng thời sẽ tăng cường cơ chế kiểm soát. - Cơ quan Thuế Quốc gia Hàn Quốc lần đầu tiên thí điểm ủy thác việc quản lý tài sản ảo bị tịch thu cho các tổ chức lưu ký tư nhân. **Xu hướng Meme Coin:** Theo GMGN, top token phổ biến trong 24h qua trên: - **Ethereum:** HEX, SHIB, LINK, PEPE, mUSD. - **Solana:** FWOG, TROLL, swarms, SIGMA, HANTA. - **Base:** SKITTEN, PEPE, B3, BASED, SKYA. Bài viết cũng nhấn mạnh nhận định từ người sáng lập Yearn.Finance, Andre Cronje, rằng DeFi vào năm 2026 không còn chỉ là nơi đầu cơ mà đang trở thành cơ sở hạ tầng backend cho nền kinh tế trên chuỗi.

链捕手16 phút trước

Bản tin sáng | Tập đoàn truyền thông Trump công bố báo cáo tài chính quý I; Ba ứng dụng DeFi lớn hoàn trả gần 100 triệu USD doanh thu cho người nắm giữ token trong 30 ngày; Michael Saylor lại đăng thông tin Bitcoin Tracker

链捕手16 phút trước

Telegram Trực Tiếp Tiếp Quản TON, Lưu Lượng Mạng Xã Hội Viết Lại Câu Chuyện Blockchain Công Khai

Vào ngày 4/5, người sáng lập Telegram Pavel Durov thông báo mạng TON đã giảm phí giao dịch gấp 6 lần, gần như về 0. Quan trọng hơn, ông xác nhận Telegram sẽ thay thế TON Foundation, trở thành lực lượng chính thúc đẩy mạng lưới và là trình xác thực lớn nhất. Điều này đánh dấu bước chuyển từ mối quan hệ "gắn kết nhưng ít chi phối" sang việc Telegram tham gia sâu vào hạ tầng kỹ thuật, định hướng và công cụ phát triển của TON. Bài viết chỉ ra rằng TON luôn có lợi thế tiếp cận lượng người dùng khổng lồ từ Telegram, nhưng cần chuyển hóa lợi thế này thành các kịch bản sử dụng bền vững thay vì chỉ là các đợt viral ngắn hạn như Notcoin hay Dogs. Việc giảm phí và tăng tốc độ (thời gian xác nhận cuối cùng ~0.6 giây) nhằm mục tiêu hỗ trợ các giao dịch nhỏ, tần suất cao phù hợp với hành vi trong Telegram như tip, thưởng, thanh toán nhỏ trong nhóm. Việc Telegram trở thành trình xác thực lớn nhất có thể nâng cao hiệu quả phát triển nhưng cũng đặt ra câu hỏi về rủi ro tập trung hóa. Durov cho rằng điều này sẽ thu hút thêm các trình xác thực lớn, từ đó tăng cường tính phi tập trung. Bên cạnh đó, lợi suất staking TON cao (18.8% - đứng đầu trong top 50 tài sản crypto) là yếu tố giữ chân vốn, tạo thời gian để hệ sinh thái phát triển. Tóm lại, thách thức lớn nhất của TON hiện nay không phải là thu hút sự chú ý nhờ Telegram, mà là chứng minh khả năng tích hợp sâu, trở thành một lớp hạ tầng mượt mà phía sau trải nghiệm người dùng Telegram. Cơ hội nằm ở việc biến lưu lượng xã hội thành hoạt động trên chuỗi bền vững.

marsbit18 phút trước

Telegram Trực Tiếp Tiếp Quản TON, Lưu Lượng Mạng Xã Hội Viết Lại Câu Chuyện Blockchain Công Khai

marsbit18 phút trước

Telegram Tiếp Quản TON, Lưu Lượng Mạng Xã Hội Viết Lại Câu Chuyện Blockchain

Vào ngày 4/5, nhà sáng lập Telegram Pavel Durov thông báo mạng lưới TON đã giảm phí giao dịch xuống 6 lần, gần như về 0. Quan trọng hơn, ông cho biết Telegram sẽ thay thế TON Foundation, trở thành động lực chính và trình xác thực lớn nhất của mạng TON. Động thái này đánh dấu sự chuyển đổi từ việc chỉ cung cấp điểm truy cập sang việc đi sâu vào hạ tầng kỹ thuật. Điểm khác biệt của TON là được tích hợp sẵn với một nền tảng xã hội có tần suất sử dụng cao. Tuy nhiên, có người dùng không đồng nghĩa với việc có hoạt động chuỗi bền vững. Các dự án như Notcoin đã chứng minh Telegram có thể tạo ra cơn sốt lan truyền nhanh chóng, nhưng sự bùng nổ kiểu này thường khó duy trì lâu dài. Trọng tâm hiện tại của TON là biến điểm truy cập thành các kịch bản sử dụng liên tục. Việc giảm phí và tăng tốc (thời gian xác nhận cuối cùng ~0.6 giây) nhằm giải quyết các tương tác nhỏ lẻ, tần suất cao trong Telegram, như thưởng, thanh toán nhỏ, phần thưởng trò chơi... khiến trải nghiệm blockchain trở nên vô hình trong sản phẩm. Việc Telegram trở thành trình xác thực lớn nhất là một bước đi quan trọng, cho phép căn chỉnh tốt hơn giữa sản phẩm, ví, công cụ dành cho nhà phát triển và mạng lưới. Tuy nhiên, điều này cũng dấy lên tranh luận về rủi ro tập trung hóa. Durov lập luận rằng sự tham gia của Telegram sẽ thu hút thêm nhiều bên lớn, từ đó tăng cường tính phi tập trung. Bên cạnh đó, TON có phần thưởng staking hàng năm lên đến 18.8% – cao nhất trong top 50 tiền mã hóa – giúp thu hút và giữ chân vốn trong hệ sinh thái. Tóm lại, cơ hội của TON không còn là việc tận dụng lưu lượng truy cập từ Telegram, mà là trở thành một phần hạ tầng không thể thiếu trong trải nghiệm ứng dụng Telegram, biến các hành vi xã hội hàng ngày thành hoạt động trên chuỗi một cách liền mạch. Đây vừa là cơ hội lớn, vừa là thách thức khó khăn hơn cho TON.

Odaily星球日报28 phút trước

Telegram Tiếp Quản TON, Lưu Lượng Mạng Xã Hội Viết Lại Câu Chuyện Blockchain

Odaily星球日报28 phút trước

Kỹ sư hậu huấn luyện OpenAI Weng Jiayi đề xuất giả thuyết mới về Agentic AI

Thập kỷ qua, AI phát triển chủ yếu dựa vào mô hình lớn hơn với nhiều dữ liệu và năng lực tính toán hơn. Gần đây, kỹ sư OpenAI Weng Jiayi đã đề xuất một hướng đi mới có tên "Heuristic Learning" (HL) - Học theo phỏng đoán. Trong thí nghiệm, ông sử dụng Codex (dựa trên GPT-5.4) để duy trì một hệ thống tự động viết, chạy thử, phân tích nhật ký, xem video phát lại và sửa mã nguồn chiến lược cho trò chơi Atari Breakout. Qua nhiều vòng lặp, Codex đã tạo ra một chiến lược thuần Python đạt điểm tối đa lý thuyết 864. Kinh nghiệm được mã hóa thành phần mềm có thể đọc, sửa, kiểm tra và kiểm toán, thay vì chỉ nằm trong các tham số mạng nơ-ron khó giải thích. HL được định nghĩa là một hệ thống học trong đó đối tượng được cập nhật là cấu trúc phần mềm, không phải trọng số mạng nơ-ron, sử dụng phản hồi từ môi trường, kiểm thử, nhật ký và video. So với Deep RL, HL có ưu điểm về khả năng giải thích, hiệu quả mẫu theo đơn vị thay đổi mã, khả năng bảo toàn kiến thức cũ thông qua kiểm thử hồi quy và ít bị "lãng quên thảm khốc". Thử nghiệm mở rộng trên 57 trò chơi Atari cho thấy HL đạt hiệu suất ngang bằng các thuật toán RL cổ điển như PPO ở một số trò, nhưng bộc lộ hạn chế ở các nhiệm vụ đòi hỏi lập kế hoạch dài hạn như Montezuma's Revenge. Nếu được chứng minh, HL có thể có ý nghĩa lớn trong: 1) Điều khiển robot cho các nhiệm vụ cấu trúc ổn định, giảm phụ thuộc vào suy luận mạng nơ-ron thời gian thực; 2) Các kịch bản an toàn quan trọng, nơi tính kiểm tra được của mã nguồn là giá trị thương mại; 3) Học liên tục được kỹ thuật hóa thông qua các công cụ phần mềm truyền thống; 4) Giúp Agent tích lũy kinh nghiệm thành tài sản mã nguồn có thể tái sử dụng và chia sẻ. Tóm lại, Weng Jiayi đưa ra giả thuyết rằng trong kỷ nguyên AI có khả năng lập trình, kinh nghiệm có thể được chuyển đổi thành phần mềm có thể đọc và bảo trì, bổ sung cho mô hình học sâu truyền thống. Tuy nhiên, con đường này vẫn cần được thử nghiệm thêm ở các nhiệm vụ phức tạp hơn.

marsbit1 giờ trước

Kỹ sư hậu huấn luyện OpenAI Weng Jiayi đề xuất giả thuyết mới về Agentic AI

marsbit1 giờ trước

Claude của bạn sẽ mơ đêm nay, đừng làm phiền nó

Bài viết thảo luận về cách các công ty AI như Anthropic sử dụng các thuật ngữ mang tính con người như "mơ" (dreaming), "ghi nhớ" (memory) và "suy nghĩ" (thinking) để mô tả các chức năng kỹ thuật của AI Agent, qua đó làm mờ đi ranh giới giữa máy móc và con người. Cụ thể, tính năng "mơ" của Claude thực chất là một quá trình xử lý tự động ngoại tuyến, nơi Agent phân tích lại nhật ký hoạt động từ các tác vụ trước đó để tìm ra mẫu hành vi và tối ưu hóa hiệu suất trong tương lai, tương tự cơ chế củng cố ký ức khi ngủ của con người. Các nền tảng AI khác như Hermes Agent và OpenClaw cũng có cơ chế tự học tương tự. Bài viết chỉ ra rằng việc sử dụng ngôn ngữ nhân cách hóa này không chỉ là một chiến lược tiếp thị, nhằm tạo cảm giác AI là một thực thể sống có nội tâm, mà còn ảnh hưởng đến cách chúng ta phân bổ trách nhiệm khi có sự cố xảy ra, từ công cụ chuyển sang "chủ thể" hành vi. Đồng thời, nó đề cập đến thách thức kỹ thuật về bộ nhớ dài hạn (context window) của AI và nhu cầu về các cơ chế như "mơ" để lọc và lưu giữ thông tin quan trọng, trong bối cảnh các công ty như Subquadratic đang phát triển mô hình với ngữ cảnh cực dài lên đến 12 triệu token. Cuối cùng, tác giả dự đoán sự xuất hiện của các tính năng như "mơ giữa ban ngày" (daydreaming) để AI lên kế hoạch cho các tác vụ trong tương lai, và nhấn mạnh rằng việc thừa nhận bản chất máy móc của AI khó khăn hơn chúng ta tưởng khi ngôn ngữ đang liên tục được định hình lại.

marsbit1 giờ trước

Claude của bạn sẽ mơ đêm nay, đừng làm phiền nó

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片