从韭菜眼镜到链上弹幕、DEV 拉盘,Solana线上黑客松脑洞有多大

marsbit發佈於 2026-02-03更新於 2026-02-03

文章摘要

2026年1月20日至30日,由Trends与Solana中文社区联合举办的Solana线上黑客松以线上方式举行,参赛项目通过X平台公开提交和展示,覆盖交易机器人、Alpha工具、互联网资本市场及娱乐应用四大方向。 总冠军项目The MM Hunter(获奖4000美金)是一个基于机器学习的订单簿量化交易系统,通过分析Binance盘口数据实现自动化交易。其他获奖项目包括: - **交易与策略机器人**方向:Peak Trading(AI驱动交易终端)、鹰鸽猎手(宏观经济自动化交易)、MoonMate(游戏化AI交易伙伴); - **Alpha挖掘工具**方向:赤兔(链上聪明钱监控系统)、Voiverse(AI信息降噪工具)、TradeCat(开源多市场Alpha工具箱); - **互联网资本市场**方向:钱包可视化工具(链上资产视频化展示)、韭菜眼镜(法币与加密资产实时换算插件)、Sendit(链上弹幕社交工具); - **消费与娱乐应用**方向:Insider Loop(卡牌策略游戏)、DEV版K线模拟器(项目方操盘模拟)、DegenerCity(3D币圈人生模拟器)。 本届黑客松项目侧重实用性与用户体验,结合AI、自动化及游戏化设计,聚焦交易效率、信息过滤与链上交互等实际问题,展现了Solana生态的创新活力。

原创 | Odaily 星球日报(@OdailyChina)

作者 | Ethan(@ethanzhang_web3)

2026 年 1 月 20 日至 1 月 30 日,由 Trends 与 Solana 中文社区联合发起的 Solana 线上黑客松正式举行。作为一次完全基于线上的开发活动,本届黑客松以 X 作为项目提交与展示的主要阵地,开发者通过发布项目介绍、代码与 Demo 链接的方式,直接接受社区与评委的公开检验。

与传统依赖统一后台提交的黑客松不同,本次活动采用了更为开放的参与方式。参赛项目通过公开时间线进行展示,评委与社区成员可以直接试玩、互动与反馈。这种低门槛、强曝光的评选机制,使得大量偏产品向、偏体验向的项目在短时间内集中涌现。

在为期十天的提交与评审周期内,参赛项目覆盖交易与策略机器人、Alpha 挖掘工具、互联网资本市场以及消费与娱乐应用等多个方向。相比强调宏大叙事或底层基础设施,本届黑客松涌现出的作品更多聚焦于真实使用场景,尝试以 AI、自动化与游戏化方式,回应交易效率、信息噪音与用户体验等长期存在的问题。

以下为Odaily 星球日报对本届 Solana 线上黑客松获奖项目的详细盘点。

黑客松冠军

The MM Hunter(奖金 4000 美金)

项目 Demo 地址:https://the-mm-hunter.vercel.app/

Github 仓库:https://github.com/Dexless-AI1111/the-mm-hunter

项目简介:The MM Hunter 是一个基于 LightGBM 的订单簿量化交易项目,通过机器学习解析 Binance 盘口结构与造市商行为,并借助 Orderly NetworkAPI 实现自动化交易执行。

核心功能:

  • 订单簿数据获取:从 Binance 实时获取 Orderbook 深度数据
  • ML 方向预测:基于 LightGBM 输出涨 / 跌 / 不动三分类结果
  • 自动化交易:通过 Orderly NetworkAPI 执行开仓与平仓
  • TUI 实时监控:展示交易状态、持仓与 PnL
  • 历史回测:支持基于历史数据的策略回测验证

交易与策略机器人

第一名:Peak Trading(奖金 1300 USDC)

Dev X 主页:https://x.com/0xkled

项目 Demo 地址:peak.kled.fun

项目介绍:一款 AI 驱动的专业交易终端,聚焦交易决策、风控与复盘全流程。

核心功能:

  • 自动交易日志:跨多交易所自动记录每笔交易的完整上下文与策略标签
  • 聚合风控:统一监控多平台仓位、保证金与风险敞口
  • AI 下单验证:下单前基于行情、OI 与个人历史数据给出风险评估与建议
  • AI 对话式复盘:交易后对话复盘,并统计不同策略与信号的长期表现

第二名:鹰鸽猎手(奖金 800 美元)

Dev X 主页:https://x.com/bitares

项目地址:暂未公开

项目介绍:一个围绕宏观经济数据构建的自动化交易工作流,在关键数据发布时即时解析官方数据源,结合量化规则判断市场 Risk-On / Risk-Off 状态,并通过 BinanceAPI 按预设策略自动执行交易。

核心功能:

  • 宏观数据实时解析:监控官方经济数据源(如劳工部、商务部等),数据发布后第一时间获取并解析
  • AI 风险环境判断:将多年宏观数据交易经验量化为规则,辅助判断当前市场处于 Risk-On 还是 Risk-Off 状态
  • 自动化交易执行:直连 Binance API,按既定策略自动下单,支持现货与合约交易
  • 自动交易复盘:交易完成后自动生成复盘报告,记录开仓时间、价格与最终盈亏,用于策略优化
  • 多渠道通知:警报与复盘同步推送至飞书、Telegram、邮箱与企业微信

第三名:MoonMate(奖金 400 美元)

Dev X 主页:https://x.com/wab_hsu

Github 仓库:https://github.com/Louis-XWB/moonmate

功能演示:https://www.youtube.com/watch?v=jBk7e667Vso

项目介绍:具有陪伴式体验的 AI 交易伙伴,将量化交易能力与游戏化设计结合,通过多 Agent 决策系统、可视化决策流程与情绪化反馈,让交易过程更直观、更具参与感。

核心功能:

  • AI 委员会多 Agent 决策系统:由多个 AI Agent 共同参与决策,提高策略判断的多样性
  • 宠物式 AI 助手:以可爱的宠物形态实时陪伴交易过程
  • 多市场支持:支持 CEX 与 DEX 交易场景
  • 决策流程可视化:通过 Decision Flow 展示 AI 决策矩阵
  • 市场情绪感知:支持鲸鱼追踪与社交媒体情绪分析
  • Vibe 策略系统:让 AI 学习并理解用户的交易偏好

Alpha 挖掘工具

第一名:赤兔(奖金 1300 美元)

Dev 地址:https://x.com/bitcoinxsd

项目地址:chitu66.com

功能演示:https://www.youtube.com/watch?v=M0PkoCWjyMg

项目介绍:一套面向加密社群与投研团队的 Solana 链上 Alpha 捕捉系统,通过秒级监听大规模聪明钱地址池,筛选链上共识买入信号,并在钉钉内完成提醒、验证与扩散的完整闭环。

核心功能:

  • 地址池可扩展:支持从几百到几千、上万地址的长期监控与实时提醒
  • 提醒自带信息包:钉钉消息直接包含项目描述与推特信息(自动抓取、AI 解析与自动翻译),并可穿透查看钱包动态,无需跳转
  • 共识达标自动扩散:当推荐达到设定门槛(如 ≥5 人)时,自动二次推送至更大共识群或广播群

第二名:Voiverse(奖金 800 美元)

项目 X 主页:https://x.com/voiverse_ai

项目地址:https://t.me/Web3_Denoise_bot

项目介绍:AI 信息降噪与 Alpha 挖掘工具,通过全网监控、暴力过滤噪音,并基于用户画像进行定向推送,帮助用户用更少时间获取真正重要的信息。

核心功能:

  • 全网监控:持续扫描 X 与 Telegram 等信源,全天候捕捉 Web3 相关内容
  • 暴力降噪:通过 AI 过滤约 99% 的无效信息,只保留高价值内容
  • 个性化推送:基于用户自定义画像进行定向信息分发,实现个性化

第三名:TradeCat/交易猫(奖金 400 美元)

Dev X 主页:https://x.com/123olp

Github 仓库:https://github.com/tukuaiai/tradecat

项目介绍:开源的多市场 Alpha 工具箱,将数据获取、指标组合、规则信号生成与 Telegram 交互打通,覆盖从分析到信号推送的一整条链路。

核心功能:

  • 多源数据与历史数据支持:平台提供海量历史数据,并支持预测市场数据获取
  • 指标组合与信号引擎:支持无限拓展组合指标,基于规则生成交易信号,并提供 AI 技术分析能力(AI Wyckoff 分析)
  • 可视化与交互输出:集成数据可视化、币种查询,并通过 Telegram 实现信号与分析结果的交互推送

互联网资本市场

第一名:钱包可视化工具(奖金 1300 美元)

GitHub 仓库:https://github.com/MilkBlock/PnlSphereCraft

项目 Demo 地址:http://pnl.cryproject.xyz/

项目介绍:一款将 Solana 钱包数据转化为视频化资产博弈画面的可视化工具,基于 Ant.fun 的链上数据,把持仓与盈亏以 Agar.io 风格动态呈现,让钱包状态一眼可读。

核心功能:

  • 地址即生成视频:输入 Solana 钱包地址,即可生成 Agar.io 风格的动态视频,每个 Token 以“球”的形式呈现,大小对应资产权重与盈亏表现
  • 核心指标自动可视化:视频中自动展示总盈亏(Total PnL)、胜率(Win Rate)、最佳表现(Best Performance)等关键数据
  • 为传播优化的动态呈现:基于链上精准数据与视频渲染技术生成高帧率动画,适合复盘回顾与社交平台展示

第二名:韭菜眼镜(奖金 800 美元)

Dev X 主页:https://x.com/0x7ohnson

Github 仓库:https://github.com/7ohnson-byte/Leek-Vision/tree/main

项目介绍:一个面向 Web2 与 Web3 用户的浏览器插件与工具平台,通过将日常网页中的法币价格实时映射为加密资产数值,帮助用户在现实消费与链上世界之间建立更直观的价值对照。

核心功能:

  • 万物币本位:实时把 Amazon、淘宝、eBay 等站点的法币价换算成 SOL、BTC、ETH、BNB,浮层或行内双模式,随页自适应。
  • AI 研报助手:一键生成加密项目「迷你研报」,核心用途、关键信号、风险判断三栏式输出,独立弹窗即点即看。
  • 交互式电子宠物:像素风常驻浏览器,轻态陪逛,专业态秒唤 AI 分析,一宠两用。

第三名:Sendit(奖金 400 美元)

Github 仓库:https://github.com/NotevenDe/sendit-extension

Chrome 商店插件地址:https://chromewebstore.google.com/detail/sendit/gaenciobhjkndbmcodbghpfkbaaacbcp

项目介绍:一款将「弹幕」引入交易场景的全链聊天工具,原生支持大部分交易平台的社交集成,把分散在各个平台和群聊中的讨论直接叠加到 K 线上,让 Meme 交易从“单机看盘”变成实时互动的群体博弈。

核心功能:

  • 跨平台弹幕聚合:无论使用哪家交易平台,只要是同一个合约地址(CA),对应的弹幕内容即可打通并统一展示
  • 交易情绪可视化:喊单、FUD、情绪博弈直接呈现在 K 线之上,把交易过程中的心理战显性化
  • 安全与隐私设计:代码 100% 开源,仅读取行情与 K 线数据,不读取钱包、不申请多余权限

消费与娱乐应用

第一名:Insider Loop(奖金 1300 美元)

项目网站:https://cryptoallin.xyz/

GitHub 仓库:https://github.com/cola234/Insider-Loop

项目介绍:一款融合「小丑牌」机制的肉鸽类卡牌策略小游戏,通过不断组合卡牌效果影响价格走势,在随机性与策略博弈中完成逐周升级的挑战目标。(灵感取自于游戏 Insider Trading)

核心玩法:游戏目标是完成每周任务:游戏开始时,玩家的初始资金为固定的 1000,股价固定为 100。整个游戏共分为 4 周,每一周可以进行 5 轮游戏。

在游戏过程中,每张卡牌都拥有独立的特殊效果,玩家通过触发手牌来影响股价。每一天,玩家可以从随机刷新的卡池中抽取一张红卡和一张绿卡,抽取后的卡牌会与系统随机发放的 8 张卡牌组合成一段手牌。

玩家可以自由排序手牌,通过打出连击和触发特殊效果进行操作。每一张卡牌的触发都会对股价产生影响。游戏中还包含了丰富的特殊事件触发机制,玩家需要通过不断组合卡牌,应对每周难度递增的目标与挑战。

第二名:DEV 版 K 线大作战模拟器(奖金 800 美元)

Dev X 主页:https://x.com/hunterweb303

GitHub 仓库:https://github.com/duolaAmengweb3/ifimdev

项目介绍:一款以「假如你是项目 DEV」为视角的 K 线博弈模拟器,在 100% 模拟、零真实风险的环境下,体验从拉盘、砸盘到清仓的完整操盘过程。

亮点:

  • DEV 视角操盘模拟:在模拟环境中体验提前布局、拉盘、砸盘与清仓等操作流程
  • 多情景事件驱动:模拟 KOL 喊单、DEV 买入、社区 FUD、巨鲸入场等多种链上情景,观察不同行为对走势的影响
  • 纯模拟零风险:全部为模拟盘操作,不涉及真实资产,唯一“成本”为策略判断本身

第三名:DegenerCity(奖金 400 美元)

项目地址:https://www.degener.city/

项目教程:https://www.youtube.com/watch?v=ced2xZ1OqTc&t=36s

项目介绍:一款沉浸式 3D 币圈人生模拟器,在赛博朋克风格的城市中,用模拟资金完整体验币圈从散户到巨鲸的成长路径,把 FOMO、FUD 与 Rug Pull 等典型情境放进可交互的游戏世界。

亮点:

  • 币圈人生模拟:使用模拟资金参与交易、加杠杆、追涨杀跌等行为,在零真实资金风险下体验完整市场过程
  • 多角色与生态互动:在城市中与 50+ 币圈原型 NPC 互动,涵盖散户、KOL、庄家等不同角色视角
  • AI Agent 辅助系统:可雇佣 AI Agent 进行盯盘、分析与自动化交易支持
  • 沉浸式 3D 场景:以赛博朋克城市为载体,把交易、社交与决策融入空间化体验
  • 排行榜与赛季机制:参与全球排行榜竞争,赛季奖励以 $DEGEN 代币形式发放

另附此次获奖的其他项目组:

PolyScore:将观赛、预测与 SocialFi 完美融合,这是专为电竞玩家打造的 Solana 沉浸式社交预测市场

https://x.com/Aiom09/status/2016464207295009053?s=20

生日兽(Catmon):一个像素与生日交织的微型世界。 同步能量,解锁性状,遇见你的本命喵宠。

https://x.com/jove_BAD/status/2015762522910171407

Leg-Breaker(拍断大腿计算器):扫持仓、抓 ATH、让我们直面你少赚了多少

https://x.com/0xDiyaaa/status/2016466157143003142

Air O2:一个去中心化的、可视化的“空气审计”网络。我们将隐形的污染物转化为可见的、可行动的数据

https://x.com/EthRosamond/status/2014777262596628566

SCLERA:现在链上有很多信息差——内幕消息、alpha、未公开的数据,但这些信息要么在私密群里流通,要么被免费泄露后就没价值了

https://x.com/wayneIsKingFuck/status/2016110150814466278

PK Candle:当群友炒币意见不统一,不用说服群友认可你的观点,我会建议你直接来一局 pk candle,来彰显你的实力

https://x.com/jerry_hgnz/status/2016395495506403739

Web3 Anywhere - Cross-Chain AI Agent MCP Server

https://x.com/allinonesolana/status/2014654749145223327?s=20

Chainlife:一款基于 Web3 文化的硬核模拟经营网页游戏

https://x.com/TokenSci/status/2014725420311314651

Overheat: 面向预测市场的社交代理型预言机

https://x.com/overheatcrypto/status/2014726946287219020

Meme Arena:一个基于 Anchor 的全链上对战 DApp

https://x.com/bo_jian89456/status/2014937145740517378

Seeker App 中国象棋:这是一款经典的中国象棋游戏,支持去中心化玩法

https://x.com/Jessica56634268/status/2014899588042522825

Rug Pull Simulator:发币模拟器

https://x.com/web3simfun/status/2014994196772601973

Oneiro:Oneiro 是梦境可视化 × 心灵疗愈赛道的开创者,致力于将人类最私密、最原始的潜意识体验转化为可被理解、可被感知、可被引导的数字化表达

https://x.com/MrQin_BTC/status/2015436131106763103

击杀 Claim your fee 机器人:每次刷 X 看到“claim your fee 领你的创作者手续费~”这个 bot 帮你自动在那些垃圾回复下面回怼一句,顺便在链上记录每次“击杀”,攒够了可以 mint 一个 soulbound 的“Anti-Spam 勋章”当 pfp 炫耀。vibe:又丧又解气。

https://x.com/ovomiemiemie/status/2015691305272377375

像素战争:受 Reddit 的 r/place(一个传奇的协作画布,数百万人曾在此争夺像素)的启发,Vibe Coding 出了 Pixel War,在此基础上更进一步,加入了链上经济。每个像素都是 100x56 个网格上的可交易资产,社区在此协作,领地易手,每一次征服都具有实际价值。

https://x.com/justapein/status/2015734212884918551

BotPay:x402 风格内容付费 Demo

https://x.com/WAlex93511/status/2014704252279734476?s=20

Rush.Moe:Solana 原生 Web3 实时聊天应用

https://x.com/Rushxmoe/status/2015518426014622018

Solana Heist(链上大劫案):游戏分为两个紧密相连的阶段:盗取 (The Heist) 与 清洗 (The Laundering)

https://x.com/Evanlin_0128/status/2016052888234295635

Degen Copilot:AI 交易心理诊断师

https://x.com/YBCYBC00/status/2016317882217746760

Dreamwhisper:一款以心理解析为核心、治愈为底色、轻玄学为趣味彩蛋的智能梦境解析与记录工具

https://x.com/vvxiaoyu8888/status/2016118683366465554

童画记 | Little Moments:一个基于 Solana 的亲子记忆 DApp

https://x.com/hongkunwz/status/2016075627896730100

OnChain Gag:链上数据分析故事

https://x.com/0xKingsKuan/status/2016382261302849800

Solana Time Capsule:把消息锁在链上,设个时间或价格条件,到了就能打开。打开的时候自动在 Solana mint 纪念 NFT。

https://x.com/tibetanwater/status/2016457273674228018

SOL Adventure:链上冒险模拟器

https://x.com/SansXth/status/2016464266430398893

相關問答

Q本次Solana线上黑客松的冠军项目是什么?它获得了多少奖金?

A本次Solana线上黑客松的冠军项目是The MM Hunter,它获得了4000美金的奖金。

Q交易与策略机器人赛道的第一名项目Peak Trading有哪些核心功能?

APeak Trading的核心功能包括:自动交易日志(跨多交易所自动记录每笔交易的完整上下文与策略标签)、聚合风控(统一监控多平台仓位、保证金与风险敞口)、AI下单验证(下单前基于行情、OI与个人历史数据给出风险评估与建议)以及AI对话式复盘(交易后对话复盘,并统计不同策略与信号的长期表现)。

QAlpha挖掘工具赛道的第一名项目“赤兔”的主要特点是什么?

A“赤兔”的主要特点是:一套面向加密社群与投研团队的Solana链上Alpha捕捉系统,通过秒级监听大规模聪明钱地址池,筛选链上共识买入信号,并在钉钉内完成提醒、验证与扩散的完整闭环。其核心功能包括地址池可扩展、提醒自带信息包以及共识达标自动扩散。

Q互联网资本市场赛道的第二名项目“韭菜眼镜”是一个什么工具?

A“韭菜眼镜”是一个面向Web2与Web3用户的浏览器插件与工具平台,通过将日常网页中的法币价格实时映射为加密资产数值,帮助用户在现实消费与链上世界之间建立更直观的价值对照。其核心功能包括万物币本位、AI研报助手和交互式电子宠物。

Q消费与娱乐应用赛道的第一名项目Insider Loop的灵感来源和核心玩法是什么?

AInsider Loop的灵感来源于游戏Insider Trading。其核心玩法是一款融合「小丑牌」机制的肉鸽类卡牌策略小游戏,玩家通过不断组合卡牌效果影响价格走势,在随机性与策略博弈中完成逐周升级的挑战目标。游戏共分为4周,每周进行5轮,玩家通过触发手牌来影响股价,并应对每周难度递增的目标与挑战。

你可能也喜歡

BTC“数字黄金”的叙事是不是失败了?

这篇文章从三个核心问题探讨了比特币的现状与未来,强调提供的是思考框架而非投资建议。 **如何看待比特币资产?** 作者认为比特币是一种全新的、更优秀的“黄金”资产。其优势在于总量恒定、转移便捷、交易可审计。尽管早期与灰色地带关联,但合规化是趋势。目前全球数字货币渗透率仅3%-4%,类比互联网和电商的早期阶段,意味着比特币仍处于发展初期,潜力巨大但波动性也极高。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月一度跌破6.1万美元,单日跌幅达15%,随后又快速反弹。这被解读为遵循四年减半周期的共识性获利了结。特别之处在于,美国比特币ETF的批准引入了机构资金,也促使早期低成本持有者(如矿工和信仰者)进行大规模“换手”,这是资产迈向主流化的必经过程。历史数据显示,比特币历次大跌的幅度在收窄(从93%到当前的约50%),表明资产正在成熟,波动率逐步下降,但高波动仍是其获取超额回报的固有特征。 **长期如何看待发展?** 长期价值可对标黄金。当前比特币市值仅为黄金市值的约7%,若“数字黄金”叙事实现一半,上行空间依然显著。但作者提醒,短期市场脆弱,换手可能未完,底部无法预测。真正的风险并非资产归零(概率较低),而在于错误的仓位管理(如All-in或加杠杆)以及对资产缺乏深刻理解。投资者必须计算并承受潜在的最大回撤(例如从已跌50%的位置再跌50%),才能存活至长期价值兑现。 文章最后以亚马逊在互联网泡沫后暴涨为例,指出关键不在于比特币未来是否上涨,而在于投资者能否通过理性的仓位管理和深度认知,扛过剧烈波动存活到那一天。文末提问引导读者反思:当前黄金涨、比特币跌的局面,究竟意味着“数字黄金”叙事失败,还是资产进化过程中的换手阵痛?这取决于每个人对比特币最底层的信仰。

marsbit8 小時前

BTC“数字黄金”的叙事是不是失败了?

marsbit8 小時前

BTC“数字黄金”的叙事是不是失败了?

标题:BTC“数字黄金”的叙事是不是失败了? 作者:@wuk_Bitcoin 本文从三个核心问题出发,探讨比特币的现状与未来。 **如何看待比特币?** 作者认为比特币是一种全新的、更优秀的“黄金”类资产。其优势在于:总量恒定(2100万枚);资产可转移性极强,在全球不确定性时代具备溢价;所有交易链上可审计,透明度高。反驳了比特币主要用于灰色地带的过时观点,指出其正走向合规。目前全球数字货币渗透率仅约3%-4%,类比互联网和电商早期,意味着该资产类别仍处早期,潜力与巨大波动并存。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月初曾单日暴跌15%,跌破6.1万美元。这被视为遵循其四年减半周期的规律性回调,是长期持有者在周期高点锁定利润的结果。本轮下跌的特殊性在于:美国比特币ETF的批准引入了大量机构新资金,但也促使成本极低的早期持有者(矿工、OG)进行历史性抛售,即从“早期信仰者”向“长期配置机构”的换手过程。历史数据显示,比特币历次大回撤的跌幅在逐步收窄(从93%到目前的约50%),表明资产在成熟,波动率在下降,但高波动仍是获取超额回报的代价。 **长期怎么看?** 若将比特币视为“数字黄金”,其当前总市值(约1.4万亿美元)仅为黄金总市值(约20万亿美元)的7%。即使该叙事仅部分实现,上行空间依然可观。但作者强调短期风险:换手可能未结束,市场脆弱,不排除进一步下跌。真正的风险不在于资产归零(概率极低),而在于错误的仓位管理(如All-in、加杠杆)和对资产缺乏深度理解,这可能导致投资者无法承受巨大波动而提前被迫出局。 **最后对比** 作者以亚马逊在互联网泡沫破裂后股价跌95%又最终上涨42倍为例,指出关键在于“活着等到那一天”。对于比特币,核心同样是能否通过理性仓位管理活到其价值兑现之时。文末提问:当黄金大涨而比特币大跌,这究竟是“数字黄金”叙事的失败,还是资产进化过程中的阵痛?答案取决于每个人对比特币最底层的信仰。

链捕手8 小時前

BTC“数字黄金”的叙事是不是失败了?

链捕手8 小時前

从代码到认知:机器人大脑进化的万字指南

本文概述了机器人大脑从传统代码控制到现代人工智能模型驱动的演进历程。文章首先回顾了前大型语言模型(LLM)时代,机器人依赖手工编码的模块化技术栈(感知、状态估计、规划、控制)和行为树,虽稳定但泛化能力差。随后,深度学习改进了感知,强化学习和模仿学习进入了控制层,但策略仍较为狭窄。 ChatGPT的出现带来了转折。LLM最初被用作自然语言编译器,将指令转化为机器人可执行的原子技能序列(如谷歌的SayCan)。但更重要的突破是视觉-语言-动作模型(VLA),例如谷歌的RT-2和开源的OpenVLA,它能将视觉、语言信息融合,直接输出动作指令,实现了推理与行动的耦合。 目前最先进的系统采用“双脑”架构(如Figure AI的Helix、NVIDIA GR00T):一个慢速、参数多的“系统2”负责高层次推理和规划;一个快速、小巧的“系统1”负责高频动作生成。其下还可能有一个“系统0”反射层处理平衡等底层控制。出于延迟和可靠性考虑,安全关键的控制回路通常在机器人本地(如NVIDIA Jetson模块)运行,而对话界面和集群学习等任务可交由云端。 开源模型(如OpenVLA、GR00T、π0)降低了行业门槛,让初创公司能在其基础上用自有数据微调。然而,当前VLA机器人仍存在任务中途恢复能力弱、样本效率低、缺乏物理常识和长期规划能力等局限。 这催生了下一代方向:世界模型。这类模型(如NVIDIA Cosmos、Meta V-JEPA)能根据当前状态和动作预测未来结果,让机器人在行动前进行模拟和评估,从而改善恢复能力、泛化能力和长期规划。架构上主要分为像素级视频扩散、联合嵌入预测架构(JEPA)和潜在动作世界模型等流派。 文章最后指出,数据采集(特别是远程操作数据)是核心竞争力,仿真训练至关重要,机器人成本正在迅速下降。当前物理AI的发展阶段大约相当于“GPT-2时代”,虽未完全自主,但正通过架构的持续演进(从代码到感知、规划、策略,最终到世界模型),朝着更通用、更强大的方向稳步前进。

marsbit9 小時前

从代码到认知:机器人大脑进化的万字指南

marsbit9 小時前

交易

現貨
合約
活动图片