如何做好研究:锻炼那些可以「刻意练习」的真正能力

marsbit发布于2026-06-15更新于2026-06-15

文章摘要

并没有人真正教过如何做研究,大多数人只学会了如何“看起来”像研究员,而非真正掌握研究能力。真正的能力由一系列可刻意练习的小技能组成。 **一、选择自己的问题** 不应被动接受他人设定的问题,而应主动选择自己真心希望实现的目标,并反向设计实验。这能导向原创性。研究“品味”如同肌肉,可通过反复预测实验结果、仅凭方法猜测论文数据、并事后验证预测准确性来锻炼。 **二、升级信息输入** 若只依赖热门榜单和社群讨论,容易产生趋同想法,价值有限。应重视旧资料,因为领域发展常重演历史。同时,广度与深度并重:跨学科借鉴(如神经科学、机制设计)和理解底层技术(如GPU内存)至关重要。务必阅读论文原文,尤其是附录和“局限性”部分。 **三、坚持记录一切** 写作是最廉价的防自欺机制,能将模糊想法暴露为逻辑漏洞。应效仿达尔文,立即记录任何与理论相悖的事实,防止记忆选择性遗忘。保持实验日志(假设、设置、预期、结果、认知更新),定期回顾能有效促进反思与成长。

并没有人真正教过你如何做研究。你得到一张办公桌、一个别人挑好的问题,以及一个「做出点新东西」的模糊指令。

因此,大多数人通过他们能看到的东西(比如论文、帖子和公告)对这份工作进行逆向工程,最终他们学到的只是如何「看起来」像个研究员,而不是如何「成为」一个研究员。真正的研究能力是一系列小技能的堆叠,而几乎每一项都可以通过刻意练习来培养。

挑选你自己的问题

理查德·汉明(Richard Hamming)在贝尔实验室有个习惯,这让他在午餐时很不受欢迎。他会问坐在旁边的人,他们领域里重要的问题是什么,然后问他们为什么不去研究这些问题。于是大家纷纷换桌吃饭。

这个问题很刺人,因为我们大多数人都给不出好答案。我们不是在选择问题,而是在吸收问题——从导师那里吸收,从某个大实验室上个季度发布的公告里吸收,从这周大家都在转发引用的论文里吸收。

吸收来的问题,麻烦在于你只握有结论,却不知其背后的推理逻辑。你知道某个著名实验室关心某个方向,但你不知道为什么,不知道他们期望发现什么,也不知道什么情况会让他们放弃这个方向。

当他们转向时,你一年后才会察觉。而且,在一个已经流行起来的问题上,你是在和 1,000 个起步比你早、算力比你多的人赛跑。

约翰·舒尔曼(John Schulman)的机器学习研究指南将这项工作分为两种模式。第一种,你阅读文献并寻找可以改进的地方。第二种,你选择一个你真心希望实现的结果,然后反推去设计实验。

他主张第二种,其隐晦的原因在于这能制造出原创性。一个你真正关心的目标,会把你拖入任何综述论文都未曾覆盖的领地。

至于「品味」(taste),人们常把它当成一种天赋来讨论。但它表现得其实更像是一块肌肉。

在运行每次实验前,先预测它的结果;遮住一篇论文的结果部分,仅凭它的方法来猜测数据;记下这个月发布的哪些成果在两年后依然重要,以后再来验证你的命中率。一次预测加上一次纠错,重复几百次——每一个好模型都是这样训练出来的,包括你脑子里的那个。

升级你的输入

共享的阅读清单产生共享的想法。如果你的信息口粮只是 arXiv 的热门榜单加上群聊筛选后剩下来的东西,你必然会跟所有人同时得出同样的结论,这也使得这些结论几乎一文不值。

旧资料的价值被严重低估了。这个领域总是延时重演自己的过去:混合专家模型(MoE)可追溯到 1991 年,LSTM 到 1997 年,反向传播在 1986 年就成了主流。

理查德·萨顿(Rich Sutton)在 2019 年只用了一千来字就写出了《苦涩的教训》(The Bitter Lesson),而它对该领域发展轨迹的预测,比篇幅长它十倍的综述还要准。克劳德·香农(Claude Shannon)在 1952 年做过一场关于创造性思维的演讲,他的第一招就是把问题缩小到几乎微不足道的程度,破解这个缩小版,然后再将难度一点一点地加回去。

单凭这一招,就能帮你撞破比任何现代生产力建议都要多的墙。

广度和深度一样重要。可解释性研究毫不掩饰地借鉴了神经科学;评测(Eval)设计就是披着白大褂的机制设计;只要对 GPU 到底如何移动内存有实际的认知,你就能在基准测试结果出来之前判断出哪些架构论文注定会失败;而诚实的统计学可能已经是机器学习领域最稀缺的技能了,在这里,许多公开发表的「严谨」,不过是带有误差棒的「感觉」。

还有一件事。去读论文本身,而不是读总结它的帖子。附录才是埋藏秘密的地方,而「局限性」部分通常是整篇文档中最诚实的一段。

把一切都写下来

保罗·格雷厄姆(Paul Graham)指出,一个想法在你试图把它变成文字之前,总感觉已经非常成熟了。但白纸黑字会暴露出你大脑粉饰过的漏洞:你从未测试过的假设、其实并不连贯的步骤、两个悄悄自相矛盾的主张。

费曼(Feynman)的原则是,你必须避免欺骗的第一人就是你自己,因为你是最容易上当的目标。写作是有史以来发明的最廉价的防御机制。

达尔文走得更远,他将其程序化了:任何违背他理论的事实都会被当场写下来,因为他发现自己的记忆删除不便证据的速度,远比删除有利证据的速度快。你的记忆对你失败的运行记录也是如此。

保持做日志的习惯:假设、设置、预期、结果、更新后的认知。重读上个月的记录会让你感到极度谦卑,没有任何审稿人能带来这种效果。

相关问答

Q文章认为,真正的研究能力可以通过什么方式培养?

A文章认为,真正的研究能力不是天赋,而是一系列小技能的堆叠,几乎每一项都可以通过“刻意练习”来培养。

Q约翰·舒尔曼主张的第二种研究模式是什么?这样做有什么好处?

A约翰·舒尔曼主张的第二种研究模式是:选择一个你真心希望实现的结果,然后反推去设计实验。这样做的好处是能制造出原创性,因为一个你真正关心的目标会把你拖入任何综述论文都未曾覆盖的领地。

Q文章中提到,关于“品味”(taste),作者是如何看待的?他建议如何锻炼它?

A文章指出,“品味”表现得不像一种天赋,而更像是一块可以锻炼的肌肉。作者建议通过以下方式锻炼它:在实验前先预测结果;遮住论文的结果部分,仅凭方法来猜测数据;预测哪些成果在未来依然重要并事后验证。

Q作者为什么认为“广度和深度一样重要”?请举出文章中提到的至少一个例子。

A作者认为“广度和深度一样重要”,是因为广博的知识能带来独特而有价值的洞见和突破。例如,文章指出:可解释性研究借鉴了神经科学;评测设计借鉴了机制设计;了解GPU如何移动内存能预判架构论文的成败;诚实的统计学是机器学习领域的稀缺技能。

Q根据文章内容,写作在研究过程中扮演了怎样的角色?达尔文在这方面有什么具体的做法?

A写作在研究过程中是一种廉价的防御机制,能迫使想法具体化,暴露思考中的漏洞、未经检验的假设和逻辑矛盾。达尔文的做法是,程序化地将任何违背他理论的事实当场写下来,因为他发现自己的记忆会自动快速地忘记不利证据。

你可能也喜欢

SPCX要涨到400美元?期权能否把SpaceX推向全球市值第一

ZeroHedge等激进财经媒体认为,SpaceX(股票代码SPCX)由于上市初期流通盘较低、散户买盘高度集中,且期权即将开放交易,存在引发“伽马挤压”的可能,极端情况下股价或飙升至400美元,对应市值约5.2万亿美元,接近甚至可能短暂超越英伟达。 SPCX的特殊性在于其作为超大规模公司,上市初期可自由交易的股份比例有限,这使得其短期价格行为更像小盘股,对资金流入高度敏感。期权(特别是虚值看涨期权)的开放为波动加上了杠杆。若散户大量买入这类期权,做市商为对冲风险将被迫买入正股,可能形成“股价上涨→做市商加仓对冲→进一步推高股价”的正反馈循环。 数据显示,SPCX连续占据散户净买入榜首,资金高度集中于此单一标的,而非全市场风险偏好扩散。这既放大了短期上行动能,也意味着持仓结构脆弱,一旦预期落空或流动性变化,反向波动也可能剧烈。 目前,400美元仅是基于特定市场结构的极端推演,并非市场共识或基本面锚定价值。关键验证点在于期权上市后的真实交易情况:需观察虚值看涨期权的未平仓量是否集中、隐含波动率变化以及正股在高位是否有持续的实际买盘承接。投资者应密切关注这些数据,而非仅依赖社交媒体上的夸张价格目标。

marsbit20分钟前

SPCX要涨到400美元?期权能否把SpaceX推向全球市值第一

marsbit20分钟前

SpaceX 万亿估值的底座:谁在瓜分马斯克每年的百亿资本开支?

SpaceX(股票代码待定)上市后,其万亿估值背后是每年数百亿美元的资本开支,这为供应链上的众多公司带来了机遇。文章认为,投资SpaceX的供应链企业,可能比直接投资其本身更具潜力和确定性。 SpaceX的业务主要由三部分构成:稳定盈利的星链(Starlink)业务、持续投入的火箭发射业务(猎鹰、星舰)以及仍在亏损的AI业务(包括地面超算和规划中的轨道数据中心)。公司形成一个资金循环:星链的利润支持火箭研发以降低发射成本,低成本发射再将AI硬件送入太空,最终通过出租AI算力创造新收入。这个循环每年产生巨大的采购需求。 供应商按其可替代性分为三类: 1. **短期内无法替代**:包括提供GPU和CUDA生态的英伟达(NVDA)、持有关键卫星通信频谱的欧洲通信卫星公司(Eutelsat,SATS)、为星链卫星提供毫米波放大器的Filtronic(FTC)、全球铍金属主要供应商Materion(MTRN),以及提供相控阵天线芯片的意法半导体(STM)。 2. **技术上可换但代价高昂**:包括提供火箭飞控系统的霍尼韦尔(HON)、提供发动机特种钢的Carpenter Technology(CRS)、供应航天碳纤维的赫氏(Hexcel, HXL)、负责高速数据交换的博通(AVGO),以及在发射场附近供应液氧液氮的林德集团。 3. **需要稳定量产、成本优先**:这类公司集中在星链终端等需要大规模生产的产品上。例如,星链终端主要代工厂启碁科技(6285),以及多家A股公司,如信维通信(300136)、派克新材(605123)、西部材料(002149)、应流股份(603308)、天银机电和通宇通讯等。此外,还有提供时间同步、配电、散热等关键“螺丝钉”功能的美股公司。 文章指出,当前关注SpaceX供应链恰逢其时,原因有三:一是SpaceX的采购量正处于加速增长的起点;二是公司上市后提高了财务透明度,便于跟踪验证供应链订单;三是参照苹果、特斯拉产业链的发展历史,SpaceX供应链目前可能类似于特斯拉2018年的阶段,正进入快速增长期。 最后,文章总结,无论SpaceX股价如何波动,其庞大的、持续的采购订单将为供应链上的公司带来确定的营收。对于投资者而言,关注这些“安静供货”的供应链企业,或许是参与太空经济浪潮的另一种方式。

链捕手1小时前

SpaceX 万亿估值的底座:谁在瓜分马斯克每年的百亿资本开支?

链捕手1小时前

交易

现货
合约

热门文章

什么是 $WELL

WELL3, $$WELL:通过 DePIN 和 AI 彻底改变健康与保健 介绍 在快速发展的数字技术领域,健康和保健行业处于创新的前沿,努力提升患者护理和促进更健康的生活方式。WELL3 是该领域的一位开创性参与者,这是一项开创性的 Web3 项目,旨在彻底改变个人与其健康的互动方式。通过利用去中心化物理基础设施网络(DePIN)、去中心化身份(DID)和人工智能(AI)等技术,WELL3 旨在促进安全、数据驱动的健康旅程。本文将深入探讨 WELL3、$$WELL 的核心方面,包括其功能、创作者、投资者及独特特性。 什么是 WELL3, $$WELL? WELL3 是一个创新平台,旨在重新定义健康与保健的方法。该项目专注于将 DePIN 和 DID 与 AI 系统结合,旨在创造个性化的用户体验,同时确保个人健康数据的安全性和隐私性。拥有超过一百万名预注册用户的亮眼数字,WELL3 的主要使命是通过安全、数据驱动的健康旅程提升人们的福祉。 在其核心,WELL3 采用先进的区块链技术,确保用户对个人信息拥有完全控制权。该项目不仅解决了数据安全和可达性方面的挑战,还旨在创建一个由共享更好健康的承诺连接起来的充满活力的社区。 WELL3 的关键特性: DePIN 和 DID:这些技术能够安全地拥有和验证数据,使用户对其信息拥有完全控制权。 AI 集成:通过利用 AI 分析,WELL3 提供个性化的见解和解决方案,量身定制以满足个人健康需求。 社区参与:促进一个支持性的环境,用户可以在这里交流,分享经验,互相激励,共同迈向更健康的生活。 WELL3, $$WELL 的创作者 关于 WELL3 创作者的身份,在现有信息中尚未明确。随着项目的推进,可能会出现更多详细信息,为这一变革性倡议背后的 visionary 思想提供背景。 WELL3, $$WELL 的投资者 WELL3 得到了众多有影响力的投资实体的支持,凸显了其在健康和保健领域的可靠性和潜力。主要投资者包括: Animoca Brands AWS 三星 斯巴达集团 Blocore Fenbushi Capital Newman Group Soul Capital XY Finance Lumoz 这些知名组织的支持展示了对 WELL3 使命的强烈信心,为其创新和扩展提供了必要的资源。 WELL3, $$WELL 如何运作? WELL3 通过把尖端技术融入多链框架,确保用户获得无缝和创新的体验。以下是使 WELL3 在健康市场独具特色的一些因素: 1. 安全的数据所有权 通过整合 DePIN 和 DID,用户可以保持对个人健康信息的完全控制。在当今数字时代,这一安全层面至关重要,因为数据泄露和未经授权的访问无处不在。通过 WELL3,数据所有权实现去中心化,使用户能够主动管理自己的信息。 2. 通过 AI 实现个性化 WELL3 利用 AI 驱动的分析为用户提供量身定制的健康见解。通过利用 AI 的力量,平台能够提供个性化的推荐和解决方案,鼓励用户更有效地实现健康目标。 3. 多链框架 WELL3 项目设计适用于多个区块链平台,包括比特币、以太坊、Polygon、Solana、Blast 和 TON。这种多链能力确保用户能够在不同网络之间无缝互动该平台,增强可访问性和可用性。 4. WELL 代币 WELL3 生态系统的核心是 WELL 代币,其用途多种多样,包括效用、治理和奖励。该代币允许参与生态系统,支持健康数据共享,并根据用户在平台上的参与给予激励。 WELL3, $$WELL 的时间线 WELL3 的发展轨迹展示了其在开发过程中的重要里程碑,每个里程碑都有助于项目的整体成功。以下是 WELL3 历史上重要事件的简要时间线: 2024年2月10日:WELL3 启动其 NFT 项目,迅速崛起为 opBNB 链上最大的 NFT 收藏,拥有超过 324,000 名所有者,并在 2024 年 4 月 27 日之前创造了 800 万个 NFT。 公开销售:该项目在仅七天内实现了约 15,237.2 ETH 的总锁定价值(TVL),表明市场的强烈兴趣和支持。 WELL ID 启动:平台上已有超过 900,000 用户注册 WELL ID 及其对应的 NFT Ring 白名单,标志着生态系统内显著的采用阶段。 合作伙伴关系发展:WELL3 与包括 Animoca Brands、AWS、三星等领先实体建立合作伙伴关系,以增强其生态系统并扩展其影响力。 交易量:WELL3 已经促进了超过 1700 万美元的交易,反映其在健康与保健社区不断增长的实用性和参与度。 关于 WELL3, $$WELL 的关键点 作为一个向健康市场转型的进步倡议,WELL3 确定了一些关键要素,将为其持续成功做出贡献。以下是一些值得注意的关键要点: 代币经济学 $$WELL 代币的最大供应量为 420 亿,其中有 71% 用于社区倡议。这种分配策略强调了项目对其用户基础和长期可持续性的承诺。 锁仓期 为确保生态系统的稳定性,代币将在 24 个月 的锁仓期内分批释放,提升用户的信任和信心。 生态系统发展 WELL3 的愿景是创建一个全面和可持续的生态系统,以鼓励繁荣的社区参与、促进健康行为,并提供针对健康领域紧迫需求的数字解决方案。 市场契合度 估值为 5.6 万亿美元 的健康产业提供了一个丰厚的机会,WELL3 旨在抓住这一机会。该项目预计的年增长率为 5-10%,在健康意识生活日益上升的趋势中,项目正处于理想位置。 可穿戴设备 推出 WELL3 Ring,这是一种以加密激励的可穿戴设备,符合对个性化健康数据日益增长的需求。该设备不仅增强了用户体验,还重新定义了在 Web3 语境下与健康互动的含义。 结论 WELL3 代表了区块链技术在健康和保健领域整合的重大进展。通过解决数据所有权、个性化和社区参与等关键问题,这一创新平台为提升个人福祉提供了前瞻性解决方案。在显著投资者的强大支持和对先进技术的承诺下,WELL3 将在健康产业产生持久的影响。对于那些寻求在数字时代导航健康复杂性的人来说,WELL3 无疑是一个值得关注的项目,因为它不断发展和壮大。

54人学过发布于 2024.07.14更新于 2024.12.03

什么是 $WELL

如何购买WELL

欢迎来到HTX.com!我们已经让购买Moonwell Artemis(WELL)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Moonwell Artemis(WELL)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Moonwell Artemis(WELL)购买完您的Moonwell Artemis(WELL)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Moonwell Artemis(WELL)在HTX的现货市场轻松交易Moonwell Artemis(WELL)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

378人学过发布于 2024.12.10更新于 2026.06.02

如何购买WELL

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对WELL(WELL)币价的意见。

活动图片