# 代码生成的所有文章

在 HTX 新闻中心浏览与「代码生成」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策，提供权威的加密行业洞察。

首个长程Doc2Repo训练集，代码Agent不止修bug，开始造仓库

中国人民大学高瓴人工智能学院近日发布了DeNovoSWE数据集，这是首个专注于长程软件工程任务（尤其是从零生成完整代码仓库）的大规模训练集。该数据集通过“Divide & Conquer”与“Critic & Repair”机制自动构建，包含4,818个高质量实例，为代码智能体（Code Agent）提供了从任务文档重建整个可执行仓库的训练环境。传统代码智能体多专注于修复局部Bug，而DeNovoSWE旨在推动智能体向“架构师”角色演进，使其能够根据结构化文档进行长程规划、模块设计、接口实现和跨文件协作，最终生成可通过测试的完整仓库。实验表明，基于DeNovoSWE训练的模型在BeyondSWE-Doc2Repo和NL2RepoBench等长程评测基准上表现显著提升，例如Qwen3-30B-A3B-Instruct在BeyondSWE上的成功率从5.8%提升至47.2%。这证明专门的长程任务数据对提升代码智能体的仓库级工程能力至关重要。

marsbit昨天 08:50

marsbit昨天 08:50

谁最会用Claude Code？答案可能不是程序员

这篇基于约40万次Claude Code会话的分析报告发现，AI编程工具正在重塑人与代码的协作关系。核心结论是：在智能体编程中，人类主要承担“做什么”的规划决策，而AI则负责“怎么做”的执行工作，包括编写、修改和调试代码。研究显示，使用Claude Code的成功率并不取决于用户是否是程序员。在法律、金融、管理等非技术职业的用户中，完成编码任务的效率已接近软件工程师水平。真正影响结果的关键因素是用户对自己要解决问题的理解深度，即领域专业知识。领域专家能够用更精准的指令引导AI完成更大量、更复杂的工作。数据表明，从2025年10月到2026年4月，Claude Code承担的任务价值平均增长约25%，且用于纯粹调试的会话占比下降近半，更多转向端到端的开发、部署、数据分析及文档撰写等工作。同时，当会话遇到问题时，新手用户放弃的比例远高于中高级用户，突显了领域知识在引导和纠正AI方面的重要性。报告指出，AI编程降低的是实现门槛，而非判断门槛。未来，懂业务、能清晰定义问题和评估结果的人，可能比单纯会写代码的人更能发挥AI的价值。这意味着，智能体工具不会取代领域知识，反而会放大其作用，使各行业的从业者都能完成以往难以独立完成的技术工作。

marsbit06/20 02:03

marsbit06/20 02:03

要么全栈，要么出局：xAI 600 亿美元收购 Cursor 背后的算盘

xAI以600亿美元股票收购Cursor母公司Anysphere，核心意图并非市场份额，而是获取其700万开发者每日产生的高质量代码训练数据。文章指出，代码生成是当前大语言模型最成功的应用，并以Anthropic为例，其营收在28个月内增长约540倍，其中Claude Code产品贡献显著，迅速占据企业AI编程市场过半份额。作者（VC机构Strange Ventures合伙人）提出核心观点：想成为AI巨头，必须构建“全栈”能力——即打通算力、模型与应用层。全栈模式能改善模型训练的经济效益，并通过应用层获取专有数据构建竞争壁垒。预计未来模型公司将更积极地自建或并购应用层业务。此次收购印证了xAI完善其全栈布局（算力Colossus、模型Grok、应用X）的战略，Cursor的代码数据将直接增强Grok的竞争力。文章最后强调，在AI工具大幅降低产品开发门槛的当下，创业公司需要具备更大的野心方能成功。

marsbit06/18 09:41

marsbit06/18 09:41

AGI只差最后一步了

Anthropic 发布了名为 Mythos 的强大 AI 模型，因其在网络安全和生物化学等领域展现出高风险能力而未公开。随后，该公司推出经过安全限制的版本 Fable 5。 Fable 5 在多项测试中表现卓越，尤其在编程和长周期任务上展现出真正的“长程代理能力”，能自主规划并完成复杂工作，例如在一天内迁移了 5000 万行遗留代码。这标志着其在数字经济层面已接近通用人工智能（AGI）。然而，其未受限版本 Mythos 5 被评估能合成危险物质及发动高级网络攻击，因此仅向经过严格审查的机构开放。为控制风险，Anthropic 为 Fable 5 部署了安全分类器和 30 天数据留存监控。在定价上，Fable 5 费用较高，主要面向企业客户。其防御性应用可能成为企业的刚需，推动高端 AI 市场向 B 端集中，并可能加速“一人企业”的普及。这标志着 AI 产业从免费试用走向成熟分工，顶尖技术将优先服务于高价值领域。

marsbit06/11 05:10

marsbit06/11 05:10

Sam Altman 对谈 Stripe CEO：想法比代码更值钱的时代来了！

在2026年4月30日的Stripe年度大会上，OpenAI CEO Sam Altman与Stripe CEO Patrick Collison展开炉边对话。Altman分享了一系列关于AI发展的核心观点。他强调，AI发展正处于快速“起飞”阶段，每周都有新变化，尤其在代码生成领域已突破临界点。人们将普遍意识到AI能解放大量被琐碎电脑操作浪费的时间。 Altman指出，企业成功应用AI的关键在于CEO亲自下场推动自动化，而非仅口头倡议。OpenAI自身经历了三次进化：从纯粹的研究机构，到产品公司，再到如今致力于成为大规模、低成本、像电力一样的智能“Token工厂”基础设施，目标是与世界经济发展深度绑定，即便利润微薄。在管理上，OpenAI依靠对“规模化”的共同信念集中资源，Altman本人也通过Slack直接与数百名员工保持简短沟通。对于创业生态，Altman认为“想法派的复仇”已经到来。深度理解用户、具备产品洞察力的非技术创业者，如今借助AI工具也能快速构建产品，值得投资。面对AGI可能在未来几年到来的不确定性，他主张以“不信之信”的态度，既做长期基础设施投入，又对近期保持清醒。最令Altman兴奋的是AI加速科学发现的潜力。它正在将癌症等复杂疾病的研究周期从十年缩短至一年，并将在材料科学、能源（如核聚变）等领域带来飞跃性突破。最后，Altman重申了“迭代部署”和AI民主化的重要性，反对将技术锁在“象牙塔”内，坚信推动技术人人可用、可构建是其最重要的贡献。

marsbit05/15 13:52

marsbit05/15 13:52

a16z AI方向合伙人的八年创业笔记

a16z AI合伙人回顾八年生成式AI创业历程：从2018年创立Rosebud AI，在GPT尚未出现时押注“合成媒体”领域，通过CycleGAN等早期技术探索AI创意工具。在模型不成熟阶段，团队通过设计交互流程放大“将就但好用”的体验，成功推动Tokkingheads等产品实现自然增长。2023年GPT-4的突破使代码生成趋于成熟，推动文字转游戏等功能的实现。作者指出，当前AI竞争重点已从“证明能做什么”转向能力产品化与商业化，并强调创业者需在实验室技术路径外寻找创新空间。如今作者卸任CEO投身a16z，将专注于投资前沿模型栈及基础设施，支持AI领域创业者。

marsbit04/26 12:03