技术发展

探讨区块链领域的最新技术创新、协议升级、跨链解决方案与安全机制,从开发者视角剖析未来技术趋势与潜在突破。

Mythos首个报告出炉:全球数十亿设备裸奔,30天挖出10000致命漏洞

Anthropic公司启动的“玻璃翼计划”首月战报公布,其下一代顶级大模型Claude Mythos Preview在30天内联合全球约50家网络及关键基础设施公司,发现了超过10,000个高危或严重软件漏洞。该模型不仅能精准发现漏洞,误报率低于人类专家,还能自动构建攻击链,甚至在一家合作银行成功拦截了一笔150万美元的电诈。 报告显示,Mythos对Cloudflare、Mozilla Firefox、OpenBSD等核心系统进行了扫描,发现了大量漏洞,包括在OpenBSD中隐藏27年的旧Bug。在对全球1000多个关键开源项目的扫描中,共发现23,019个漏洞,经第三方复核确认其中1,094个为高危或严重漏洞,准确率达90.6%。一个典型案例是在广泛使用的开源密码库wolfSSL中发现了一个可伪造数字证书的严重逻辑漏洞。 然而,漏洞发现速度远超人类修复能力,导致开源维护者不堪重负。为此,Anthropic推出了“防御者工具包”,包括能自动生成修复补丁的Claude Security、面向安全研究员的“网络验证计划”,以及一套开源的自动化漏洞挖掘流水线,旨在用AI修复AI发现的漏洞。 由于Mythos能力过于强大且可能被滥用,Anthropic暂未公开发布,强调需先建立更高级别的安全护栏。公司呼吁行业缩短补丁周期、推行强制升级并加强基础安全措施。尽管当前人类开发者面临修复压力,但长远来看,此类AI技术有望极大提升全球软件的安全基石。

marsbit05/25 00:09

Mythos首个报告出炉:全球数十亿设备裸奔,30天挖出10000致命漏洞

marsbit05/25 00:09

一周省下3亿Token,Anthropic工程师的Claude Code缓存指南

这篇文章分享了Anthropic工程师通过有效利用Claude Code的Prompt缓存机制,一周内节省超过3亿Token的经验。核心观点是,缓存的Token成本仅为普通输入的10%,因此提高缓存复用率能显著降低使用成本并延长会话额度。 缓存机制依赖“前缀匹配”,分为系统层、项目层和对话层三层。只要会话前缀与已缓存内容一致,Claude即可直接复用,无需重新处理。Claude Code订阅版的缓存有效时间(TTL)为1小时,而API默认为5分钟。 文章强调了几个关键的使用习惯以避免“打断”缓存: 1. 不要让会话空置超过1小时,否则缓存过期,重新开始成本更低。 2. 切换任务时,建议进行清晰的会话交接(如使用自定义的handoff技能总结进度后新建会话),而非使用可能破坏缓存的`/compact`命令。 3. 避免在会话中途切换模型(包括开启“Opus plan”模式),因为不同模型使用独立缓存,切换会导致缓存失效。 4. 大文档应放入Projects中管理,而非反复粘贴进对话,以获得更好的缓存优化。 此外,文章提到Anthropic内部会监控缓存命中率,因为这直接影响服务成本和用户体验。通过理解并遵循这些简单的原则,用户可以在不改变使用习惯的情况下,更高效地利用Claude Code,节省Token消耗。

marsbit05/24 00:36

一周省下3亿Token,Anthropic工程师的Claude Code缓存指南

marsbit05/24 00:36

智谱凭什么一天暴涨近30%?

智谱(02513.HK)股价单日暴涨近30%,核心触发因素是公司面向企业客户开放的GLM-5.1高速版API,其模型输出速度达到每秒400个token,刷新全球大模型API速度上限。 这一速度约为行业平均水平的3到5倍,意味着每秒可生成约200个汉字,显著提升了AI任务的执行效率。在AI进入Agent(智能体)时代、任务需要模型进行多轮自我调用的背景下,速度成为关键竞争力,直接影响任务完成时间和智能上限。 实现这一突破依赖智谱在推理引擎、并行策略和网络架构三个层面的技术创新: 1. **TileRT推理引擎**:将整个模型编译成持续运行的流水线,避免传统框架中频繁启动和等待的开销,并通过“Warp专门化”让GPU内不同计算组并行工作。 2. **异构并行策略**:针对GLM-5.1采用的MLA注意力机制,让多块GPU分工协作(如有的负责稀疏检索,有的负责密集计算),优化计算流程。 3. **ZCube网络架构**:取代行业标准的树形网络拓扑,采用扁平化互联设计,使得任意两台GPU间通信路径唯一且最短(仅需2跳),从根本上避免了网络拥塞,提升了集群整体吞吐并降低了延迟。 技术升级带来直接效益:在同等GPU投入下,集群吞吐量提升15%,相当于免费获得更多算力;任务尾延迟下降40.6%,提升了稳定性;网络建设成本因精简结构而节省约三分之一。 从行业影响看,智谱的技术路径证明,在相同算力下可以产出更多,这有助于重构GPU之外的基础设施生态。长期可能侵蚀英伟达在网络侧的溢价,利好能够提供高密度交换机的厂商以及国内光模块企业。同时,该纯软件方案理论上可移植到国产AI芯片,有望降低其软件生态门槛。

marsbit05/23 01:22

智谱凭什么一天暴涨近30%?

marsbit05/23 01:22

谷歌正式宣战

2026年Google I/O开发者大会,谷歌展现出强势进攻姿态,宣布全面将AI深度整合至其生态系统,并向竞争对手发起明确挑战。 大会核心亮点是**Gemini 3.5 Flash模型**。它虽为轻量版,但通过“极限知识蒸馏”技术和创新的细粒度MoE(混合专家)架构,在数学推理、代码生成等多项基准测试中表现超越前代Pro版,且首字响应时间低于65毫秒,达到近乎无感的交互速度。 谷歌同步发布了三款关键产品/能力: 1. **Gemini Omni Flash**:原生多模态视频模型,能实时理解视频中的物理规律,延迟仅120毫秒。演示中可在水杯将满时提前预警,标志着AI开始成为现实世界的实时辅助工具。 2. **智能助手Spark**:被深度集成至Android 17系统底层,可通过语音指令直接操控手机API,自动完成跨应用的复杂任务流程(如处理邮件、整理日程),有望简化甚至取代大量传统App操作。 3. **智能眼镜**:作为AI的物理入口,主打轻薄与实用,搭载端侧AI芯片,可实现离线实时翻译、场景识别,并与Spark联动,将AI服务嵌入用户第一视角。 谷歌同时宣布了极具竞争力的市场数据与定价策略:**Gemini月活用户已突破9亿**;并大幅下调服务价格,其中Gemini 3.5 Flash的API调用成本降至行业均价的十分之一左右。这得益于其自研TPU算力与高效模型架构带来的成本优势。 **战略意图与行业影响**:谷歌此举宣告了大模型竞争进入新阶段,单纯的模型性能竞赛已过时,未来是“端+云+生态+硬件”的全栈竞争。通过将AI“填鸭式”塞入搜索、浏览器、安卓系统、可穿戴设备等所有核心流量入口,谷歌正重塑流量分发逻辑——从用户主动搜索变为AI智能体主动分发服务。 此举将对纯模型提供商(如OpenAI、Anthropic)的商业模式构成直接价格压力,同时也对苹果等依赖屏幕交互的巨头形成挑战,预示着基于视觉/语音的无屏交互时代将加速到来。谷歌凭借其技术、庞大用户基数、垂直整合的算力设施与激进定价,正式打响了一场全方位的AI生态战争。

链捕手05/21 13:39

谷歌正式宣战

链捕手05/21 13:39

YC眼中的五种AI Agent核心形态

本文总结了AI Agent发展中的五种核心架构形态,这些形态正从一次性提示应用转向可复用、可积累的工作流系统。 1. **Skills(技能)**:将标准作业流程抽象为可参数化的“方法调用”。同一套流程通过更换参数可处理一类问题,而非单一具体任务。 2. **Thin Harness(轻量执行框架)**:作为模型的“手脚”,负责任务循环、文件管理等基础执行功能。其设计应保持轻量,避免因功能过度堆积导致“上下文腐化”。 3. **Resolvers(解析器/路由)**:通过明确的路由规则,将任务类型映射到对应Skill,解决因技能过多而导致的模型调用混乱问题,确保输出稳定。 4. **Latent vs. Deterministic(潜在与确定性)**:需明确分工。LLM擅长判断、综合等非确定性任务;而算术、优化等需稳定输出的工作,则应交给确定性代码处理。 5. **Memory(记忆)**:系统积累知识的基础。可采用Markdown文件夹等形式,记录“当前可信结论”和只增不减的时间线,使经验得以沉淀并可被自动关联与更新。 这些模块共同构成了一种“流程能力”,将经验转化为结构化、参数化的工作流。相比容易被复制的一次性应用,这种深度集成的系统更难被模仿,有望成为个人或组织在AI时代构建长期竞争优势的基础。其本质是将服务产品化,通过编码流程、分离关注点与持续积累记忆,实现更高效、更优质且更具壁垒的产出。

marsbit05/20 07:46

YC眼中的五种AI Agent核心形态

marsbit05/20 07:46

活动图片