iPhone本地跑Gemma 4火了,0 token时代还有多远?
谷歌开源新模型Gemma 4,其小参数版本(如2.3B和4.5B)可在手机端本地运行,支持多模态处理,上下文窗口达128K,被称作“可放入口袋的Gemini平替”。用户实测在iPhone和三星等设备上推理速度超过40 token/秒,体验流畅如“魔法”,适用于医疗等敏感场景。通过官方App“Google AI Edge Gallery”可便捷安装使用。
不过,Gemma 4在复杂任务(如代码代理、工具调用和结构化输出)上表现不佳,智力水平仍有局限。尽管当前开源模型与顶尖闭源模型尚有差距,端侧AI的发展趋势已非常明确:未来本地模型将逐步接管高频简单任务,迫使依赖API销售的厂商转向更复杂的Agent能力、超长上下文和实时数据处理。Gemma 4只是一个开端,端侧与云端体验无差别的那天,将重塑AI商业模式。
marsbit04/06 05:53