苹果用AI重新发明了图像压缩:同样画质,文件只要三分之一
2025年2月,JPEG AI作为首个端到端学习型图像编码国际标准发布,标志着AI开始重写图像压缩的规则。然而,传统压缩技术优化的是PSNR等数学指标,而非人眼感知,导致压缩后图像可能出现边缘模糊、文字变形等问题。
苹果团队近期提出的感知图像编解码器PICO,旨在直接针对人眼视觉体验进行优化。它通过三项关键技术解决核心难题:1. 采用“一次性上下文模型”,在保持编码精度的同时大幅提升速度;2. 引入TextFidelityLoss,专门保护图像中文字的清晰度,减少形变;3. 设计TilingArtifactLoss,有效消除图像分块处理产生的色块边界。
大规模人类主观评测显示,在达到相同视觉质量时,PICO生成的文件大小仅为AV1、VVC、JPEG AI等标准的30%-43%,对比其他学习型感知编解码器也能节省20%-40%的码率。在iPhone 17 Pro Max上,编码一张1200万像素照片仅需230毫秒,具备实用速度。
尽管PICO在处理卡通等高度规则化图像时效率不如传统编码器,但其成功将“感知压缩”从学术远景变为可在移动设备上运行的工程现实,代表了图像压缩从优化数学指标向优化人眼感知的重要转折。
marsbit05/30 02:47