据 arxiv上的一篇论文显示,一款名为 SnapFusion 的图片生成模型现已进入测试阶段。该模型开发团队的大部分人员均来自snap和Northeastern University。
SnapFusion 可以在移动设备上使用,能在不到2秒的时间内生成一张512x512的高质量图片。与传统的文生图模型相比,SnapFusion 的生成速度快且质量高,同时避免了高端GPU和云推理这些成本高昂的方式,也规避了可能出现的隐私问题。
SnapFusion 采用高效的 UNet 框架来训练,通过识别原始模型中的冗余并使用数据蒸馏技术减少图像解码器的计算量。与经典的图片生成模型 Stable Diffusion v1.5 相比,SnapFusion 在性能和速度方面均表现出色。