智谱AI开源CogView3及升级版,文生图技术新突破!

智谱AI近日震撼宣布,向公众开放其最新研发的CogView3及进阶版CogView-3Plus-3B,这两款模型无疑为文本转图像技术领域带来了革命性的突破。

¥100元/年 10字以内 高效AI工具 创新必备 智能工具集 效率倍增
AI全能工具 助力发展 精选AI工具 事半功倍 AI工具集合 智领未来

智谱AI开源CogView3及升级版,文生图技术新突破!

CogView3作为首款运用中继扩散技术的模型,其创新的级联扩散策略先产生低清晰度图像,再借助中继超分辨率技术完善输出。这一方法不仅极大提高了图像生成的质量,还在训练和推理效率上实现了显著优化。

性能上,CogView3以77.0%的胜率超越了同类顶尖模型SDXL,且仅需后者一半的推理时间。其精简版在极短推理时间内仍能保持与SDXL相当的性能,展现了卓越的高效性。

此外,智谱AI推出的CogView-3Plus-3B,在CogView3的基础上融合了DiT框架及多项前沿技术,如Zero-SNR扩散噪声调度等,进一步提升了性能并降低了成本。该模型支持的广泛图像分辨率范围,使其适用于多种场景。

为方便用户,智谱AI还贴心提供了优化提示词和使用脚本,助力用户更便捷地享受这些强大模型带来的便利。

© 版权声明

相关文章