智谱AI开源CogView3及升级版,文生图技术新突破!
智谱AI近日震撼宣布,向公众开放其最新研发的CogView3及进阶版CogView-3Plus-3B,这两款模型无疑为文本转图像技术领域带来了革命性的突破。
CogView3作为首款运用中继扩散技术的模型,其创新的级联扩散策略先产生低清晰度图像,再借助中继超分辨率技术完善输出。这一方法不仅极大提高了图像生成的质量,还在训练和推理效率上实现了显著优化。
性能上,CogView3以77.0%的胜率超越了同类顶尖模型SDXL,且仅需后者一半的推理时间。其精简版在极短推理时间内仍能保持与SDXL相当的性能,展现了卓越的高效性。
此外,智谱AI推出的CogView-3Plus-3B,在CogView3的基础上融合了DiT框架及多项前沿技术,如Zero-SNR扩散噪声调度等,进一步提升了性能并降低了成本。该模型支持的广泛图像分辨率范围,使其适用于多种场景。
为方便用户,智谱AI还贴心提供了优化提示词和使用脚本,助力用户更便捷地享受这些强大模型带来的便利。
© 版权声明
本站所有图文及视频均来源于网络收集,文章均由Ai工具原创编辑,观点仅供参考!如无意中侵犯了某媒体或个人的知识产权,请来信或来电告之,本站将立即给予删除。文章版权归作者所有,未经允许请勿转载。