Stability AI 宣布发布 Stable Diffusion 3.5,标志着开源 AI 图像生成模型的重大进步。
Stability AI 最新的模型包括多个变体,旨在满足从业余爱好者到企业级应用的不同用户需求。
此次发布是在 6 月的 Stable Diffusion 3 Medium 发布之后,Stability AI 承认该版本未能达到预期。
“此次发布未能完全满足我们的标准或社区的期望,”Stability AI 表示。
Stability AI 表示,与其匆忙推出快速修复,不如花时间开发更强大的解决方案。
旗舰模型 Stable Diffusion 3.5 Large 拥有 80 亿个参数,并以 1 兆像素的分辨率运行——使其成为 Stable Diffusion 系列中最强大的模型。与此同时,Large Turbo 变体提供了可比的质量,但仅需四个步骤即可生成图像,显著减少了处理时间。
定于 10 月 29 日发布的 Medium 版本将具有 25 亿个参数,并支持 0.25 到 2 兆像素分辨率的图像生成。该变体专门针对消费硬件进行了优化。
这些模型在变换器块中采用了查询-键归一化,增强了训练的稳定性并简化了微调过程。然而,这种灵活性也带来了权衡,包括相同提示在不同种子下输出的更大变化。
Stability AI 为此次发布实施了显著宽松的社区许可。模型可供非商业用途免费使用,并可供年收入低于 100 万美元的企业使用。超过此阈值的企业必须获得单独的许可安排。
该公司强调其对负责任的 AI 开发的承诺,从早期阶段就实施了安全措施。包括 ControlNets 在内的其他功能计划在 Medium 模型发布后推出。
Stability AI 最新的图像生成模型目前可通过 Hugging Face 和 GitHub 获得,并通过包括 Stability AI API、Replicate、ComfyUI 和 DeepInfra 在内的平台获得额外访问。
(图片来源: Stability AI)
另见: Anthropic 发布新 Claude AI 模型和“计算机控制”
想了解更多行业领袖关于 AI 和大数据的见解吗? 请查看 AI & 大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、BlockX、数字化转型周和网络安全与云博览会。
探索由 TechForge 提供的其他即将举行的企业技术活动和网络研讨会这里。