“Stability AI 发布了迄今为止最强大的图像生成模型”

Stability AI 宣布发布 Stable Diffusion 3.5，标志着开源 AI 图像生成模型的重大进步。

Stability AI 最新的模型包括多个变体，旨在满足从业余爱好者到企业级应用的不同用户需求。

此次发布是在 6 月的 Stable Diffusion 3 Medium 发布之后，Stability AI 承认该版本未能达到预期。

“此次发布未能完全满足我们的标准或社区的期望，”Stability AI 表示。

Stability AI 表示，与其匆忙推出快速修复，不如花时间开发更强大的解决方案。

Introducing Stable Diffusion 3.5, our most powerful models yet.

This open release includes multiple variants that are highly customizable for their size, run on consumer hardware, and are free for both commercial and non-commercial use under the permissive Stability AI Community… pic.twitter.com/KlyE8OjrxN

— Stability AI (@StabilityAI) October 22, 2024

旗舰模型 Stable Diffusion 3.5 Large 拥有 80 亿个参数，并以 1 兆像素的分辨率运行——使其成为 Stable Diffusion 系列中最强大的模型。与此同时，Large Turbo 变体提供了可比的质量，但仅需四个步骤即可生成图像，显著减少了处理时间。

定于 10 月 29 日发布的 Medium 版本将具有 25 亿个参数，并支持 0.25 到 2 兆像素分辨率的图像生成。该变体专门针对消费硬件进行了优化。

Benchmark comparing the performance of the new Stable Diffusion 3.5 image generation models from Stability AI.

这些模型在变换器块中采用了查询-键归一化，增强了训练的稳定性并简化了微调过程。然而，这种灵活性也带来了权衡，包括相同提示在不同种子下输出的更大变化。

Stability AI 为此次发布实施了显著宽松的社区许可。模型可供非商业用途免费使用，并可供年收入低于 100 万美元的企业使用。超过此阈值的企业必须获得单独的许可安排。

该公司强调其对负责任的 AI 开发的承诺，从早期阶段就实施了安全措施。包括 ControlNets 在内的其他功能计划在 Medium 模型发布后推出。

Stability AI 最新的图像生成模型目前可通过 Hugging Face 和 GitHub 获得，并通过包括 Stability AI API、Replicate、ComfyUI 和 DeepInfra 在内的平台获得额外访问。

(图片来源: Stability AI)

另见: Anthropic 发布新 Claude AI 模型和“计算机控制”

想了解更多行业领袖关于 AI 和大数据的见解吗？ 请查看 AI & 大数据博览会，该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办，包括智能自动化会议、BlockX、数字化转型周和网络安全与云博览会。

探索由 TechForge 提供的其他即将举行的企业技术活动和网络研讨会这里。

标签: ai, 人工智能, 图像生成, 模型, 开源, 开源, 稳定性 AI, 稳定扩散

相关文章

“美中科技战升级，新的人工智能芯片出口管制”

加速机器学习应用程序开发：与关键人工智能工具集成的生产就绪的Airflow

阿联酋推出新的人工智能模型，与大型科技巨头竞争。

“版权问题促使AI行业需要一个公平的替代方案”