伦敦的人工智能实验室Stability AI宣布提前预览其新的文本到图像模型Stable Diffusion 3。这个先进的生成式人工智能模型旨在通过改进多个关键领域的性能,从文本提示中创建高质量的图像。
就在几天前,Stability AI的最大竞争对手OpenAI推出了名为Sora的全新AI模型,能够从简单的文本提示中生成几乎逼真的高清视频。
Sora目前还没有向公众提供,但引发了人们对其可能创造逼真虚假镜头的担忧。OpenAI表示,他们正在与有关虚假信息和仇恨内容的专家合作,在广泛提供该工具之前进行测试。
据Stability AI称,与以前的版本相比,Stable Diffusion 3在处理多主题图像生成方面具有显着更好的能力。这使用户能够包含更详细的提示和多个元素,并获得更好的结果。
除了复杂提示的改进之外,新模型还提升了整体图像质量和拼写准确性。Stability AI声称这些升级解决了过去的文本到图像模型中存在的一些一致性和连贯性问题。
尽管尚未公开提供,但Stability AI已经为对Stable Diffusion 3感兴趣的人开放了等候名单。预览阶段将使Stability AI收集反馈并在今年晚些时候进行全面发布之前继续完善该模型。
Stability AI表示,他们还与专家合作测试Stable Diffusion 3,确保它减轻潜在的危害,类似于OpenAI对Sora的做法。
Stable Diffusion 3提供了一系列不同模型大小的选择,从低端的8亿参数到高端的80亿参数。Stability AI表示,这种选择的模型范围旨在平衡创造性能和用户的计算资源可访问性。
Stability AI解释说:“我们致力于确保生成式人工智能是开放、安全和普遍可访问的。”
“通过Stable Diffusion 3,我们努力提供适应性解决方案,使个人、开发者和企业能够释放创造力,与我们激活人类潜力的使命相一致。”
(图片来源:Stability AI)
另请参阅:Google承诺修复Gemini不准确和有偏见的图像生成