稳定性AI的SD3遭遇广泛批评,运营动荡与用户不满
出乎意料的是,稳定性AI的最新产品SD3迅速成为广泛批评的对象。最初被赞誉为AI图像生成的下一个重大突破,SD3未能达到用户期望,导致许多人转而使用旧版本SDXL。用户的不满情绪显而易见,他们指出SD3存在处理人体解剖不当、提示遵循不稳定及整体可靠性不足等问题。各大论坛和社交媒体上的评论充斥着挫败感,有用户将SD3 2B模型称为“从一开始就注定失败的实验”。
批评者特别关注生成逼真人类图像的挑战。一位用户感叹道:“SD3太糟糕了 :( 至少需要尝试30次才能得到满意的结果...手部和姿势是首当其冲的受害者...是时候回归SDXL了...”另一位用户指出:“在SD3修复之前,暂时搁置是一个不错的选择。”这种集体不满在社区内引发了重大讨论,促使人们重新评估SD3的可行性。
关键要点
-
用户不满与回归SDXL:用户对SD3的表现普遍不满,尤其是其在人体解剖和提示遵循方面的困难。该模型无法产生满意结果,导致许多用户放弃SD3,转而使用SDXL。
-
历史对比:SD3当前面临的问题让人想起SD2时期因过度数据修剪导致的图像真实性差的问题。这一系列挑战引发了对稳定性AI模型开发和数据筛选方法的质疑。
-
公司不稳定:稳定性AI正处于动荡时期,领导层和运营结构发生重大变化。Emad Mostaque于2024年4月辞去CEO职务,随后裁员影响了10%的员工,这凸显了公司维持稳定和动力的困难。
-
未来展望:尽管遭遇这些挫折,稳定性AI仍在推进如Stable Audio 2.0、Stable Code Instruct 3B和Stable Video 3D等新项目。公司仍致力于推动生成AI技术的发展,但其短期未来因内部挑战和外部审查而蒙上阴影。
分析
SD3问题的核心似乎是对安全的过度重视,可能牺牲了图像质量和功能性。这种谨慎策略是对先前模型争议的直接回应,特别是不当内容生成的问题。Emad Mostaque数月前曾暗示SD3可能是稳定性AI的最后一个模型,引发了关于公司长期愿景和财务健康的担忧。
财务限制和声誉管理的需求可能是重要因素。开发和发布先进的AI模型需要大量投资,稳定性AI决定将SD3以非商业许可形式提供,可能限制了其商业可行性。这种策略似乎是在培育一个强大的社区和减少不当内容风险之间寻求平衡。
此外,领导层变动和持续寻找新CEO凸显了公司的当前不稳定状态。重组导致超过20名员工被裁,影响了业务运营,进一步耗尽了资源和士气。稳定性AI平台问题,包括其API服务中的高错误率,增加了情况的复杂性,促使技术团队进行彻底调查。
你知道吗?
在这场动荡中,AI社区并未停滞不前。替代项目获得了动力,提供了有前景的解决方案和创新:
-
PixArt Sigma:四月发布的PixArt Sigma支持4k图像生成,并具有增强的提示遵循能力,使其成为图像生成领域的强大竞争者。
-
Lumina Text-to-Image:五月推出的Lumina提供了一个多功能的图像生成流程,允许用户尝试不同的文本编码器、参数大小和VAEs,以生成高质量的2k图像。
-
Hunyuan:同样在五月发布,Hunyuan因其能够理解英语和中文而脱颖而出,扩大了其可访问性和功能性。
此外,社区内部有越来越多的人倾向于自行解决问题。通过众筹支持开源基础模型开发的想法正在获得支持。这种草根方法可以确保高质量、可访问的AI模型保持可用,不受公司议程和市场压力的影响。推动去中心化和社区驱动的创新反映了一种积极的态度,以保护开源AI开发的未来。