Cosine发布Genie：面向软件开发者的革命性AI模型

余弦公司推出创新AI模型“精灵”以革新软件开发

位于旧金山的AI初创公司余弦，推出了名为“精灵”的高级AI模型，旨在协助软件开发者。该模型与OpenAI合作开发，在SWE-Bench测试中取得了突破性的30%得分，超越了亚马逊和Cognition的Devin等竞争对手。

“精灵”的独特之处在于其能够“代码化人类推理”，通过模仿人类开发者的认知过程，自主修复错误、开发新功能并执行多种编程任务。该模型的训练涉及使用跨多种编程语言的数十亿令牌的专有过程。

最初遇到挑战的“精灵”通过引入合成数据克服了自身错误，使模型能够随时间自我改进。

余弦的CEO Alistair Pullen强调了实现“精灵”开发的技术进步，并强调了其在软件开发之外的应用潜力。公司计划扩展其AI产品并增加对开源社区的参与。

“精灵”将提供两个版本：一个20美元的有限功能选项和一个具有高级功能的企业级版本。感兴趣的用户目前可以加入等待名单。公司已获得250万美元的种子资金以支持这些举措。

Pullen设想“精灵”的应用范围将超越软件开发，通过代码化人类推理，有望显著提升各行业的生产力。

专家们特别关注“精灵”的“代码化人类推理”能力。这一创新使“精灵”能够自主执行复杂的软件任务，包括修复错误和开发新功能。余弦通过使用跨多种编程语言的数十亿令牌训练“精灵”，并利用合成数据进行自我改进，从而实现了其高级功能。这标志着向创建更像人类开发者而非简单助手的AI模型迈出了重要一步。

余弦预计“精灵”的影响将超越软件开发，具有跨多个行业的应用潜力。这反映了AI模型正越来越多地被定制用于特定任务，同时保持跨领域的多功能性。公司扩展到开源社区并专注于构建模型组合，表明AI在软件工程和其他领域的角色将继续快速增长。

然而，一些专家警告说，尽管“精灵”的成就令人印象深刻，但AI模型在软件开发中的广泛采用仍面临挑战，特别是在将这些系统集成到多样化和复杂的现实世界环境中。

余弦的“精灵”发布，借助OpenAI的GPT-4o，通过超越亚马逊和Cognition，颠覆了软件开发。这一进步迫使竞争对手创新或失去市场份额，并可能影响科技股。此外，AI在各行业的更广泛集成可能重新定义行业标准，提高生产力，但也引发伦理和依赖性问题。