免费领取1000积分
Devin

Devin

全球首个全自主 AI 软件工程师

产品介绍

Devin 提供AI软件工程解决方案,用于即时编程支持。

Devin 直接输入编程任务即可优化开发流程,提升效率和便捷性。

Devin 是由AI初创公司 Cognition 开发的全球首个全自主 AI 软件工程师,具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码 Bug、训练和微调 AI 模型的能力。

在 SWE-bench 基准测试中,Devin 展现出超越其他 AI 模型的性能,正确解决了实际编程问题。

Devin 具备以下能力:

长期推理与规划:能够规划和执行需要数千个决策的复杂工程任务,记住每一步的相关上下文,随时间学习,并修复错误。

使用开发者工具:配备了包括 shell、代码编辑器和浏览器在内的常见开发者工具,在一个沙盒化计算环境中工作。

主动协作:能够实时报告进度,接受反馈,并根据需要与用户共同进行设计选择。

学习新技术:通过阅读博客文章等资料,学习如何使用不熟悉的技术。

端到端应用构建和部署:能够从头开始构建并部署应用程序,如模拟生命游戏的交互式网站,并将其部署到 Netlify。

自主查找和修复代码库中的 Bug:帮助维护和调试开源竞赛编程书籍。

训练和微调 AI 模型:设置大型语言模型的微调,只需提供一个 GitHub 研究仓库的链接。

处理开源仓库的问题:只需提供一个 GitHub 问题的链接,Devin 就能完成所有设置和上下文收集工作。

对成熟生产仓库做出贡献:作为 SWE-bench 基准测试的一部分,Devin 解决了 sympy Python 代数系统中的对数计算错误。

执行实际工作:在 Upwork 上完成实际的编程工作,编写和调试运行计算机视觉模型的代码,并在最后编译报告。

Devin 评测结果:

Devin 在 SWE-bench 基准测试中的表现非常出色,这是一个挑战性的基准测试,要求参与者解决开源项目(如 Django 和 scikit-learn)中的实际 GitHub 问题。

Devin 正确解决了 13.86% 的问题,这一比例远远超过了之前的技术水平,后者只能解决 1.96% 的问题。

Devin 即使在只给定要编辑的确切文件的情况下,以往的最佳模型也只能解决 4.80% 的问题。

Devin 在评估时是独立完成的,而其他模型则得到了辅助(即模型被告知需要编辑哪些文件),这一结果显示了 Devin 在理解和解决实际编程问题方面的巨大优势。

Devin 宣传代码:

Devin 宣传示例图

猜你喜欢


Keras
Keras
开源人工神经网络库
魔乐社区
魔乐社区
AI开发者社区
百宝箱Tbox
百宝箱Tbox
AI原生应用开发平台
BetterYeah AI
BetterYeah AI
企业级AI智能体开发平台
TensorFlow
TensorFlow
谷歌开发的开源软件
SiliconFlow
SiliconFlow
AI应用开发‌工具
MLX
MLX
为苹果硅片打造的工具
蓝耘元生代MaaS平台
蓝耘元生代MaaS平台
MaaS服务平台
DL4J
DL4J
Java机器学习框架
SkyAgents
SkyAgents
AI Agents开发平台
秒哒
秒哒
零代码AI开发平台
NumPy
NumPy
用于数值计算的工具库
Gumloop
Gumloop
AI零代码工作流平台
Caffe
Caffe
开源的深度学习框架
Wordware
Wordware
AI Agent工具
VSCode
VSCode
微软旗下跨平台源代码编辑器
文心智能体平台
文心智能体平台
智能体构建平台
Zion
Zion
全栈开发AI Agent应用工具
飞桨PaddlePaddle
飞桨PaddlePaddle
开源深度学习平台
Apache MXNet
Apache MXNet
开源的深度学习框架