如果你现在还把“写代码”这件事,和“要学一门编程语言、啃完几十小时课程、装一堆开发环境”绑在一起,那你大概率会被这个故事震一下。主角 Elena,本职是 AI 研究员:每天看论文、测模型、写报告,懂算法、懂模型原理,看 paper ...
这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果