最强开源编程大模型一夜易主：精通80+语言，仅22B

2024/05/30 量子位

AIGC动态欢迎阅读

原标题：最强开源编程大模型一夜易主：精通80+语言，仅22B
关键字：模型,代码,成绩,参数,开发者
文章来源：量子位
内容字数：0字

内容摘要：

克雷西发自凹非寺量子位 | 公众号 QbitAI开源代码大模型的王座，再次易主！
来自素有“欧洲OpenAI”之称的Mistral，用22B参数量表现超越了70B的Code Llama。
模型名为Codestral，将代码的英文Code与公司名结合而成。
在80多种编程语言上进行过训练后，Codestral用更少的参数实现了更高的性能，窗口长度也达到了32k，相比之前一众4k、8k的模型大幅增加。
而且已经有人表示，GPT-4o和Claude3-Opus都失败的代码编辑任务，被Codestral成功解决了。
于是有网友直言，Codestral的推出，直接改写了多语言代码模型的游戏规则。
另一方面，还有网友直接@了知名本地大模型框架Ollama，希望能够支持Codestral，结果Ollama这边也迅速响应，在请求发出后1个小时就增加了对Codestral的支持。
那么，Codestral在测试中都取得了哪些成绩呢？
开源编程模型的新王者Codestral的参数量为22B，支持32k的上下文窗口。
在开发过程中，研究人员使用了80多种编程语言的代码数据对Codestral进行了训练。

原文链接：最强开源编程大模型一夜易主：精通80+语言，仅22B

联系作者

文章来源：量子位
作者微信：QbitAI
作者简介：追踪人工智能新趋势，关注科技行业新突破

OpenI

最强开源编程大模型一夜易主：精通80+语言，仅22B

AIGC动态欢迎阅读

内容摘要：

联系作者