LOADING

最强开源编程大模型一夜易主:精通80+语言,仅22B

2024/05/30 量子位
18

最强开源编程大模型一夜易主:精通80+语言,仅22B

AIGC动态欢迎阅读

原标题:最强开源编程大模型一夜易主:精通80+语言,仅22B
关键字:模型,代码,成绩,参数,开发者
文章来源:量子位
内容字数:0字

内容摘要:


克雷西 发自 凹非寺量子位 | 公众号 QbitAI开源代码大模型的王座,再次易主!
来自素有“欧洲OpenAI”之称的Mistral,用22B参数量表现超越了70B的Code Llama。
模型名为Codestral,将代码的英文Code与公司名结合而成。
在80多种编程语言上进行过训练后,Codestral用更少的参数实现了更高的性能,窗口长度也达到了32k,相比之前一众4k、8k的模型大幅增加。
而且已经有人表示,GPT-4o和Claude3-Opus都失败的代码编辑任务,被Codestral成功解决了。
于是有网友直言,Codestral的推出,直接改写了多语言代码模型的游戏规则。
另一方面,还有网友直接@了知名本地大模型框架Ollama,希望能够支持Codestral,结果Ollama这边也迅速响应,在请求发出后1个小时就增加了对Codestral的支持。
那么,Codestral在测试中都取得了哪些成绩呢?
开源编程模型的新王者Codestral的参数量为22B,支持32k的上下文窗口。
在开发过程中,研究人员使用了80多种编程语言的代码数据对Codestral进行了训练。


原文链接:最强开源编程大模型一夜易主:精通80+语言,仅22B

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破