当前位置：龙泉人才网 - 科技 -

阿里大模型春节大礼包：代码可执行率超GPT4，1.5版本全系列开源

科技
2024-02-07 14:53
量子位

白交发自凹非寺

量子位 | 公众号 QbitAI

阿里大模型，再次开源大放送——

发布Qwen1.5版本，直接放出六种尺寸。

最大的Qwen1.5-72B-Chat模型，在MT-Bench和Alpaca-Eval v2上，超越Claude-2.1、GPT-3.5-Turbo-0613。

甚至在部分任务中，得分已经超过前几个版本的GPT-4。

各地的开发者前来祝贺，其中0.5B的迷你版让不少人都迫不及待想试试。

并且还顺便问问，那个多模态大模型Qwen-VL-Max有可能开源吗？

除此之外，还集成到了Hugging face transformers，以及同主流的十余个框架合作，从微调、部署、量化到本地推理一步到位。

Qwen1.5开源

此次开源发布，主要有四个方面值得关注。

首先，模型系列很多，直接开源了6种尺寸（0.5B、1.8B、4B、7B、14B、72B）的基础模型（base）、聊天模型（chat）以及量化模型（包括Int4 和 Int8 GPTQ 模型，以及 AWQ 和 GGUF 量化模型）。

其次，更多的生态融入。

目前，Qwen1.5的代码合并到Hugging Face transformers，使其transformers>=4.37.0而无需trust_remote_code。

此外，还同主流的第三方框架，比如vLLM、用于部署的SGLang 、用于量化的AutoAWQ、AutoGPTQ 、用于微调的Axolotl、LLaMA-Factory以及用于本地 LLM 推理的llama.cpp等进行了合作。

Qwen1.5系列可在Ollama、LMStudio等平台上使用。此外，API 服务不仅在 DashScope 上提供，而且在Together.ai上也提供，具有全球可访问性。

再者，性能更强。

比如在基本能力的评估上，包括MMLU（5-shot）、C-Eval、Humaneval、GS8K、BBH等基准测试中可以看到，Qwen1.5-72B一些分数上已经超过了GPT-4。

在长上下文支持上，全系列模型的能力都有一定的拓展。尤其Chat模型，像Qwen1.5-7B-Chat这样的小模型，在5个任务中有4个表现与GPT-3.5相当。

而Qwen1.5-72B-Chat的性能，则明显优于 GPT3.5-turbo-16k，略微落后于 GPT4-32k。

在代码执行上，72B聊天模型在数学以及可视化方面离GPT-4还有一定的差距，但代码可执行率超过GPT-4。不过他们表示，会在在未来的版本中得到增强。

除此之外，此次功能也得到了升级和统一。

全系列均统一支持至少32k的最大长度；
多语言能力全面提升并提供了更丰富的多语言评测；
全系列统一支持system prompt;
统一具备强链接外部系统能力（agent/RAG/Tool-use/Code-interpreter）

One More Thing

这两天，与阿里大模型的进展还不少。

比如前几天，其多模态大模型Qwen-VL-Max登顶OpenCompass榜首。

以及在通义千问APP上，上线了不少春节免费新应用，比如全家福、拜新年、万物成龙等图像生成的功能。

此外，还有网友反馈说，通义千问2.0版本升级之后，能力提升得很明显。

你有感受到吗？

项目链接：

https://huggingface.co/collections/Qwen/qwen15-65c0a2f577b1ecb76d786524

https://qwenlm.github.io/zh/blog/qwen1.5/

参考链接：

[1]https://twitter.com/JustinLin610/status/1754538215959335100

[2]https://twitter.com/huybery/status/1754537742892232972

[3]https://twitter.com/_akhaliq/status/1754545091434139732

免责声明：本文内容来源于网络或用户投稿，龙泉人才网仅提供信息存储空间服务，不承担相关法律责任。若收录文章侵犯到您的权益/违法违规的内容，可请联系我们删除。

https://www.lqrc.cn/a/keji/101038.html

微信分享

关注微信

上一篇：京东集团2024年新春贺信：5亿元补贴春节送货小哥，2万一线客服涨薪30%

下一篇：暂无

阿里大模型春节大礼包：代码可执行率超GPT4，1.5版本全系列开源

Qwen1.5开源

One More Thing

猜你喜欢

热门标签

随便看看

金六福酒业有限公司（低调许久）

百业信息在线看报招聘（董明珠南下打工到底经历了什么）

福清房产中介（福州租房请注意）

全国40余家网络媒体记者点赞能“文”能“武”的许昌学院

石家庄纺织厂招聘（石家庄人一段不可磨灭的记忆）

阅读排行

徐州西苑招聘（重磅公示）

鉴黄师招聘（离职女鉴黄师自述）

韶关烟厂招聘（速看）

一建人证合一招聘（建筑工程招聘与求职5）

西安司机最新招聘信息（西安公交招聘1500名驾驶员）

关注我们

阿里大模型春节大礼包：代码可执行率超GPT4，1.5版本全系列开源

Qwen1.5开源

One More Thing

猜你喜欢

热门标签

随便看看

阅读排行

关注我们

微信公众号