通义千问720亿参数模型开源

通义千问720亿参数模型开源了。阿里云近日举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。其中,基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展人工智能驱动的科研工作。
通义千问720亿参数模型开源了。阿里云近日举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。其中,基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展人工智能驱动的科研工作。
通义千问720亿参数模型开源了。阿里云近日举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。其中,基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展人工智能驱动的科研工作。

今年8月以来,阿里云开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。这几款参数模型先后冲上HuggingFace、Github大模型榜单,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。

会上介绍,Qwen-72B可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。Qwen-72B基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。

具体而言,英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。

阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。

版权声明

本文收集整理自网络,如有侵权,请联系删除。

分享:

扫一扫在手机阅读、分享本文

网友评论

标签列表