6月7日消息,今天阿里云在其技術(shù)博客上宣布,正式發(fā)布了全球性能強(qiáng)的開(kāi)源模型Qwen2-72B。
這一新模型在性能上超越了美國(guó)強(qiáng)的開(kāi)源模型Llama3-70B,同時(shí)也領(lǐng)先于包括文心4.0、豆包pro、混元pro在內(nèi)的眾多中國(guó)閉源大模型。
目前,所有人均可在魔搭社區(qū)和Hugging Face免費(fèi)下載通義千問(wèn)新開(kāi)源模型。
此前開(kāi)源的Qwen1.5-110B已領(lǐng)先于文心4.0等一眾中國(guó)閉源模型
Qwen2系列模型在代碼、數(shù)學(xué)、推理、指令遵循、多語(yǔ)言理解等能力上實(shí)現(xiàn)了大幅提升。
在MMLU、GPQA、HumanEval等國(guó)際權(quán)威測(cè)評(píng)中,Qwen2-72B一舉斬獲多項(xiàng)世界冠軍,展現(xiàn)了其卓越的性能。
Qwen2-72B在十多個(gè)權(quán)威測(cè)評(píng)中獲得冠軍,超過(guò)美國(guó)的Llama3-70B模型
此外,Qwen2系列包含5個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,均使用了GQA(分組查詢(xún)注意力)機(jī)制,為用戶(hù)帶來(lái)了推理加速和顯存占用降低的優(yōu)勢(shì)。
阿里云CTO周靖人表示,堅(jiān)持開(kāi)源開(kāi)放是阿里云的重要策略,旨在打造AI時(shí)代開(kāi)放的云,讓算力更普惠、讓AI更普及。
Qwen2的發(fā)布,不僅為全球開(kāi)發(fā)者提供了強(qiáng)大的工具,也為推動(dòng)AI技術(shù)的普及和發(fā)展做出了貢獻(xiàn)。
目前Qwen2系列模型的API已登陸阿里云百煉平臺(tái),并獲得了全球眾多開(kāi)源平臺(tái)和工具的第一時(shí)間支持。
此外,Qwen系列模型的總下載量在一個(gè)月內(nèi)翻了一倍,突破1600萬(wàn)次,顯示出其在全球開(kāi)源社區(qū)中的廣泛影響力。
本文鏈接:http://www.7280.com.cn/news-130060.html阿里云發(fā)布全球強(qiáng)Qwen2開(kāi)源模型!超越文心4.0等閉源大模型