,阿里云今日宣布開(kāi)源通義千問(wèn) 140 億參數(shù)模型 Qwen-14B 及其對(duì)話模型 Qwen-14B-Chat,免費(fèi)可商用。
IT之家注:阿里云此前已經(jīng)開(kāi)源了 70 億參數(shù)模型 Qwen-7B,一個(gè)多月下載量破 100 萬(wàn)。
通過(guò)阿里云給出的數(shù)據(jù)來(lái)看,Qwen-14B 在多個(gè)權(quán)威評(píng)測(cè)中超越同等規(guī)模模型,部分指標(biāo)甚至接近 Llama2-70B。
據(jù)介紹,Qwen-14B 是一款支持多種語(yǔ)言的高性能開(kāi)源模型,整體訓(xùn)練數(shù)據(jù)超過(guò) 3 萬(wàn)億 Token,具備更強(qiáng)的推理、認(rèn)知、規(guī)劃和記憶能力,最大支持 8k 的上下文窗口長(zhǎng)度。
相對(duì)的,Qwen-14B-Chat 則是在基座模型上經(jīng)過(guò)精細(xì) SFT 得到的對(duì)話模型,可帶來(lái)更準(zhǔn)確的內(nèi)容,也更符合人類(lèi)偏好,而且在內(nèi)容創(chuàng)作的想象力和豐富度方面也有擴(kuò)展。
今日起,用戶(hù)可從阿里魔搭社區(qū)直接下載模型,也可通過(guò)阿里云靈積平臺(tái)訪問(wèn)和調(diào)用 Qwen-14B 和 Qwen-14B-Chat。
阿里云 CTO 周靖人表示,阿里云將持續(xù)擁抱開(kāi)源開(kāi)放,推動(dòng)中國(guó)大模型生態(tài)建設(shè)。阿里云篤信開(kāi)源開(kāi)放的力量,率先開(kāi)源自研大模型,希望讓大模型技術(shù)更快觸達(dá)中小企業(yè)和個(gè)人開(kāi)發(fā)者。
模型零代碼創(chuàng)空間體驗(yàn)地址:
python3.8 及以上版本
pytorch1.12 及以上版本,推薦 2.0 及以上版本
建議使用 CUDA11.4 及以上
注:PAI-DSW 的環(huán)境配置下運(yùn)行。
Qwen-14B-Chat 模型鏈接:
Qwen-14B 模型鏈接:
Qwen-14B-Chat-Int4 模型鏈接:
社區(qū)支持直接下載模型的 repo:
from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。