,Stability AI 以其 Stable Diffusion 文本生成圖像模型而聞名,但這并不是其感興趣的唯一領(lǐng)域,該公司現(xiàn)在也開(kāi)始涉足代碼生成領(lǐng)域。今天,Stability AI 發(fā)布了其新的開(kāi)放大型語(yǔ)言模型StableCode ,該模型旨在幫助用戶生成編程語(yǔ)言代碼,基于 transformer 神經(jīng)網(wǎng)絡(luò)打造。
StableCode 將提供三個(gè)不同級(jí)別:一個(gè)基礎(chǔ)模型用于一般用途,一個(gè)指令模型,以及一個(gè)能夠支持多達(dá) 16,000 個(gè)詞元的長(zhǎng)上下文窗口模型。
StableCode 模型受益于開(kāi)源 BigCode 項(xiàng)目的初始編程語(yǔ)言數(shù)據(jù)集,同時(shí)還經(jīng)過(guò)了 Stability AI 的額外過(guò)濾和微調(diào),StableCode 將首先支持 Python、Go、Java、JavaScript、C、markdown 和 C++ 等編程語(yǔ)言的開(kāi)發(fā)。
訓(xùn)練任何 LLM 都依賴于數(shù)據(jù),StableCode 的數(shù)據(jù)來(lái)自 BigCode 項(xiàng)目。IT之家注意到,HuggingFace 和 ServiceNow 在 5 月份也曾推出了基于 BigCode 的開(kāi)放 StarCoder LLM。Stability AI 的首席研究科學(xué)家 Nathan Cooper 稱,StableCode 的訓(xùn)練涉及了對(duì) BigCode 數(shù)據(jù)進(jìn)行大量的過(guò)濾和清理。
StableCode 的長(zhǎng)上下文窗口版本具有 16,000 個(gè)詞元的上下文窗口,Stability AI 聲稱比任何其他模型都要大,更長(zhǎng)的上下文窗口使得可以使用更專業(yè)和復(fù)雜的代碼生成提示,還意味著用戶可以讓 StableCode 查看一個(gè)包含多個(gè)文件的中等大小的代碼庫(kù),以幫助理解和生成新代碼。
StableCode 目前還處于早期階段,現(xiàn)在官方的目標(biāo)是看看開(kāi)發(fā)者會(huì)如何接受和使用該模型。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接,用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。