,微軟近日與“免費(fèi)數(shù)字圖書(shū)館計(jì)劃”Project Gutenberg 合作,利用 AI 為電子書(shū)庫(kù)制作了超過(guò) 5000 本免費(fèi)有聲書(shū)。
據(jù)悉,在這一項(xiàng)目中,研究人員結(jié)合了機(jī)器學(xué)習(xí)、自動(dòng)文本選擇和自然語(yǔ)音合成等多項(xiàng) AI 技術(shù),實(shí)現(xiàn)了電子書(shū)自動(dòng)轉(zhuǎn)化為語(yǔ)音的全流程。
IT之家經(jīng)過(guò)查詢得知,項(xiàng)目團(tuán)隊(duì)首先開(kāi)發(fā)出一種算法,可以自動(dòng)分析電子書(shū)的結(jié)構(gòu),區(qū)分正文和非關(guān)鍵部分的頁(yè)碼、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本轉(zhuǎn)語(yǔ)音技術(shù),生成類似真人的自然朗讀語(yǔ)音。此外,該團(tuán)隊(duì)還使系統(tǒng)能夠辨別書(shū)中敘述者、對(duì)話和不同角色,并相應(yīng)調(diào)整語(yǔ)音,實(shí)現(xiàn)故事情節(jié)的語(yǔ)音表達(dá)。
微軟表示,此次計(jì)劃已收集整理了超過(guò) 35000 小時(shí)的有聲書(shū)語(yǔ)音數(shù)據(jù),涵蓋了各類經(jīng)典文學(xué)、戲劇、傳記等作品,這些語(yǔ)音數(shù)據(jù)都將以開(kāi)源方式免費(fèi)提供。用戶也可以用自己錄制的少量語(yǔ)音,生成“用自己的聲音朗讀整本書(shū)”的效果,這一項(xiàng)目相對(duì)豐富了網(wǎng)站有聲書(shū)的內(nèi)容,同時(shí)也為視障人士提供了便利。
參考
Thousands of free and open audiobooks powered by Microsoft AI
論文 Large Scale Intelligent Microservices
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接,用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。