連日來(lái)Google開(kāi)源揚(yáng)聲器Diarization AI技術(shù)聲稱準(zhǔn)確度達(dá)到92%向來(lái)一不斷的有小伙伴關(guān)注,不僅如此還衍生出了各大相關(guān)話題,那么跟著小編來(lái)看看Google開(kāi)源揚(yáng)聲器Diarization AI技術(shù)聲稱準(zhǔn)確度達(dá)到92%以及它的相關(guān)資訊吧!
Google在最近的博客文章中宣布,他們已經(jīng)開(kāi)放了他們的揚(yáng)聲器二值化技術(shù)的來(lái)源,該技術(shù)能夠以較高的準(zhǔn)確率區(qū)分人的聲音。Google可以通過(guò)將包括多個(gè)參與者的音頻流劃分為每個(gè)參與者同質(zhì)的片段來(lái)做到這一點(diǎn)。
將語(yǔ)音劃分為同類片段具有許多應(yīng)用。Google的研究科學(xué)家Chong Wang解釋道:
通過(guò)解決“誰(shuí)在何時(shí)說(shuō)話”的問(wèn)題,說(shuō)話者區(qū)分在許多重要場(chǎng)景中都得到了應(yīng)用,例如了解醫(yī)療對(duì)話,視頻字幕等等。
能夠準(zhǔn)確地劃分對(duì)話,可以提高在線和離線數(shù)字化系統(tǒng)的質(zhì)量。最新的《Annals家庭醫(yī)學(xué)雜志》報(bào)道說(shuō),這種好處在醫(yī)療保健行業(yè)具有許多實(shí)際好處。
醫(yī)生通常會(huì)在11小時(shí)的工作日中,在電子健康記錄(EHR)中花費(fèi)約6個(gè)小時(shí)來(lái)記錄文檔。因此,一項(xiàng)研究發(fā)現(xiàn),超過(guò)一半的接受調(diào)查的醫(yī)生報(bào)告至少有一種倦怠癥狀。
從歷史上看,使用監(jiān)督學(xué)習(xí)方法來(lái)訓(xùn)練語(yǔ)音聽(tīng)寫系統(tǒng)向來(lái)是一項(xiàng)挑戰(zhàn)。王解釋原因:
使用監(jiān)督學(xué)習(xí)方法來(lái)訓(xùn)練這些系統(tǒng)是具有挑戰(zhàn)性的-與標(biāo)準(zhǔn)監(jiān)督分類任務(wù)不同,一個(gè)強(qiáng)大的區(qū)分模型需要能夠?qū)⑿氯伺c未參與訓(xùn)練的不同語(yǔ)音段相關(guān)聯(lián)。重要的是,這限制了在線和離線數(shù)字化系統(tǒng)的質(zhì)量。
在流音頻輸入上使用在線揚(yáng)聲器二值化可以檢測(cè)到不同的揚(yáng)聲器,如下圖所示,其底軸顏色不同。