UCL研究| 深偽技術(shù)下,超1/4中英文語音能以假亂真
指南者留學(xué)
2024-09-11 17:14:26
閱讀量:1027
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;">這項(xiàng)研究于9月10日在</span><span style="font-size: 15px; color: #ab1942; visibility: visible;">《公共科學(xué)圖書館·綜合》(PLOS ONE)</span><span style="font-size: 15px; color: #4a4949; visibility: visible;">上發(fā)表,是有史以來</span><span style="font-size: 15px; color: #ab1942; visibility: visible;">第一項(xiàng)</span><span style="font-size: 15px; color: #4a4949; visibility: visible;">評估人類在除英語之外的其他語言中識(shí)別人工生成語音能力的研究。</span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;">深偽技術(shù)(Deepfakes)是用于生成模仿真實(shí)人聲或外貌的合成媒體技術(shù),屬于生成式人工智能(generative artificial intelligence)的范疇。在這種機(jī)器學(xué)習(xí)(machine learning, ML)過程中,算法能學(xué)習(xí)數(shù)據(jù)集(如真人視頻或音頻)的模式和特征,從而復(fù)刻原始圖像或聲音。 </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;">早期的深偽語音算法需要成千上萬個(gè)人聲樣本才能生成一段原創(chuàng)音頻,但最新的預(yù)訓(xùn)練算法只需一個(gè)人說<span style="font-size: 15px; color: #ab1942; visibility: visible;">三秒鐘</span>就能復(fù)刻其聲音。即使不具備專業(yè)知識(shí),一個(gè)普通人在<span style="font-size: 15px; color: #ab1942; visibility: visible;">短短幾天內(nèi)</span>就可以掌握這項(xiàng)技術(shù),并且這些開源算法還是免費(fèi)的。<span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; visibility: visible;">蘋果最近發(fā)布了一款軟件,使用者用</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942; visibility: visible;">5分鐘</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; visibility: visible;">的錄音就能在iPhone和iPad上創(chuàng)建自己的聲音副本。</span> </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://info.compassedu.hk/sucai/content/1728292329072/1728292329072.jpg" width="763" height="477" /></span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; font-size: 15px; color: #4a4949;">UCL研究人員使用的是一種</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; font-size: 15px; color: #ab1942;">語音合成(text-to-speech, TTS)算法</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; font-size: 15px; color: #4a4949;">?;谝粋€(gè)英語和一個(gè)普通話的公開可用數(shù)據(jù)庫,他們?yōu)閮煞N語言各生成了50個(gè)深度偽造語音樣本。 </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">接著,研究人員邀請</span><span style="font-size: 15px; color: #ab1942;">529人</span><span style="font-size: 15px; color: #4a4949;">參與試驗(yàn)將人工生成的音頻樣本和真實(shí)音頻樣本區(qū)分開來。<strong>結(jié)果顯示只有73%的時(shí)間里,人們能識(shí)別出人工生成的語音。</strong>參與試驗(yàn)人員接受了</span><span style="font-size: 15px; color: #ab1942;">識(shí)別深偽語音的培訓(xùn)</span><span style="font-size: 15px; color: #4a4949;">之后再次嘗試,這一比例也只略微提高。 </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #ab1942;">UCL計(jì)算機(jī)科學(xué)學(xué)院的Kimberly Mai</span><span style="font-size: 15px; color: #4a4949;">作為論文的</span><span style="font-size: 15px; color: #ab1942;">第一作者</span><span style="font-size: 15px; color: #4a4949;">,說道:“我們的研究證實(shí)了人類無法有效分辨深偽技術(shù)制作的語音。針對性訓(xùn)練的作用也微乎其微。不過需要指出來的是,我們的語音樣本是用比較老的算法做的。如果是用目前最尖端的或者未來的技術(shù),結(jié)果如何還不得而知。” </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">研究團(tuán)隊(duì)的下一個(gè)目標(biāo)是開發(fā)更準(zhǔn)確的</span><span style="font-size: 15px; color: #ab1942;">自動(dòng)語音檢測器</span><span style="font-size: 15px; color: #4a4949;">,提升對人工合成的音頻和圖像的檢測能力,以更好地應(yīng)對它們帶來的各類負(fù)面影響。 </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">盡管生成式人工智能音頻技術(shù)有很多好處,例如幫助那些表達(dá)能力受限或因疾病失去聲音的人,但人們越來越擔(dān)心這種技術(shù)可能會(huì)被犯罪分子利用,危害他人和社會(huì)。 </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">比如在2019 年,某家英國能源公司的首席執(zhí)行官被偽造成其上司聲音的深偽語音所騙,將數(shù)十萬英鎊轉(zhuǎn)賬給了一家冒名的供應(yīng)商。 </span></p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"> </p>
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;"><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">UCL計(jì)算機(jī)科學(xué)學(xué)院 Lewis Griffin教授</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">是該研究的</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">負(fù)責(zé)人(senior author)</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">。他說:“生成式人工智能技術(shù)越來越成熟,許多工具也應(yīng)運(yùn)而生,這種情況下機(jī)會(huì)和風(fēng)險(xiǎn)將并存。政府機(jī)構(gòu)制定戰(zhàn)略來</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">防止濫用這些工具</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">是明智之舉,但我們也應(yīng)該</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">看到這個(gè)領(lǐng)域的光明前景</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">。” </span> </span></p>