哥倫比亞大學提出可阻止間諜麥克風監聽的神經語音偽裝AI算法

早在 2013 年，就有報道稱 FBI 有利用特殊的技術手段來監聽麥克風。幾周前，威斯康星大學麥迪遜分校又在一份調查報告中，揭示了靜音麥克風是如何在視頻會議期間被清楚收聽到的。雖然結果有點讓人感到驚訝，但其實耳機也可在特定情況下被當做麥克風來監聽。

資料圖（來自：University of Wisconsin-Madison）

出於對隱私安全的關注，我們已見到一些突破性的技術。比如得益於新開發的一種算法，哥倫比亞大學研究人員聲稱可部分解決這方面的問題。

據悉，新算法主要聚焦兩個方面。首先，它會將一個人的語音模糊和安靜到接近耳語可聽的水平，以避免被自動語音識別（ASR）AI 給破譯。

其次，新算法還可預測即將說出的單詞、並始終較 ASR 領先一步，所以新方法又被稱作“預測性攻擊”（Predicitive Attacks）。

研究配圖 – 1：“神經語音偽裝”可對 ASR 造成干擾

該校計算機科學助理教授 Carl Vondrick 簡要解釋了該技術的工作原理：

在阻止麥克風惡意監聽這件事上，我們的算法有 80% 的成效，同時也是測試平台上最快、最準確的算法。

即使我們對流氓麥克風一無所知 —— 比如它的位置、甚至背後運行的計算機軟件 —— 該方法依然能夠奏效。

本質上，我們可以通過無線的方式來偽裝一個人的聲音，將其隱藏在這些監聽系統之外、且不會對在室內會話的人們造成不便。