作為人工智能領(lǐng)域的新實踐,近年來,利用深度學(xué)習(xí)、虛擬現(xiàn)實等生成合成類算法制作圖像、音頻、視頻、虛擬場景等信息的深度合成技術(shù),已在多個領(lǐng)域大量應(yīng)用。伴隨著不斷涌現(xiàn)的場景需求,深度合成內(nèi)容數(shù)量和關(guān)注度激增,但另一方面,惡意使用該技術(shù)生成的音視頻,也存在巨大的安全隱患。
合成視頻數(shù)量增長超10倍
隨著“深度合成”技術(shù)逐漸成熟并進入商業(yè)化應(yīng)用階段,其巨大的經(jīng)濟價值已經(jīng)逐漸展現(xiàn)。根據(jù)一項由清華大學(xué)人工智能研究院、北京瑞萊智慧科技、國家工業(yè)信息安全發(fā)展研究中心等單位周一聯(lián)合發(fā)布的《深度合成十大趨勢報告(2022)》(以下簡稱“《報告》”),在國內(nèi)外主流音視頻網(wǎng)站、社交媒體平臺上,2021年新發(fā)布的深度合成視頻的數(shù)量較2017年增長超過10倍,點贊數(shù)已超過3億。
《報告》稱,深度合成在影視制作、廣告營銷、社交娛樂等領(lǐng)域發(fā)展出多元化的商業(yè)應(yīng)用,例如AI合成主播、虛擬偶像、修復(fù)歷史老照片、影視劇本地化配音、“數(shù)字復(fù)活”等;而“元宇宙”等新商業(yè)思維的提出,為深度合成提供了更廣闊的應(yīng)用場景。
“比如虛擬人、數(shù)字人即是深度合成的主要應(yīng)用,也是元宇宙的重要組成部分。”阿里巴巴安全感知與認(rèn)知智能部負(fù)責(zé)人薛輝表示。清華大學(xué)新聞與傳播學(xué)院常務(wù)副院長陳昌鳳也表示:“深度合成將重新定義虛擬數(shù)字化空間,從傳播社會學(xué)意義上看,一個新的人類生存場景將以深度合成技術(shù)為基石展開。”
在以元宇宙為代表的沉浸式共享虛擬世界中,借助在AR、VR和3D技術(shù),虛擬和現(xiàn)實之間的界限正在逐漸模糊,真假難辨。
瑞萊智慧CEO田天告訴第一財經(jīng)記者,技術(shù)不斷成熟是深度合成內(nèi)容迎來爆發(fā)式增長的重要原因?!把芯空撐牡某掷m(xù)增加、開源技術(shù)工具和大量代表性方法的涌現(xiàn),令深度合成內(nèi)容的效果更加逼真、制作也更加高效,尤其是生成對抗網(wǎng)絡(luò)等算法的出現(xiàn),讓合成內(nèi)容達到了真假難辨的程度?!彼硎?。
圖形計算領(lǐng)域的頂尖技術(shù)公司英偉達去年就憑借高超的深度合成技術(shù),合成了一個黃仁勛的數(shù)字孿生版本,差點騙過了全世界的眼睛。“數(shù)字黃仁勛”身穿的皮夾克,他所在的廚房,都是計算機科學(xué)家們通過3D仿真技術(shù)模擬出來的,展現(xiàn)了數(shù)字技術(shù)強大的創(chuàng)造力和可能性。
“好玩”背后藏風(fēng)險
不過在深度合成激發(fā)創(chuàng)新內(nèi)容的同時,也帶來了新的威脅。《報告》指出:“隨著技術(shù)逐步平民化,不法分子可輕易偽造音頻、視頻,實施誣陷、誹謗、詐騙、勒索等違法行為,擾亂社會秩序。”
2021年10月,安徽合肥警方曾查獲一起非法利用深度合成技術(shù)偽造手機用戶人臉動態(tài)視頻破解身份核驗,為黑灰產(chǎn)業(yè)提供注冊虛擬手機卡等技術(shù)支撐的案件。近年來,類似事件開始更多的進入公眾視野。
浙江大學(xué)網(wǎng)絡(luò)空間安全學(xué)院院長任奎表示:“目前對深度合成的檢測主要依賴于人工智能模型以及訓(xùn)練數(shù)據(jù)的完備性,包括檢測器泛用性相對較低、公開數(shù)據(jù)集適用性、數(shù)據(jù)敏感等挑戰(zhàn)仍然存在?!?/p>
自從2017年Deepfake(深度偽造)出現(xiàn)后,AI技術(shù)在造假方面的能力引起世人警覺。算法的突飛猛進不僅僅可以做到AI換臉,甚至能自動生成文本、人工語音、圖像等各種數(shù)字內(nèi)容。此前,國家互聯(lián)網(wǎng)信息辦公室、公安部指導(dǎo)各地網(wǎng)信部門、公安機關(guān)加強對語音社交軟件和涉“深度偽造”技術(shù)的互聯(lián)網(wǎng)新技術(shù)新應(yīng)用安全評估工作,并依法約談相關(guān)企業(yè)。
目前學(xué)術(shù)界和產(chǎn)業(yè)界已對反“深度偽造”檢測投入了大量研究,Meta、谷歌、微軟等科技巨頭均推出了深度合成視頻認(rèn)證的方法或產(chǎn)品。在國內(nèi),清華大學(xué)、中科大、瑞萊智慧科技、百度、科大訊飛等高校和企業(yè)在深度偽造內(nèi)容檢測方面取得顯著成果。
清華大學(xué)人工智能研究院基礎(chǔ)理論研究中心主任朱軍認(rèn)為,深度合成檢測面臨持續(xù)的攻防和博弈,未來還需融合多模態(tài)內(nèi)容的取證分析、基于數(shù)字水印的溯源技術(shù)等多方面能力,實現(xiàn)精準(zhǔn)識別。
田天也對第一財經(jīng)記者表示:“新型偽造方法層出不窮、網(wǎng)絡(luò)傳播環(huán)境的日趨復(fù)雜,加上基于檢測算法存在漏洞缺陷等,反深偽檢測技術(shù)面臨強對抗性,需要持續(xù)更新與迭代?!?/p>
探索深度合成治理路徑
除了發(fā)展深度偽造內(nèi)容檢測技術(shù)以外,近幾年來,針對深度合成技術(shù)惡意使用所帶來的挑戰(zhàn),世界各國紛紛出臺相關(guān)法律法規(guī),探索深度合成的治理路徑。國際方面,美國從聯(lián)邦和州層面進行專門立法,歐盟將深度合成納入《通用數(shù)據(jù)保護條例(GDPR)》等現(xiàn)有法律框架規(guī)制。
2022年1月28日,國家網(wǎng)信辦最新公布了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(征求意見稿)》(簡稱《深度合成征求意見稿》),對作為元宇宙基石的深度合成技術(shù)做出了一系列較為明確的規(guī)定和指引。
按照定義,AI語音,NFT生成藝術(shù)、虛擬演唱會、全息人像投影、虛擬人數(shù)字人、AR購物等元宇宙的重要組成部分都屬于深度合成技術(shù)的具體應(yīng)用,均在《深度合成征求意見稿》的規(guī)制范圍內(nèi),這項規(guī)則將對深度合成乃至人工智能行業(yè)的監(jiān)管產(chǎn)生深遠(yuǎn)影響,尤其是針對“深度偽造”技術(shù)的防范。
中國工程院院士鄔賀銓認(rèn)為,深度合成的治理主要有兩個原則,一是要持續(xù)發(fā)展技術(shù),不能“一刀切”地禁止,避免阻礙正向應(yīng)用與創(chuàng)新;二是針對衍生出的安全問題要從源頭上解決,利用技術(shù)創(chuàng)新、技術(shù)對抗等方式,持續(xù)提升和迭代檢測技術(shù)的能力。
中國信通院云大所人工智能部副主任石霖認(rèn)為,有必要對“深度偽造”和深度合成進行明確區(qū)分,不能用“深度偽造”這一“污名化”詞匯來概括“深度合成”技術(shù)?!吧疃群铣杉夹g(shù)本身沒有善惡之分,當(dāng)濫用該技術(shù),跨越道德和法律的邊界時,才會出現(xiàn)深度偽造行為?!笔乇硎尽?/p>
小米集團副總裁、小米安全與隱私委員會主席崔寶秋對第一財經(jīng)記者表示:“技術(shù)監(jiān)管是一場永恒的攻防對抗博弈。深度合成技術(shù)的服務(wù)方在提供服務(wù)的同時,會產(chǎn)生多方面的風(fēng)險,除了深度偽造的風(fēng)險外,還包括自動生成內(nèi)容文本、圖像或者視頻帶來的版權(quán)和著作權(quán)的侵權(quán)風(fēng)險,信息安全和隱私泄漏風(fēng)險以及敏感內(nèi)容的風(fēng)險?!?/p>
崔寶秋建議,未來出臺的相關(guān)法規(guī)中,應(yīng)該強制要求服務(wù)提供方對于哪些內(nèi)容是深度合成的進行標(biāo)注,對于技術(shù)提供方而言,則應(yīng)從底層技術(shù)開始推進相關(guān)標(biāo)準(zhǔn)的建立,在算法上保證計算模型的公平性。