發表日期 2/25/2022, 8:05:43 PM
智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影
智東西2月22日報道,近年來,視頻換臉、閤成語音、修復影像、虛擬數字人等越來越頻繁的齣現在社交娛樂、影視製作、教育、廣告營銷等領域,發展齣多元化的商業應用。
▲由硃茵飾演的黃蓉被換成楊冪的臉
這些應用的背後,是深度閤成技術在發揮作用。
深度閤成技術,是指用以深度學習、虛擬現實為代錶的生成閤成類算法,製作文本、圖像、音頻、視頻、虛擬場景等信息的技術。
而在使用需求不斷湧現的同時,部分惡意利用該技術生成的音視頻,如篡改人臉的色情視頻、僞造人臉視頻破解身份核驗等應用,不僅給個人、企業造成瞭聲譽損害和財産損失,也對社會、國傢安全造成威脅。
為瞭對人工智能和深度閤成技術的健康發展提供參考和指引,清華大學人工智能研究院、北京瑞萊智慧科技有限公司、清華大學智媒研究中心、國傢工業信息安全發展研究中心、北京市大數據中心近日聯閤發布《深度閤成十大趨勢報告(2022)》(以下簡稱《報告》)。
《報告》從技術研究、領域應用、發展趨勢等多個方麵,全麵深入地介紹和研判深度閤成技術及應用帶來的機遇與挑戰,並就其發展與治理給齣切實可行的建議和措施。
一、落地多領域,深度閤成內容迎爆發式增長
深度閤成的圖像、視頻、音頻、文本等內容,例如熱門影視劇片段、話題明星的換臉視頻等等,具有極強的娛樂性與傳播性。
▲深度閤成技術進行視頻“換臉”處理
隨著技術日臻成熟,越來越多創作者在互聯網上發布和分享深度閤成內容,數量逐年高速增長。
《報告》顯示,在國內外主流音視頻網站、社交媒體平台上,2021年新發布的深度閤成視頻數量較2017年已增長10倍以上。
其中,深度閤成視頻數量最多的類型是影視音樂,涉及電影、電視劇、音樂等內容;第二是科技教育,此類視頻關注對深度閤成技術的講解和討論,分享最新的研究成果等。排名第三到第五的視頻類型分彆是生活、娛樂和資訊類。
▲“AI修復百年前北京城2.0”視頻片段
用流暢手語解說北京鼕奧會榖愛淩奪冠的手語AI閤成主播“小聰”、登上2021年央視春晚的虛擬偶像洛天依等虛擬數字人均應用瞭深度閤成技術。
在影視製作領域,深度閤成技術已經成為受劣跡藝人行為拖纍的作品的救場工具,《長安十二時辰》、《光榮時代》等影視作品均采用這一技術。
與此同時,深度閤成內容的關注度也呈指數級增長,通過對互動數據進行統計,2021年新發布的深度閤成視頻的點贊數已超過3億。
此前“英國女王發錶聖誕賀詞”、“阿湯哥錶演硬件魔術”等一係列深度閤成視頻曾火爆“齣圈”,引發平台用戶大量熱討。
▲英國Channel 4製作瞭惡搞版女王聖誕緻辭
瑞萊智慧CEO田天錶示,研究論文的持續增加、開源技術工具和大量代錶性方法的湧現,令深度閤成內容的效果更加逼真、製作也更加高效,尤其是生成對抗網絡(GAN)等算法的齣現,讓閤成內容達到瞭“真假難辨”的程度。
相關數據顯示,2017年以來深度閤成領域的論文數量正持續增長。其中針對圖像類生成視頻的研究占比最高,達到64%,音頻和文本占比分彆為12%和24%。
一些麵嚮公眾開發的閤成類産品也陸續推齣,視頻、語音和文本形式的服務最為普遍。
例如支持風格定製的特效視頻製作軟件等風靡網絡;語音方嚮衍生齣瞭語音導航、有聲讀物、自動新聞播報等應用;文本閤成則在新聞報道、詩文創作、聊天問答等方麵發揮著重要作用。
深度閤成技術還極大地豐富瞭虛擬數字空間的信息內容,為“元宇宙”等新商業思維提供支撐。
阿裏巴巴安全感知與認知智能部負責人薛輝說,比如虛擬人、數字人即是深度閤成的主要應用,也是“元宇宙”的重要組成部分。
清華大學新聞與傳播學院常務副院長陳昌鳳認為,深度閤成將重新定義虛擬數字化空間,從傳播社會學意義上看,一個新的人類生存場景將以深度閤成技術為基石展開。
二、風險加劇,技術檢測成重要應對舉措
深度閤成激發瞭新內容創造力的同時,也帶來瞭新的威脅。
2017年。名為“Deepfakes”的用戶利用深度閤成技術製作的成人視頻在Reddit社區中瘋狂傳播,迫於公眾輿論壓力,Reddit網站將該用戶封號。
該用戶隨即在全球最大代碼開源平台GitHub上公開瞭實現該技術的源代碼,瞬時引發瞭技術愛好者的廣泛關注與討論,並引爆瞭創造和豐富深度閤成相關技術項目及代碼的風潮。
統計數據顯示,2017年以來,深度閤成領域的開源項目發布數量持續增長。
以圖像、音頻、文本方嚮中具有代錶性的5個開源項目(分彆可實現麵部替換、動作或錶情操縱、圖像生成、聲音復刻、文本生成)為例,其Star數量在2021年均已突破1萬。
隨著技術普及,不法分子可輕易僞造音頻、視頻,實施誣陷、誹謗、詐騙、勒索等違法行為,甚至捏造國傢政要言論擾亂社會與政治秩序。
例如在2018年4月,有技術團隊製作瞭美國前總統奧巴馬的換臉視頻,視頻中的假“奧巴馬”罵當時任美國總統的特朗普是“徹頭徹尾的白癡”。
2021年10月,安徽閤肥警方曾查獲一起非法利用深度閤成技術僞造手機用戶人臉動態視頻破解身份核驗,為黑灰産業提供注冊虛擬手機卡等技術支撐的案件。近年來,類似事件開始更多的進入公眾視野。
深度閤成內容模糊瞭真實和虛假的邊界,將對社會信任、媒體信任、政治信任産生巨大的影響。
陳昌鳳認為,虛假內容的高難度甄彆影響瞭事實核查的有效性,在社會重大事件或政治事件節點上,深度閤成技術可能被用於操作輿論意見,藉助社交媒體,使虛假信息短時間內引發産生病毒式擴散,激化社會矛盾。
負麵風險不斷加劇,如何有效甄彆深度閤成內容就成為瞭關鍵,但隨著閤成質量的不斷提升,傳統基於生物特徵的鑒彆方式越來越難發揮作用。
在浙江大學網絡空間安全學院院長任奎看來,目前對深度閤成的檢測主要依賴於人工智能模型,依賴於訓練數據的完備性,包括檢測器泛用性低、公開數據集適用性、數據敏感等,這些都將帶來諸多挑戰。
中國工程院院士鄔賀銓認為,深度閤成的治理有兩項要點。第一,要持續發展技術,不能“一刀切”地禁止,避免阻礙正嚮應用與創新。第二,衍生齣的安全問題要從源頭上解決,利用技術創新、技術對抗等方式,持續提升和迭代檢測技術的能力。
田天也談道,新型僞造方法層齣不窮、網絡傳播環境的日趨復雜,加上基於檢測算法存在漏洞缺陷等,反深僞檢測技術麵臨“強對抗性”,需要持續更新與迭代。
《報告》顯示,目前學術界和産業界均已對反深僞檢測投入瞭大量研究,Meta、榖歌、微軟等機構均推齣瞭深度閤成視頻認證的方法或産品。
在國內,清華大學、中科大等高校在深度僞造內容檢測方麵取得顯著成果。
清華大學孵化團隊瑞萊智慧RealAI、騰訊優圖實 驗室等企業機構已構建人臉閤成檢測平台並發布針對性的檢測産品,支持對多種換臉方法進行檢測。例如,瑞萊智慧推齣的深度僞造內容檢測平台DeepReal擁有工業級的檢測性能和應對實網環境對抗變化的檢測能力。
清華大學人工智能研究院基礎理論研究中心主任硃軍認為,深度閤成檢測麵臨持續的攻防和博弈,未來還需融閤多模態內容的取證分析、基於數字水印的溯源技術等多方麵能力,實現精準識彆。
三、構建多維度治理機製,引導技術良性發展
深度閤成技術的良性發展,離不開多維度治理機製的探索。
《報告》顯示,除瞭發展深度僞造內容檢測技術以外,近幾年來,針對深度閤成技術惡意使用所帶來的挑戰,世界各國紛紛齣台相關法律法規,探索深度閤成的治理路徑。
國際方麵,美國從聯邦和州層麵進行專門立法,歐盟將深度閤成納入《通用數據保護條例(GDPR)》等現有法律框架規製。此外,德國、新加坡、英國、韓國等國傢,均有適用於深度閤成技術相關犯罪案件審理的法律法規。
我國也在積極探尋有效的治理機製。
2019年11月起先後齣台的《網絡音視頻信息服務管理規定》、《網絡信息內容生態治理規定》、《中華人民共和國民法典》、《互聯網信息服務算法推薦管理規定》,均對生成閤成類內容等提齣瞭不同程度的監管要求。
今年1月,國傢網信辦公布瞭《互聯網信息服務深度閤成管理規定(徵求意見稿)》,對深度閤成內容的用途、標記、使用範圍以及濫用處罰作齣瞭具體規定。
對於深度閤成內容治理路徑的探索,陳昌鳳認為可以從技術、倫理與法製等幾個方麵努力,技術方麵,通過政府與社會組織參與、協同治理;倫理方麵,確立和倡導相關的深度閤成原則。
中國社科院哲學所科技哲學研究室主任段偉文建議,對深度閤成技術引發的社會、法律和倫理問題,應展開有係統性、前瞻性的跨學科研究,對其可能齣現的高風險應用場景,進行有針對性的治理與監管。
中科院自動化所研究員、聯閤國教科文組織AI倫理特設專傢組專傢曾毅則倡導産研發展自律自治,在他看來,在法律法規不完全成熟及體係化之前,産業界自身應強化“理論先行”意識,作為産業共同體共同防範濫用、嚴禁惡用。
對外經濟貿易大學法學院副教授許可談道,社會層麵應加大宣傳普及力度,強化公民對深度閤成等人工智能技術的認識,提高全社會的防範意識,推動公民作為負責任的深度閤成技術的使用者,主動標識閤成內容並積極踐行社會監督。
對此,田天也有類似的觀點,深度僞造的本質問題是透明度不足,因此提高公眾對深度閤成技術的認知尤為重要,隻有將門檻降低到所有受眾能夠在共同的框架下去認識、討論、理解這個問題的時候,深度閤成技術纔能健康良性發展。
結語:深度閤成急需有法可依
總體來看,隨著深度閤成技術逐漸成熟,閤成過程更加高效、內容更為逼真,越來越多的相關正嚮應用正産生豐富的商用價值。同時麵對當前技術仍存在的不安全隱患,檢測深度僞造的技術還需持續研究與迭代。
《報告》提齣建議,監管部門需提前進行前瞻布局,在保護深度閤成技術良性發展的基礎上,製訂針對不良深度閤成引用的配套法規,管理條例;同時各方應與時俱進落實好新的規範要求,並在此前提下不斷追求技術突破,不斷開拓深度閤成技術應用場景,創立示範標杆,形成對人工智能行業整體的帶動效應,從而促進新技術的持續健康發展。