發表日期 3/10/2022, 1:36:56 PM
圖片來源@視覺中國
文 | 腦極體
電影《讓子彈飛》裏,有一段情節特彆有意思:
鵝城之主黃四郎拿著張麻子的上任證件,大惑不解――
黃:這照片是你嗎。
張:是我。
黃:這就不是你。
張:我也說這TM根本就不是我。我去照相館照相,取照片的時候,他們給我的就是這張,我說這不是我,他們說這就是你,我說他不是我!他們說這就是你。沒辦法,我就把他貼在這瞭。
於是,張麻子就這麼走馬上任瞭。
或許,你隻覺得這段劇情特彆搞笑,堪稱大型現實魔幻主義。但如果現實之中,尋找久彆的親人、追查肇事的罪犯等,都隻能依靠這種容易僞造、模糊不清的信息,會讓整個任務變得一籌莫展。
準確鑒定一個人的身份乃至外貌,已經成為一個必須解決的關鍵社會問題。而目前最為便捷與安全的解決方案無疑就是DNA技術。
人體內的DNA具有唯一性(同卵雙胞胎可能具有同樣的DNA)和永久性,因此,DNA鑒定也具有絕對的權威性和準確性,是目前世界範圍內應用最廣、也是最為成熟的犯罪偵查技術之一,也一直被認為是尋找失蹤人口的黃金標準。
而且,DNA信息很難被徹底抹去,一件穿過的衣服、一塊嚼過的口香糖,一根跌落的頭發,都可能采集到DNA樣本。試想一下,如果根據DNA能夠直接描繪齣的長相,是不是能夠快速拿到關鍵信息,從而加快團聚的腳步、斷案的進度呢?
舉個例子,前不久備受關注的徐州小花梅事件調查結果公布,通過DNA檢驗比對確認瞭楊某俠即小花梅的身份。同時,又有網友對比瞭小花梅與楊某俠的照片,很多人都認為不像同一個人。這種情況,如果能通過DNA預測並生成麵部畫像,或許就能直觀且準確地看到麵貌特徵,有效地說服質疑者。
事實上,基於DNA信息對人類外部可見特徵(EVCs)的預測,早已被應用到瞭刑偵身份確認等領域當中。那麼,它究竟是不是尋人緝凶中,那顆重開身份迷霧的 “銀彈”silver bullet呢?
DNA to Face,靠譜嗎?
在全球範圍內,DNA錶型都是一種極為重要的刑偵手段。當偵查毫無頭緒的時候,DNA錶型可以從個體DNA中提取某些基因來預測個體麵部特徵,幫助確定肇事者可能是什麼樣子,進一步縮小嫌疑人的範圍,加快調查過程。
對於渴望尋親的人來說,DNA錶型也可以幫助TA快速定位齣潛在親人的麵貌,排除完全不具備相關遺傳變異的候選人,幫助人們早日團聚。
(Parabon使用DNA來重建人臉,這名嫌疑人後來被確認是1987年的謀殺案件)
首先,通過分析遺傳變異點位SNP,確定身體和麵部特徵。這些點位差異,往往會影響人體相關的一係列信息,比如眼睛顔色,頭發顔色,年齡,性彆,身高,遺傳病等。因此,通過比對SNP可以得到一個人的容貌特徵數據樣本。
然後,基於人工智能算法和深度生成模型,提取與身體特徵相關的信息,創建麵部圖像。為瞭保證科學性,每個特徵往往會用準確率百分比的形式呈現。比如,對方可能有88.6%的概率,是一個白人男性,88.3%的概率有褐色的眼睛,有雀斑的概率則隻有22%。
此外,即使案件已經發生多年,DNA錶型也可以與AI麵部識彆技術相結閤,生成對方隨著時間流逝後的長相,或者還原兒童時的長相。如果一個孩子失蹤幾年瞭,那麼從孩子的梳子上取下的一縷頭發,可以用來創建一組年齡進展圖像。
DNA 研究公司Parabon的生物信息學總監Ellen McRae Greytak就曾分享過,該公司在過去七年中幫助解決瞭200多起案件。
2015年,哥倫比亞警方就通過現場收集的DNA,生成嫌疑人圖像,逮捕瞭一名男子,最終破獲瞭一個四年來毫無進展的凶殺案。
DNA錶型的3D圖像顯示,凶手應該是一個非洲阿爾及利亞的男性,有著橄欖色的皮膚,綠色的眼睛,豐滿的嘴唇,很少或沒有雀斑。
基於DNA來生成的圖像,可以與其他調查信息一起,生成尋人或通緝海報,無疑會讓進展事半功倍。
不是銀彈,卻是尖刀
但在普通人眼中,這個技術好像有點用,又好像沒啥用。
因為,目前DNA技術還無法準確預測多種麵貌特徵。臉部的形狀是由數以韆計的基因決定的,某一處單個特徵的標記都可能影響整個麵部錶現,讓臉型從男性化變得女性化,這種模糊性就給後續追查帶來挑戰。
另外,DNA錶型隻能反映基因遺傳特徵,不能顯示齣與後天成長環境的相互作用。比如染發、斷鼻、掉牙等情況,都可能改變嫌疑人外錶,卻無法反映在DNA中。所以僅憑DNA就不可能預測一個人精準的樣子。
還有,大傢都知道深度學習模型依賴於大規模的數據集訓練,而目前許多麵部識彆係統的數據集中,不同種族的麵部數據並不均衡,這就會導緻對不同群體的識彆準確度大不相同,算法準確率低的群體可能很容易被誤判和定罪,帶來新的不公平。
比如在2019年基於Hapmap數據集展開的一項DNA錶型研究中,GLOBAL隊列(全球樣本)的錶現就不如EURO隊列(歐洲樣本)好,原因之一,就是歐洲人在基因組方麵的數據規模更大,因此模型的識彆效果更好。
而且無論我們走到哪裏,都會留下自己的DNA痕跡,比如地鐵上留下的一縷頭發,或是咖啡館中玻璃杯上沾到的唾液……當DNA樣本的易得性,遇上市場化服務和大規模數據庫的應用,這項技術也就産生巨大的隱私風險。
2013 年,紐約藝術傢杜威-哈格堡(Heather Dewey Hagborg)啓動瞭一個藝術項目“陌生人視角景(Stranger Visions)”,從公共場所收集的遺傳物質製作肖像雕塑。比如,從一根掉落的煙頭裏,DNA顯示吸煙者是一個東歐血統的男性,眼睛是棕色的。
(2013年1月6日中午12點15分,杜威-哈格堡在紐約收集瞭一個煙頭)
她將這些參數輸入到算法模型中,創建齣人臉的3D模型,並用3D打印齣雕塑。
不難想象,如果這項技術開始規模化應用,而DNA樣本又無處不在,那麼很可能你的所有行程、做瞭什麼,都會被扒個底兒掉。
而這一天,已經到來瞭。目前,很多海外生物機構和科技企業會提供類似的服務,比如Greytak、Parabon、Corsight等,Human Longevity早在 2017 年就曾使用 DNA 重建麵部照片。哥倫比亞警方正是通過Parabon NanoLabs公司開發的程序Snapshot,創建齣瞭嫌疑人的形象。
還有一些簡單易用的麵部DNA測試應用,可以在網上免費下載,幫人們判斷血統、確定親子關係、尋找親人。應用程序Face IT DNA,就號稱可以通過60多個麵部點匹配,來幫助用戶確認關係,隻需要進行人臉識彆掃描,匹配準確率高達92%。
僅僅人臉識彆當然達不到這樣高的精度,而且很可能導緻你的敏感個人信息泄露。
一些公開的DNA數據庫也已經建立。GEDMatch就是一個可以免費使用的DNA測試數據庫,但用戶把自己的DNA檔案上傳到GEDMatch等網站比對之後,相關信息也被美國警方拿到,然後抓捕瞭一位嫌疑人用戶。這種運用不閤理手段獲取個人因素數據的行為,也引發瞭大量的反對,要求GEDMatch限製對平台數據的訪問。
麵對這些DNA錶型存在的現實問題,生物學傢和工程師Yves Moreau認為,它就像一把刀――人們低估瞭它能有多鋒利。
在嚮犯罪分子重磅齣擊的時候,也可能先割傷普通人。
瑕不掩瑜,必不可少
既然DNA錶型目前還有很多挑戰和不足之處,那還有研究的必要嗎?至少目前來說,作為一種新型的DNA技術,是各國不可迴避的領域。
從科學的角度來看,研究DNA錶型,能夠幫助全人類更瞭解自己是誰,搞清楚人類的起源和演變。
DNA雖然不能精準地反映個體的麵貌細節,卻是一個人生物血統和族裔血統最靠譜的證明。讀懂DNA中隱藏的信息,能夠瞭解人類曆史過程中的遷移動嚮、族群選擇以及其他隨機影響。
舉個例子,位於Y染色體上的標記,隻能從父親傳給兒子,因此能夠完全反映齣父係譜係中(男性)祖先的地理起源。
藉助DNA錶型測試係統,可以大緻確定個體血統,並根據地理祖先推斷齣某些外部可見的特徵。像是金發,藍眼睛和淺色皮膚的人,都至少有一部分歐洲血統。
從國傢的角度看,目前,很多國傢也都在建設自己的生物識彆數據庫,被視作數字治理的重要組成部分。比如印度的Aadhar係統,以及澳大利亞政府正在建立的麵部識彆係統“The Capability”,可以將監控錄像中的人臉和駕駛執照中的圖像信息相匹配。未來結閤DNA錶型預測肇事者的臉,快速從人臉數據庫中找到潛在嫌疑人,將不再是難事。
建立具有本國國民特徵的規模數據庫,成為更好地應用人臉識彆、深度學習等技術的土壤。正如一些科學傢所說的,識彆的基因數據越多,這種技術就會越準確。進而更好地幫助親人團聚、更早將犯罪分子繩之以法。
而對於個人來說,今天,人臉識彆技術已經應用在門禁、安檢、移動支付、進齣場館等諸多場閤。想象一下,在未來世界裏,一個人的外錶可以僅從DNA中準確地重建齣來,身份證、護照、社會保障卡等證件或許就都不再需要瞭。這會大大提升人臉識彆場景的準確度和唯一性。
此外,DNA錶型的相關算法模型,還可以擴展到醫學圖像(如腦部掃描)與基因的聯係,為醫療診斷、遺傳分析等提供輔助,幫助研究阿爾茨海默氏癥等神經退行性疾病。
無論我們走到哪裏,都會留下一些DNA。讓這些信息被看見,或許那些不明身份的人,都能夠擁有自己的姓名。而作惡的人,也暴露在陽光下。
這就是技術的世界,讓一切真實無所遁形。