專訪健康碼背后的技術(shù)領(lǐng)軍人馬利莊：人臉識(shí)別還可識(shí)臉看病

澎湃新聞?dòng)浾?劉航

2021-07-13 08:07

來源：澎湃新聞

手機(jī)屏幕上小小的一方“健康碼”對(duì)疫情防控起到了巨大的作用。

截至2020年12月18日，健康碼累計(jì)亮碼超200億人次，覆蓋10億人口，累計(jì)訪問量破500億。近日，澎湃新聞?dòng)浾咴谑澜缛斯ぶ悄艽髸?huì)上專訪了健康碼背后人臉識(shí)別的技術(shù)團(tuán)隊(duì)領(lǐng)頭人馬利莊教授。

馬利莊教授

馬利莊是上海交通大學(xué)特聘教授，人工智能研究院副院長(zhǎng)，華東師范大學(xué)特聘教授（兼）；中國(guó)圖像圖形學(xué)會(huì)理事，動(dòng)畫與數(shù)字娛樂專委會(huì)主任，中國(guó)人工智能學(xué)會(huì)理事、智能創(chuàng)意與數(shù)字藝術(shù)專委會(huì)副主任。

馬利莊團(tuán)隊(duì)聚焦計(jì)算機(jī)圖形學(xué)與計(jì)算機(jī)視覺技術(shù)，團(tuán)隊(duì)的《面向復(fù)雜場(chǎng)景的人物視覺理解技術(shù)及應(yīng)用》相關(guān)研究及應(yīng)用成果于今年5月獲得2020年上海市科學(xué)技術(shù)進(jìn)步獎(jiǎng)特等獎(jiǎng)。

項(xiàng)目組在健康碼、復(fù)工復(fù)產(chǎn)、AI尋人、互聯(lián)網(wǎng)金融等多方面構(gòu)建重大應(yīng)用，產(chǎn)生了超百億的經(jīng)濟(jì)效益，推動(dòng)了人工智能相關(guān)行業(yè)的進(jìn)步；并獲得授權(quán)發(fā)明專利165項(xiàng)、軟件著作權(quán)15項(xiàng)，IEEE國(guó)際標(biāo)準(zhǔn)1項(xiàng)、國(guó)家標(biāo)準(zhǔn)8項(xiàng)，發(fā)表高水平論文290篇（CCF-A收錄70篇），取得了卓越的創(chuàng)新成果。

“人臉識(shí)別技術(shù)涉及一種生物特征，也要更多的規(guī)范，在滿足個(gè)人隱私的情況下進(jìn)行相關(guān)的研究?！瘪R利莊教授表示，“我們也可以將計(jì)算機(jī)視覺用于醫(yī)學(xué)影像。比如我們?cè)谧龅牟±砬衅?，我們與兒童醫(yī)學(xué)研究院合作，在不同尺度下識(shí)別癌細(xì)胞。還有‘識(shí)臉看病’。”

“人工智能要以人為本、服務(wù)于人?！瘪R利莊強(qiáng)調(diào)，在規(guī)范、合理使用的前提下，人臉識(shí)別與人工智能其他技術(shù)一樣，一定會(huì)讓我們的生活更美好、更便捷。

關(guān)于這項(xiàng)技術(shù)未來的發(fā)展，馬利莊表示，“我覺得比較樂觀的兩個(gè)方向，一個(gè)是服務(wù)機(jī)器人，將來它可能是人的形態(tài)，能夠識(shí)別你是主人，能夠和你溝通、理解你的行為，能夠自我控制和決策，甚至具有情感，它將來會(huì)走進(jìn)千家萬戶；第二個(gè)是娛樂方面的增強(qiáng)現(xiàn)實(shí)與虛擬現(xiàn)實(shí)。”

澎湃新聞：您有一個(gè)人物視覺表情理解與姿態(tài)分析技術(shù)及應(yīng)用的研究，并認(rèn)為該技術(shù)對(duì)于建設(shè)智慧城市具有重要意義。請(qǐng)問這項(xiàng)技術(shù)有哪些重要應(yīng)用和作用？

馬利莊：一個(gè)是應(yīng)用于疫情期間的健康碼。在民眾在登錄驗(yàn)證時(shí)進(jìn)行光線活體檢測(cè)和人臉比對(duì)，通過后才能獲得健康碼，以此保障用戶身份真實(shí)性?；诠饩€活體的遠(yuǎn)程身份核實(shí)是健康碼的核心技術(shù)。截至2020年12月18日，健康碼累計(jì)亮碼超200億人次，覆蓋10億人口，累計(jì)訪問量突破500億。

這項(xiàng)技術(shù)也助力復(fù)工復(fù)產(chǎn)，通過應(yīng)用于“國(guó)家政務(wù)服務(wù)平臺(tái)”，幫助大量企業(yè)主和個(gè)體工商戶在線辦理緩交社保、租金減免等民生事項(xiàng)，從而為疫情防控工作貢獻(xiàn)力量、體現(xiàn)了團(tuán)隊(duì)的科技抗疫先鋒作用。

在金融領(lǐng)域，我們構(gòu)建了國(guó)際首個(gè)在銀行系統(tǒng)商用的人臉遠(yuǎn)程身份核實(shí)系統(tǒng)，在國(guó)內(nèi)首次將人臉核身技術(shù)應(yīng)用于銀行的遠(yuǎn)程開戶中。目前，人臉遠(yuǎn)程核身系統(tǒng)已廣泛應(yīng)用于微信支付、微眾銀行等眾多應(yīng)用場(chǎng)景。

我們的跨年齡人臉識(shí)別技術(shù)能夠幫助找回失蹤人員與被拐賣人口。由于嬰幼兒臉型隨著年齡增長(zhǎng)變化明顯，特別是十多年后面容發(fā)生劇變。我們項(xiàng)目組構(gòu)建的跨時(shí)域人臉檢索與分析系統(tǒng)從千萬級(jí)人員中尋回各類失蹤或被拐賣人口共1706人。針對(duì)尋人場(chǎng)景中嬰幼兒被拐，在僅有幾張嬰幼兒階段的模糊照片情況下，項(xiàng)目組利用首創(chuàng)的跨年齡人臉識(shí)別技術(shù)，協(xié)助解救了15名被拐10年以上兒童。

澎湃新聞：人臉識(shí)別技術(shù)未來的發(fā)展方向是什么？

馬利莊：有幾個(gè)方面，一個(gè)是更精準(zhǔn)的人臉識(shí)別技術(shù)，包括與表情和行為姿態(tài)相結(jié)合。實(shí)際上，人臉分為很多塊肌肉，叫動(dòng)作單元（action unit）。比如，說話時(shí)嘴巴附近幾塊肌肉在動(dòng)，笑的時(shí)候是上面幾塊肌肉，這是分區(qū)域的動(dòng)作單元。與表情結(jié)合，就可以用于教育、海關(guān)人物鑒別，甚至將微表情識(shí)別應(yīng)用于偵探和諜報(bào)部門。

另一個(gè)，現(xiàn)在有各種各樣的攻擊技術(shù)，比如摳臉再合成。人臉識(shí)別需要防止的攻擊包括照片、面具，特別是硅膠面具，還有數(shù)字模型攻擊。我估計(jì)深度人臉安全技術(shù)以后可能會(huì)發(fā)展得很快。

當(dāng)然，人臉識(shí)別技術(shù)涉及一種生物特征，也要更多的規(guī)范，在滿足個(gè)人隱私的情況下進(jìn)行相關(guān)的研究。

我覺得人臉識(shí)別技術(shù)更廣一點(diǎn)的是人物視覺理解技術(shù)，包括了行為和場(chǎng)景。

我們可以將計(jì)算機(jī)視覺用于醫(yī)學(xué)影像。比如我們?cè)谧龅牟±砬衅跋穹治?，我們與兒童醫(yī)學(xué)研究院合作，在不同尺度下識(shí)別癌細(xì)胞；還有“識(shí)臉看病”。

“識(shí)臉看病”是完全科學(xué)的。人的臉部（顱面）生長(zhǎng)由基因決定，顱面大約由7000種基因決定，其中有約6000多種基因與臉的長(zhǎng)相相關(guān)。如果缺少某一個(gè)基因，就會(huì)反映到人臉上。我們已經(jīng)在用這種技術(shù)，去篩選出唐氏綜合征、兒童早衰癥等上千種疾病。

“識(shí)臉看病”使原來花兩天甚至兩個(gè)月才能確定的疾病，在幾秒鐘檢測(cè)出結(jié)果，醫(yī)生再稍微判斷，基本能夠?qū)崟r(shí)給出診斷結(jié)果。這樣就幫助了很多病人，因?yàn)榇_診以后才能進(jìn)行治療。這里最大的作用是篩選，原本要檢查6000多種，現(xiàn)在通常只要檢查一兩種，極大地減少了時(shí)間和成本，服務(wù)患者。

將來，我們會(huì)更多地做多模態(tài)的人臉識(shí)別技術(shù)，這些應(yīng)用十分廣泛，如娛樂、自動(dòng)駕駛等。比如，微表情是一種較小的行為動(dòng)作，這與VR、AR的應(yīng)用相關(guān)?，F(xiàn)在年輕人喜歡虛擬角色或虛擬化身，就是你在虛擬世界中有一個(gè)角色，這個(gè)角色長(zhǎng)得跟你一樣，虛擬世界上也有你的社會(huì)和朋友。

我講的都是讓生活更美好。人工智能要以人為本、服務(wù)于人。

澎湃新聞：人臉識(shí)別技術(shù)是否存在一些潛在風(fēng)險(xiǎn)？比如隱私權(quán)、肖像權(quán)的侵犯等。

馬利莊：這是肯定的，我覺得技術(shù)本身沒有害處，不合理使用就會(huì)有問題。所以要建立標(biāo)準(zhǔn)、政策法規(guī)，讓技術(shù)得到合理使用。

規(guī)范使用、合理使用一定是前提。在這個(gè)前提下，我覺得人臉識(shí)別、人工智能一定會(huì)讓我們的生活更美好、更便捷。

澎湃新聞：目前，中國(guó)的人工智能在國(guó)際上處于什么水平？

馬利莊：我覺得中國(guó)的人工智能在國(guó)際上應(yīng)該具有相當(dāng)高的地位，應(yīng)該是僅次于美國(guó)，我不知道這樣說是否合理。

而我們的人臉識(shí)別技術(shù)是世界第一，這一點(diǎn)我很有信心，因?yàn)槲覀兊恼攮h(huán)境給我們創(chuàng)造了一個(gè)比較自由的研究氛圍。特別是人臉的深度安全技術(shù)，我們?cè)谶@里開辟了一個(gè)小領(lǐng)域，在這個(gè)領(lǐng)域上我們是領(lǐng)先的。國(guó)外則由于各種限制使這個(gè)數(shù)據(jù)更難獲取。

在保護(hù)隱私、讓數(shù)據(jù)不被濫用的情況下，當(dāng)然使用數(shù)據(jù)越方便，越能更好地服務(wù)人。比如說，打車時(shí)不告訴別人你的位置，你說這是隱私，同時(shí)又要求車來接你，那不是開玩笑嗎？

澎湃新聞：您覺得現(xiàn)在的教育是否滿足人工智能的人才需求？

馬利莊：在短期，我覺得人才不那么緊缺了，因?yàn)槿斯ぶ悄鼙ㄊ皆鲩L(zhǎng)的過程已經(jīng)過去，現(xiàn)在處于平穩(wěn)增長(zhǎng)狀態(tài)。

從人才的角度來說，由于人工智能在國(guó)外是計(jì)算機(jī)的一個(gè)大分支，當(dāng)然它滲透到各個(gè)應(yīng)用領(lǐng)域。伴隨著人工智能熱潮，確實(shí)有很多其他方向不同專業(yè)的人涌入這個(gè)行業(yè)，造成人才良莠不齊的狀況。就是說，人才的數(shù)量急劇增加了，但是質(zhì)量可能還需要提高。

在高校中，人工智能的教育還需要提高，目前人工智能的本科還沒有獨(dú)立的學(xué)科。但是，關(guān)于是否設(shè)置為獨(dú)立學(xué)科、以后成為像計(jì)算機(jī)系一樣的人工智能系，現(xiàn)在仍然有較大爭(zhēng)議。

人工智能與其他學(xué)科確實(shí)有一些不同。最大的不同是，人工智能分別應(yīng)用于不同的行業(yè)，不像有些技術(shù)的應(yīng)用領(lǐng)域相對(duì)集中。人工智能像“萬金油”一樣，可以賦能各個(gè)產(chǎn)業(yè)。

比如，剛才我說的智慧城市建設(shè)，人工智能發(fā)揮的直接作用最為明顯。其他如工業(yè)檢測(cè)。譬如，流水線上的產(chǎn)品檢測(cè)，原來靠人工，現(xiàn)在我們?cè)噲D用計(jì)算機(jī)視覺的方法來自動(dòng)識(shí)別產(chǎn)品瑕疵，這樣可以大幅降低用工成本。這個(gè)市場(chǎng)需求也很迫切。

從發(fā)展的角度說，我覺得比較樂觀的兩個(gè)方向，一個(gè)是服務(wù)機(jī)器人，將來它可能是人的形態(tài)，能夠識(shí)別你是主人，能夠和你溝通、理解你的行為，能夠自我控制和決策，甚至具有情感、它將來會(huì)走進(jìn)千家萬戶；第二個(gè)是娛樂方面的增強(qiáng)現(xiàn)實(shí)與虛擬現(xiàn)實(shí)。

澎湃新聞：您也研究數(shù)字多媒體，請(qǐng)問人工智能如何與動(dòng)畫結(jié)合？

馬利莊：動(dòng)畫跟虛擬現(xiàn)實(shí)類似，實(shí)際上，動(dòng)畫片需要更高一層的智能。隨著劇情起伏，演員的個(gè)性也會(huì)發(fā)展起伏，這個(gè)發(fā)展過程實(shí)際上充分體現(xiàn)了人的智能。要模擬這種發(fā)展，需要智能的角色、智慧的行為與個(gè)性發(fā)展。

譬如，某個(gè)角色的人設(shè)是正面的、開朗的、積極向上的，那么他在處理各種事件時(shí)會(huì)有一個(gè)基本的邏輯。

人工智能角色的智能體現(xiàn)在很多方面。比如說，虛擬角色可以智能地思考。比如，它自己會(huì)讀劇本。輸入一段故事如“在陽(yáng)光明媚的天氣里，青蛙跳進(jìn)河里”。人工智能需要理解：主角是青蛙，它的行為是跳進(jìn)河里，所處的環(huán)境是陽(yáng)光明媚的天氣與河流。這就需要自然語(yǔ)言理解。然后是虛擬角色的個(gè)性發(fā)展，它要有智慧，能夠自己按照劇本進(jìn)行演繹，而不是人為控制它的運(yùn)動(dòng)。

所以，根據(jù)不同的劇情、主題思想來設(shè)定角色的發(fā)展，非常有意思。

責(zé)任編輯：李躍群

校對(duì)：張艷

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#人臉識(shí)別技術(shù)#人工智能 #健康碼