- +1
專訪健康碼背后的技術(shù)領(lǐng)軍人馬利莊:人臉識(shí)別還可識(shí)臉看病
手機(jī)屏幕上小小的一方“健康碼”對(duì)疫情防控起到了巨大的作用。
截至2020年12月18日,健康碼累計(jì)亮碼超200億人次,覆蓋10億人口,累計(jì)訪問量破500億。近日,澎湃新聞?dòng)浾咴谑澜缛斯ぶ悄艽髸?huì)上專訪了健康碼背后人臉識(shí)別的技術(shù)團(tuán)隊(duì)領(lǐng)頭人馬利莊教授。

馬利莊教授
馬利莊是上海交通大學(xué)特聘教授,人工智能研究院副院長(zhǎng),華東師范大學(xué)特聘教授(兼);中國(guó)圖像圖形學(xué)會(huì)理事,動(dòng)畫與數(shù)字娛樂專委會(huì)主任,中國(guó)人工智能學(xué)會(huì)理事、智能創(chuàng)意與數(shù)字藝術(shù)專委會(huì)副主任。
馬利莊團(tuán)隊(duì)聚焦計(jì)算機(jī)圖形學(xué)與計(jì)算機(jī)視覺技術(shù),團(tuán)隊(duì)的《面向復(fù)雜場(chǎng)景的人物視覺理解技術(shù)及應(yīng)用》相關(guān)研究及應(yīng)用成果于今年5月獲得2020年上海市科學(xué)技術(shù)進(jìn)步獎(jiǎng)特等獎(jiǎng)。
項(xiàng)目組在健康碼、復(fù)工復(fù)產(chǎn)、AI尋人、互聯(lián)網(wǎng)金融等多方面構(gòu)建重大應(yīng)用,產(chǎn)生了超百億的經(jīng)濟(jì)效益,推動(dòng)了人工智能相關(guān)行業(yè)的進(jìn)步;并獲得授權(quán)發(fā)明專利165項(xiàng)、軟件著作權(quán)15項(xiàng),IEEE國(guó)際標(biāo)準(zhǔn)1項(xiàng)、國(guó)家標(biāo)準(zhǔn)8項(xiàng),發(fā)表高水平論文290篇(CCF-A收錄70篇),取得了卓越的創(chuàng)新成果。
“人臉識(shí)別技術(shù)涉及一種生物特征,也要更多的規(guī)范,在滿足個(gè)人隱私的情況下進(jìn)行相關(guān)的研究?!瘪R利莊教授表示,“我們也可以將計(jì)算機(jī)視覺用于醫(yī)學(xué)影像。比如我們?cè)谧龅牟±砬衅?,我們與兒童醫(yī)學(xué)研究院合作,在不同尺度下識(shí)別癌細(xì)胞。還有‘識(shí)臉看病’。”
“人工智能要以人為本、服務(wù)于人?!瘪R利莊強(qiáng)調(diào),在規(guī)范、合理使用的前提下,人臉識(shí)別與人工智能其他技術(shù)一樣,一定會(huì)讓我們的生活更美好、更便捷。
關(guān)于這項(xiàng)技術(shù)未來的發(fā)展,馬利莊表示,“我覺得比較樂觀的兩個(gè)方向,一個(gè)是服務(wù)機(jī)器人,將來它可能是人的形態(tài),能夠識(shí)別你是主人,能夠和你溝通、理解你的行為,能夠自我控制和決策,甚至具有情感,它將來會(huì)走進(jìn)千家萬戶;第二個(gè)是娛樂方面的增強(qiáng)現(xiàn)實(shí)與虛擬現(xiàn)實(shí)。”
澎湃新聞:您有一個(gè)人物視覺表情理解與姿態(tài)分析技術(shù)及應(yīng)用的研究,并認(rèn)為該技術(shù)對(duì)于建設(shè)智慧城市具有重要意義。請(qǐng)問這項(xiàng)技術(shù)有哪些重要應(yīng)用和作用?
馬利莊:一個(gè)是應(yīng)用于疫情期間的健康碼。在民眾在登錄驗(yàn)證時(shí)進(jìn)行光線活體檢測(cè)和人臉比對(duì),通過后才能獲得健康碼,以此保障用戶身份真實(shí)性?;诠饩€活體的遠(yuǎn)程身份核實(shí)是健康碼的核心技術(shù)。截至2020年12月18日,健康碼累計(jì)亮碼超200億人次,覆蓋10億人口,累計(jì)訪問量突破500億。
這項(xiàng)技術(shù)也助力復(fù)工復(fù)產(chǎn),通過應(yīng)用于“國(guó)家政務(wù)服務(wù)平臺(tái)”,幫助大量企業(yè)主和個(gè)體工商戶在線辦理緩交社保、租金減免等民生事項(xiàng),從而為疫情防控工作貢獻(xiàn)力量、體現(xiàn)了團(tuán)隊(duì)的科技抗疫先鋒作用。
在金融領(lǐng)域,我們構(gòu)建了國(guó)際首個(gè)在銀行系統(tǒng)商用的人臉遠(yuǎn)程身份核實(shí)系統(tǒng),在國(guó)內(nèi)首次將人臉核身技術(shù)應(yīng)用于銀行的遠(yuǎn)程開戶中。目前,人臉遠(yuǎn)程核身系統(tǒng)已廣泛應(yīng)用于微信支付、微眾銀行等眾多應(yīng)用場(chǎng)景。
我們的跨年齡人臉識(shí)別技術(shù)能夠幫助找回失蹤人員與被拐賣人口。由于嬰幼兒臉型隨著年齡增長(zhǎng)變化明顯,特別是十多年后面容發(fā)生劇變。我們項(xiàng)目組構(gòu)建的跨時(shí)域人臉檢索與分析系統(tǒng)從千萬級(jí)人員中尋回各類失蹤或被拐賣人口共1706人。針對(duì)尋人場(chǎng)景中嬰幼兒被拐,在僅有幾張嬰幼兒階段的模糊照片情況下,項(xiàng)目組利用首創(chuàng)的跨年齡人臉識(shí)別技術(shù),協(xié)助解救了15名被拐10年以上兒童。
澎湃新聞:人臉識(shí)別技術(shù)未來的發(fā)展方向是什么?
馬利莊:有幾個(gè)方面,一個(gè)是更精準(zhǔn)的人臉識(shí)別技術(shù),包括與表情和行為姿態(tài)相結(jié)合。實(shí)際上,人臉分為很多塊肌肉,叫動(dòng)作單元(action unit)。比如,說話時(shí)嘴巴附近幾塊肌肉在動(dòng),笑的時(shí)候是上面幾塊肌肉,這是分區(qū)域的動(dòng)作單元。與表情結(jié)合,就可以用于教育、海關(guān)人物鑒別,甚至將微表情識(shí)別應(yīng)用于偵探和諜報(bào)部門。
另一個(gè),現(xiàn)在有各種各樣的攻擊技術(shù),比如摳臉再合成。人臉識(shí)別需要防止的攻擊包括照片、面具,特別是硅膠面具,還有數(shù)字模型攻擊。我估計(jì)深度人臉安全技術(shù)以后可能會(huì)發(fā)展得很快。
當(dāng)然,人臉識(shí)別技術(shù)涉及一種生物特征,也要更多的規(guī)范,在滿足個(gè)人隱私的情況下進(jìn)行相關(guān)的研究。
我覺得人臉識(shí)別技術(shù)更廣一點(diǎn)的是人物視覺理解技術(shù),包括了行為和場(chǎng)景。
我們可以將計(jì)算機(jī)視覺用于醫(yī)學(xué)影像。比如我們?cè)谧龅牟±砬衅跋穹治?,我們與兒童醫(yī)學(xué)研究院合作,在不同尺度下識(shí)別癌細(xì)胞;還有“識(shí)臉看病”。
“識(shí)臉看病”是完全科學(xué)的。人的臉部(顱面)生長(zhǎng)由基因決定,顱面大約由7000種基因決定,其中有約6000多種基因與臉的長(zhǎng)相相關(guān)。如果缺少某一個(gè)基因,就會(huì)反映到人臉上。我們已經(jīng)在用這種技術(shù),去篩選出唐氏綜合征、兒童早衰癥等上千種疾病。
“識(shí)臉看病”使原來花兩天甚至兩個(gè)月才能確定的疾病,在幾秒鐘檢測(cè)出結(jié)果,醫(yī)生再稍微判斷,基本能夠?qū)崟r(shí)給出診斷結(jié)果。這樣就幫助了很多病人,因?yàn)榇_診以后才能進(jìn)行治療。這里最大的作用是篩選,原本要檢查6000多種,現(xiàn)在通常只要檢查一兩種,極大地減少了時(shí)間和成本,服務(wù)患者。
將來,我們會(huì)更多地做多模態(tài)的人臉識(shí)別技術(shù),這些應(yīng)用十分廣泛,如娛樂、自動(dòng)駕駛等。比如,微表情是一種較小的行為動(dòng)作,這與VR、AR的應(yīng)用相關(guān)?,F(xiàn)在年輕人喜歡虛擬角色或虛擬化身,就是你在虛擬世界中有一個(gè)角色,這個(gè)角色長(zhǎng)得跟你一樣,虛擬世界上也有你的社會(huì)和朋友。
我講的都是讓生活更美好。人工智能要以人為本、服務(wù)于人。
澎湃新聞:人臉識(shí)別技術(shù)是否存在一些潛在風(fēng)險(xiǎn)?比如隱私權(quán)、肖像權(quán)的侵犯等。
馬利莊:這是肯定的,我覺得技術(shù)本身沒有害處,不合理使用就會(huì)有問題。所以要建立標(biāo)準(zhǔn)、政策法規(guī),讓技術(shù)得到合理使用。
規(guī)范使用、合理使用一定是前提。在這個(gè)前提下,我覺得人臉識(shí)別、人工智能一定會(huì)讓我們的生活更美好、更便捷。
澎湃新聞:目前,中國(guó)的人工智能在國(guó)際上處于什么水平?
馬利莊:我覺得中國(guó)的人工智能在國(guó)際上應(yīng)該具有相當(dāng)高的地位,應(yīng)該是僅次于美國(guó),我不知道這樣說是否合理。
而我們的人臉識(shí)別技術(shù)是世界第一,這一點(diǎn)我很有信心,因?yàn)槲覀兊恼攮h(huán)境給我們創(chuàng)造了一個(gè)比較自由的研究氛圍。特別是人臉的深度安全技術(shù),我們?cè)谶@里開辟了一個(gè)小領(lǐng)域,在這個(gè)領(lǐng)域上我們是領(lǐng)先的。國(guó)外則由于各種限制使這個(gè)數(shù)據(jù)更難獲取。
在保護(hù)隱私、讓數(shù)據(jù)不被濫用的情況下,當(dāng)然使用數(shù)據(jù)越方便,越能更好地服務(wù)人。比如說,打車時(shí)不告訴別人你的位置,你說這是隱私,同時(shí)又要求車來接你,那不是開玩笑嗎?
澎湃新聞:您覺得現(xiàn)在的教育是否滿足人工智能的人才需求?
馬利莊:在短期,我覺得人才不那么緊缺了,因?yàn)槿斯ぶ悄鼙ㄊ皆鲩L(zhǎng)的過程已經(jīng)過去,現(xiàn)在處于平穩(wěn)增長(zhǎng)狀態(tài)。
從人才的角度來說,由于人工智能在國(guó)外是計(jì)算機(jī)的一個(gè)大分支,當(dāng)然它滲透到各個(gè)應(yīng)用領(lǐng)域。伴隨著人工智能熱潮,確實(shí)有很多其他方向不同專業(yè)的人涌入這個(gè)行業(yè),造成人才良莠不齊的狀況。就是說,人才的數(shù)量急劇增加了,但是質(zhì)量可能還需要提高。
在高校中,人工智能的教育還需要提高,目前人工智能的本科還沒有獨(dú)立的學(xué)科。但是,關(guān)于是否設(shè)置為獨(dú)立學(xué)科、以后成為像計(jì)算機(jī)系一樣的人工智能系,現(xiàn)在仍然有較大爭(zhēng)議。
人工智能與其他學(xué)科確實(shí)有一些不同。最大的不同是,人工智能分別應(yīng)用于不同的行業(yè),不像有些技術(shù)的應(yīng)用領(lǐng)域相對(duì)集中。人工智能像“萬金油”一樣,可以賦能各個(gè)產(chǎn)業(yè)。
比如,剛才我說的智慧城市建設(shè),人工智能發(fā)揮的直接作用最為明顯。其他如工業(yè)檢測(cè)。譬如,流水線上的產(chǎn)品檢測(cè),原來靠人工,現(xiàn)在我們?cè)噲D用計(jì)算機(jī)視覺的方法來自動(dòng)識(shí)別產(chǎn)品瑕疵,這樣可以大幅降低用工成本。這個(gè)市場(chǎng)需求也很迫切。
從發(fā)展的角度說,我覺得比較樂觀的兩個(gè)方向,一個(gè)是服務(wù)機(jī)器人,將來它可能是人的形態(tài),能夠識(shí)別你是主人,能夠和你溝通、理解你的行為,能夠自我控制和決策,甚至具有情感、它將來會(huì)走進(jìn)千家萬戶;第二個(gè)是娛樂方面的增強(qiáng)現(xiàn)實(shí)與虛擬現(xiàn)實(shí)。
澎湃新聞:您也研究數(shù)字多媒體,請(qǐng)問人工智能如何與動(dòng)畫結(jié)合?
馬利莊:動(dòng)畫跟虛擬現(xiàn)實(shí)類似,實(shí)際上,動(dòng)畫片需要更高一層的智能。隨著劇情起伏,演員的個(gè)性也會(huì)發(fā)展起伏,這個(gè)發(fā)展過程實(shí)際上充分體現(xiàn)了人的智能。要模擬這種發(fā)展,需要智能的角色、智慧的行為與個(gè)性發(fā)展。
譬如,某個(gè)角色的人設(shè)是正面的、開朗的、積極向上的,那么他在處理各種事件時(shí)會(huì)有一個(gè)基本的邏輯。
人工智能角色的智能體現(xiàn)在很多方面。比如說,虛擬角色可以智能地思考。比如,它自己會(huì)讀劇本。輸入一段故事如“在陽(yáng)光明媚的天氣里,青蛙跳進(jìn)河里”。人工智能需要理解:主角是青蛙,它的行為是跳進(jìn)河里,所處的環(huán)境是陽(yáng)光明媚的天氣與河流。這就需要自然語(yǔ)言理解。然后是虛擬角色的個(gè)性發(fā)展,它要有智慧,能夠自己按照劇本進(jìn)行演繹,而不是人為控制它的運(yùn)動(dòng)。
所以,根據(jù)不同的劇情、主題思想來設(shè)定角色的發(fā)展,非常有意思。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




