- +1
我在鵝廠教機(jī)器人說(shuō)話
原創(chuàng) 白莉莉 邊碼故事 收錄于合集#科技創(chuàng)新 2 個(gè) #科技向善 4 個(gè)

機(jī)器能像人一樣思考、交流嗎?這個(gè)在今天“不是問(wèn)題的問(wèn)題”,最初其實(shí)是一個(gè)哲學(xué)問(wèn)題。
如果說(shuō)法國(guó)思想家狄德羅當(dāng)年那句著名的“如果他們發(fā)現(xiàn)一只鸚鵡可以回答一切問(wèn)題,我會(huì)毫不猶豫宣布它存在智能”,顯示的是人類面對(duì)“人工智能”時(shí)的模棱兩可,那么法國(guó)先知笛卡爾下面的這句話,則稱得上是歷史上第一次對(duì)人類和機(jī)器交互的深度思考:
“動(dòng)物是超級(jí)機(jī)器人,人類也是,不同之處在于人擁有思維能力?!?/p>
但其實(shí)從笛卡爾最著名的那句“我思故我在”中,很多人都拋出了這樣一個(gè)疑問(wèn):如果思考的主體不是人類,不是我們?cè)噲D去證明機(jī)器是否有人類這樣的智能,而是機(jī)器人想證明自己是否有人類這樣的智能,那么對(duì)機(jī)器人而言,是否也有一個(gè)“我”的存在呢?
英國(guó)科學(xué)家阿蘭·圖靈在1950年,做了那個(gè)著名的圖靈測(cè)試:如果一臺(tái)機(jī)器能夠與人類展開(kāi)對(duì)話(通過(guò)電傳設(shè)備)而不被辨別出其機(jī)器身份,那么稱這臺(tái)機(jī)器具有智能。圖靈隨后相信,“會(huì)思考的機(jī)器”是有可能在未來(lái)變?yōu)楝F(xiàn)實(shí)的。
在被人工智能、AI技術(shù)和數(shù)字化浪潮包圍的今天,機(jī)器人還能通過(guò)圖靈測(cè)試嗎?對(duì)于這個(gè)問(wèn)題,我們并不確定,但一個(gè)顯而易見(jiàn)的現(xiàn)實(shí)是,和人對(duì)話、為人分憂、幫助人類解決日常問(wèn)題的智能客服,已經(jīng)出現(xiàn)在數(shù)字化生活的每個(gè)場(chǎng)景中,而在背后引導(dǎo)、培訓(xùn)智能客服的“幕后英雄”—人工智能訓(xùn)練師,則是我們最想了解和關(guān)注的一個(gè)群體。
人工智能訓(xùn)練師又稱AI Trainer,是通過(guò)給系統(tǒng)搭建智能大腦,并不斷優(yōu)化,讓機(jī)器人通情理、懂人性、有溫度,更好地為人類服務(wù)。最近,我們和一名有六年工作經(jīng)驗(yàn)的人工智能訓(xùn)練師王進(jìn)聊了聊,試圖還原一份教機(jī)器人說(shuō)人話的工作,究竟是怎樣的。
作者|白莉莉

我叫王進(jìn),是騰訊的一名人工智能訓(xùn)練師。在成為人工智能訓(xùn)練師之前,我在騰訊游戲和微信支付做過(guò)三年人工客服,被無(wú)數(shù)游戲迷問(wèn)過(guò)封號(hào)、道具和綁卡的問(wèn)題,也見(jiàn)識(shí)過(guò)微信龐雜使用群體的各類問(wèn)題。
2021年,人社部發(fā)布《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》,讓通過(guò)數(shù)據(jù)“投喂”、“調(diào)教”給機(jī)器的人工智能訓(xùn)練師這個(gè)新職業(yè)第一次走進(jìn)大眾視野,但其實(shí)早在2016年,我就已經(jīng)從人工客服,轉(zhuǎn)做人工智能訓(xùn)練師了。
現(xiàn)在一談到人工智能,很多人第一反應(yīng)都是當(dāng)年名震天下的那支阿法狗。阿法狗當(dāng)年只需要記住歷史上那些著名的棋局,就能擊敗人類的棋王,而人工智能客服面對(duì)的,則是海量用戶千奇百怪的需求,與之相對(duì)應(yīng)的,是需要培育和建立起海量的語(yǔ)料和模型。
其實(shí)我自己從人工客服轉(zhuǎn)為人工智能客服訓(xùn)練師時(shí),最遇到的第一個(gè)困難就是:如何構(gòu)建海量的語(yǔ)料,并為智能客服搭建一棵知識(shí)樹。
這棵知識(shí)樹緯度的粗細(xì),決定了后期運(yùn)營(yíng)的難度和智能客服的體驗(yàn),如果這棵知識(shí)樹過(guò)粗,用戶就不能得到針對(duì)性的答案,智能客服的解決能力也顯得較差;如果知識(shí)樹過(guò)細(xì),那么后期運(yùn)營(yíng)的難度會(huì)增加,用戶比較粗線條的描述,可能會(huì)讓智能客服無(wú)所適從。

那么,怎么理解智能客服“知識(shí)樹”的粗和細(xì)呢?大家先看看以下兩個(gè)客戶向智能客服提過(guò)的問(wèn)題:
“微信怎么發(fā)紅包???”
“我微信以前綁定的是我老婆的卡,現(xiàn)在想換成我自己的實(shí)名,可以嗎?”
現(xiàn)在我們來(lái)簡(jiǎn)要分析一下這兩個(gè)問(wèn)題。第一個(gè)問(wèn)題用戶的描述很聚焦,第二個(gè)問(wèn)題用戶的描述很個(gè)性化,那么這兩個(gè)問(wèn)題,對(duì)于智能客服的語(yǔ)料量級(jí)要求其實(shí)是千差萬(wàn)別的。
第一個(gè)問(wèn)題,用戶描述得很聚焦,只需要少量的語(yǔ)料,就可以帶來(lái)明顯的效果;但第二個(gè)用戶的描述很具個(gè)性化,除了 “綁定”、“實(shí)名”、“更換”等關(guān)鍵信息以外,還有很多個(gè)性的詞匯,比如“老婆的卡”、“我自己的”這類的,而其他用戶,尤其是老年人用戶,很可能會(huì)提到諸如“兒子幫我注冊(cè)的微信”這樣的特殊案例,這些干擾性的內(nèi)容會(huì)加大自然語(yǔ)言處理(NLP)模型對(duì)語(yǔ)料的要求和難度,綜合來(lái)看,意圖識(shí)別的準(zhǔn)確性,對(duì)第二個(gè)問(wèn)題要求的語(yǔ)料,從幾十條到數(shù)千條不等。
除了知識(shí)樹的搭建,算法模型也相當(dāng)重要。在智能客服的工作中,通過(guò)識(shí)別用戶的實(shí)際問(wèn)題、情緒和問(wèn)法,模型會(huì)在實(shí)踐中不斷補(bǔ)充具體場(chǎng)景的處理辦法,比如上下文處理方法、人際交互法則等等。
它就像裝飾一個(gè)房子,在與人打交道的過(guò)程中,它也在不斷豐富自身的內(nèi)容。

“問(wèn)半天了,找不到一個(gè)人!”
過(guò)去的幾年時(shí)間,這樣的場(chǎng)景隔三差五就會(huì)出現(xiàn)——遇到問(wèn)題的用戶很急,但智能客服在短期內(nèi),又無(wú)法解決他們的問(wèn)題。
雖然人工智能帶給人無(wú)限可能,但作為一個(gè)天天和機(jī)器人打交道的人,我很清楚人工智能訓(xùn)練師的工作有多難做——智能客服無(wú)法提供客戶滿意的回答,而人工客服又無(wú)法做到隨時(shí)在線,這也讓客服能力、服務(wù)體驗(yàn)和產(chǎn)品口碑備受影響。

那么,智能客服都有哪些服務(wù)難點(diǎn)呢?我想和大家介紹一下,我們?nèi)斯ぶ悄苡?xùn)練師的一個(gè)日常,概括一下,就是“被用戶罵”。這種情況很容易在以下三個(gè)場(chǎng)景里出現(xiàn):
一、智能客服的交互體驗(yàn)不好;二、智能客服沒(méi)有解決客戶實(shí)際問(wèn)題的能力;三、客戶想人工服務(wù),但只有機(jī)器,沒(méi)有人。
很多用戶在使用微信提現(xiàn)時(shí),會(huì)出現(xiàn)遲遲沒(méi)有到賬的情況,我自己就遇到過(guò)這樣的案例:有用戶投訴,“我昨晚提現(xiàn)沒(méi)到賬” ,有時(shí)候他也會(huì)用這種表達(dá)方式,“我的錢還沒(méi)到賬”。這兩句話問(wèn)法看似相同,但其實(shí)問(wèn)的是不同的業(yè)務(wù),特別是第二個(gè)問(wèn)題,這個(gè)模糊問(wèn)法涉及到的業(yè)務(wù)眾多,智能客服無(wú)法一下子精準(zhǔn)辨別出用戶想要問(wèn)的是哪個(gè)業(yè)務(wù)下的問(wèn)題,也就無(wú)法一下子給用戶提供精準(zhǔn)的解決方案。 無(wú)法得到滿意解決方案的客戶,情緒很容易由此而“爆發(fā)”。
再比如,交易物品質(zhì)量有問(wèn)題、遺落物品想求助找回、付款金額忘記核對(duì)等情況出現(xiàn)時(shí),客戶無(wú)法聯(lián)系到只有過(guò)一面之緣的服務(wù)商,這些服務(wù)商或許是你打車的司機(jī)、買汽水的小賣部老板,或者是在付款時(shí)打錯(cuò)了小數(shù)點(diǎn)的服裝店。于是你向客服提問(wèn)“我怎么才能找到掃碼轉(zhuǎn)賬的人”。

圖│騰訊智能客服團(tuán)隊(duì)
但很顯然,這個(gè)問(wèn)題,已經(jīng)超出了智能客服的能力范圍。
我們觀察一下機(jī)器和人類各自的特點(diǎn):機(jī)器擅長(zhǎng)從較為龐大的數(shù)據(jù)集合中作出最優(yōu)決策,人類則擅長(zhǎng)于從較小的數(shù)據(jù)集合中,結(jié)合多維度信息作出更為柔性的決策。
于是我們決定,放大人機(jī)各自的優(yōu)勢(shì),增加人類和機(jī)器在交互中的套路和模式,增加Q&A一問(wèn)一答形式,引導(dǎo)用戶去問(wèn)問(wèn)題,增強(qiáng)人工服務(wù)感。
除此之外,“問(wèn)半天了,找不到一個(gè)人”這類“找不到人工客服”的處理辦法是:智能客服解決不了的問(wèn)題,我在最后安排人工客服進(jìn)行“兜底解決”,也就是說(shuō),那些諸如“紅包限額是多少啊”“怎么查轉(zhuǎn)賬記錄”這類“小白問(wèn)題”,已經(jīng)在智能客服“那一關(guān)”得到了有效解決,而更為復(fù)雜的情況和問(wèn)題,則交由人工客服來(lái)解決。
或許這才是讓機(jī)器高效,讓客戶滿意的最佳方案。

很多人問(wèn)我,人工智能訓(xùn)練師是怎樣讓人工智能變得更聰明,更通人性的?
我們采取的是單輪對(duì)話、多輪對(duì)話的區(qū)分設(shè)計(jì)——單輪的問(wèn)答比較好處理,根據(jù)根據(jù)用戶提問(wèn),訓(xùn)練足夠的語(yǔ)料或意圖關(guān)鍵詞即可識(shí)別,訓(xùn)練語(yǔ)料時(shí),注重根據(jù)用戶提問(wèn)的特點(diǎn)進(jìn)行意圖的收斂反問(wèn),例如用戶描述“我的王者改名卡不見(jiàn)了”比較容易識(shí)別,進(jìn)行一定量級(jí)的語(yǔ)料訓(xùn)練就可以。但有些用戶會(huì)很口語(yǔ)化地問(wèn)“我王者的改名卡?”,這類描述不太清楚,我們就會(huì)把這類意圖定義為模糊提問(wèn),需要反問(wèn)并明確意圖,才能確認(rèn)回復(fù)內(nèi)容。

你可能還會(huì)問(wèn)我:人工智能的解決能力越來(lái)越強(qiáng),那會(huì)取代人工嗎?
雖然現(xiàn)在智能客服的應(yīng)用場(chǎng)景越來(lái)越多,但它終歸是不能完全替代人工客服的,因?yàn)橛泻芏鄦?wèn)題不是智能客服回復(fù)一個(gè)答案,用戶就能接受的,仍然需要人工客服進(jìn)行介入。比如需要一對(duì)一的人工服務(wù)的情緒安撫、策略說(shuō)明,或者是老年人、未成年人等特殊人群的服務(wù),都是需要人工服務(wù)去介入的。
首先是老年人的熱線接入?!兜?7次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,我國(guó)60歲以上的手機(jī)網(wǎng)民已超過(guò)1.1億,全網(wǎng)移動(dòng)支付使用率超過(guò)86.5%。2021年5月,微信支付客服宣布“長(zhǎng)輩無(wú)憂專線”開(kāi)通上線,60歲及以上長(zhǎng)輩用戶撥打微信支付統(tǒng)一客服熱線,將會(huì)優(yōu)先接通“長(zhǎng)輩無(wú)憂專線”,獲得一跟到底的專屬客服。
當(dāng)然還少不了為未成年人保駕護(hù)航的“成長(zhǎng)守護(hù)平臺(tái)”和健康系統(tǒng),家長(zhǎng)可以綁定孩子的游戲賬號(hào),對(duì)孩子的游戲時(shí)間、消費(fèi)等行為進(jìn)行限制,并得到專屬答疑解惑的人工客服的幫助。
雖然智能客服不能完全取代人工客服,但我們?cè)谔嵘悄芸头?wèn)題解決能力的基礎(chǔ)上,嘗試加強(qiáng)智能客服擬人化交互體驗(yàn),比如通過(guò)接口狀態(tài)查詢識(shí)別用戶的具體情況以及歷史服務(wù)記錄,在用戶來(lái)咨詢的第一時(shí)間就能了解到用戶想要問(wèn)哪些問(wèn)題,并提供一個(gè)精準(zhǔn)的解決方案,而不是答復(fù)一個(gè)通用、套路式的話術(shù)。

我舉個(gè)例子。用戶反饋某筆微信支付的交易轉(zhuǎn)賬轉(zhuǎn)錯(cuò)了,我們的答案設(shè)計(jì)是請(qǐng)用戶先選擇交易,根據(jù)具體的交易狀態(tài)進(jìn)行答復(fù),甚至還提供了協(xié)助聯(lián)系轉(zhuǎn)錯(cuò)方的人工處理方式,讓用戶更滿意。
目前來(lái)騰訊客服咨詢的用戶中,通過(guò)智能客服問(wèn)題的識(shí)別率達(dá)90%以上。針對(duì)用戶咨詢的問(wèn)題,智能機(jī)器人通過(guò)產(chǎn)品接口,能查先查;不準(zhǔn)確的問(wèn)題,通過(guò)模糊反問(wèn)等多種形式引導(dǎo)發(fā)問(wèn),并提供解決方案。-有的還對(duì)回答很認(rèn)可,不再追問(wèn)或喊人工服務(wù),有的甚至還對(duì)我們表達(dá)感謝,這時(shí)我們的職業(yè)成就感都是拉滿狀態(tài)——轉(zhuǎn)化成工作指標(biāo),就是智能客服的一次解決率,解決率越高,說(shuō)明客戶越認(rèn)可我們的工作?!?/p>
其實(shí),作為一個(gè)人工智能訓(xùn)練師,需要懂業(yè)務(wù)、精服務(wù)、會(huì)數(shù)據(jù)、能運(yùn)營(yíng),簡(jiǎn)單一句話總結(jié):就是要做一個(gè)“啥都會(huì)”的“雜家”,需要迅速成為一名“全能型選手”:
懂業(yè)務(wù)。只有懂業(yè)務(wù),才能更好的設(shè)計(jì)解決方案;
精服務(wù)。只有懂服務(wù),才能站在用戶的角度幫助用戶解決問(wèn)題;
會(huì)數(shù)據(jù)。只有懂?dāng)?shù)據(jù),才能發(fā)現(xiàn)問(wèn)題進(jìn)行優(yōu)化,并看到優(yōu)化的效果;
能運(yùn)營(yíng)。只有懂運(yùn)營(yíng),才能運(yùn)營(yíng)讓機(jī)器人更好地服務(wù)于人。
針對(duì)這些業(yè)務(wù)掌握的熟練程度,行業(yè)也給出了對(duì)應(yīng)的等級(jí)區(qū)分。目前行業(yè)將人工智能訓(xùn)練師分為初、中、高三個(gè)等級(jí),每個(gè)等級(jí)的工作職責(zé)和能力要求呈梯度化區(qū)分。目前我們團(tuán)隊(duì)的人工智能訓(xùn)練師人才配比大概是3:6:1。初級(jí)智能訓(xùn)練師要懂場(chǎng)景挖掘、數(shù)據(jù)標(biāo)注,占比團(tuán)隊(duì)30%;中級(jí)智能訓(xùn)練師主要負(fù)責(zé)模型搭建、數(shù)據(jù)運(yùn)營(yíng),占比團(tuán)隊(duì)60%;高級(jí)智能訓(xùn)練師負(fù)責(zé)制定規(guī)則,作為整個(gè)體系和領(lǐng)域的專家,處理各項(xiàng)問(wèn)題,協(xié)調(diào)整體發(fā)展,占比團(tuán)隊(duì)10%。
人工智能,這條路很漫長(zhǎng),但我會(huì)一直走下去。作為讓機(jī)器人“更通人性”的老師,人工智能訓(xùn)練師其實(shí)不是在服務(wù)一個(gè)人,面對(duì)的是上百萬(wàn)、千萬(wàn)甚至億級(jí)用戶。想到這里,我既倍感壓力,又充滿希望。
未來(lái),我也將繼續(xù)學(xué)習(xí)AI技術(shù),并與自身的業(yè)務(wù)領(lǐng)域相結(jié)合,繼續(xù)參與和見(jiàn)證人工智能的發(fā)展和應(yīng)用。
邊碼故事
原標(biāo)題:《我在鵝廠教機(jī)器人說(shuō)話》
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司