更多干貨內(nèi)容請(qǐng)關(guān)注微信公眾號(hào)“AI 前線”,(ID:ai-front) 視頻時(shí)長(zhǎng)約1小時(shí),聲音較小,請(qǐng)佩戴耳機(jī)觀看 大家晚上好,首先非常感謝大家來參加本次的討論。今天給大家?guī)淼念}目是怎么樣去構(gòu)建一個(gè)智能客服系統(tǒng)。也很感謝極客邦提供的這次機(jī)會(huì),讓大家可以一起探討一下這樣的一個(gè)問題。 我是來自第四范式的邢少敏,首先允許我花一點(diǎn)時(shí)間介紹一下第四范式是一家什么樣的公司。第四范式是一家人工智能技術(shù)與服務(wù)的提供商,主要是基于機(jī)器學(xué)習(xí)為企業(yè)找到一些業(yè)績(jī)的增長(zhǎng)點(diǎn),已經(jīng)為銀行、保險(xiǎn)、互聯(lián)網(wǎng)等領(lǐng)域上百多家企業(yè)打造了人工智能產(chǎn)品及解決方案。 第四范式成立以來一直致力于降低人工智能的應(yīng)用門檻,我們的企業(yè)愿景是讓 AI for everyone,讓每一個(gè)人都能擁有駕馭人工智能的能力,正是基于這樣的一個(gè)企業(yè)愿景,我們?cè)诓痪们皩?duì)外免費(fèi)開放了我們的智能客服平臺(tái)(https://bot.) ,這是業(yè)界首個(gè)免費(fèi)的智能客服平臺(tái),僅需 2 分半鐘即可完成接入。自免費(fèi)對(duì)外發(fā)布以來,半個(gè)月時(shí)間已經(jīng)有上千家客戶在使用。今天這個(gè)話題也是圍繞智能客服的技術(shù)來展開。 其次是做一個(gè)簡(jiǎn)單的自我介紹。 我在第四范式做智能客服的研發(fā),畢業(yè)于北京航空航天大學(xué),大約有 15 年左右的研發(fā)經(jīng)驗(yàn),涉獵的領(lǐng)域也比較廣泛:有對(duì)話系統(tǒng)、智能客服、自然語言處理、機(jī)器學(xué)習(xí)等。我最早是在 IBM Jazz 技術(shù)平臺(tái)上的工程師,后來去了環(huán)信做智能客服的負(fù)責(zé)人,曾經(jīng)帶領(lǐng)團(tuán)隊(duì)研發(fā)了環(huán)信的智能客服系統(tǒng)。目前我在第四范式主持智能客服的研發(fā)工作,帶領(lǐng)團(tuán)隊(duì)研發(fā)了智能客服開放平臺(tái)。 今天分享的提綱主要是分為四個(gè)部分,希望通過分享我在智能客服領(lǐng)域的經(jīng)驗(yàn),對(duì)各位開發(fā)者對(duì)理解和應(yīng)用這個(gè)技術(shù)有一定幫助。
我們首先開始第一個(gè)部分的分享,第一部分是智能客服技術(shù)概述。 首先是智能客服產(chǎn)生的背景:為什么要有智能客服這樣的一個(gè)產(chǎn)品,或者說研究方向呢?主要有以下這幾個(gè)原因:
基于以上的這些原因,我們就會(huì)產(chǎn)生一個(gè)想法:能不能有一個(gè)機(jī)器人來回答這些重復(fù)的問題,它能 24 小時(shí)的工作不用休息,降低客戶成本,還能挖掘聊天記錄里面的一些有價(jià)值的知識(shí)點(diǎn)。這就是智能客服產(chǎn)生的背景。 那智能客服的這個(gè)市場(chǎng)規(guī)模大致有多大呢?我們沒有辦法知道一個(gè)準(zhǔn)確的估計(jì),但是我們可以從一些第三方的調(diào)研報(bào)告里面得出一些大致的判斷,估算一下它的市場(chǎng)規(guī)模: 這是一個(gè)第三方在 2016 年做的 2017 年 SaaS 客服的一個(gè)市場(chǎng)規(guī)模預(yù)測(cè),它預(yù)測(cè) 2017 年 SaaS 客服的市場(chǎng)規(guī)模將達(dá)到 680 億人民幣。SaaS 客服只是客服中一種,除了 SaaS 客服之外還有企業(yè)自建的客服,還有私有部署的客服等等。假如說智能客服可以解決 30% 的客服的問題,這還只是一個(gè)非常保守的估計(jì),智能客服的市場(chǎng)規(guī)模也是非常大的。 接下來我們看一下如果說要做一個(gè)智能客服,那做智能客服的一個(gè)基本的目標(biāo),或者說它的技術(shù)目標(biāo)是要做到什么樣的程度呢?它是要完全的替代人工,還是要部分的替代人工呢? 一般情況下,一個(gè)智能客服的目標(biāo)就是我們這張圖里描述的這些:一個(gè)客服的機(jī)器人負(fù)責(zé)回答客戶的一些高頻簡(jiǎn)單問題,將疑難問題交給人工客服團(tuán)隊(duì)來回答。那這個(gè)一定比例是多大比例呢?我這邊寫了一個(gè)百分之 X,也就是說這個(gè)比例不太確定,它是根據(jù)不同的場(chǎng)景以及不同的技術(shù)條件,不同廠商的技術(shù)能力而不同的,有的廠商是 80%,有的是 90%,有的甚至 95%,這都是不確定的。 總之智能客服做的一個(gè)技術(shù)目標(biāo)就是:一定比例的解決客服的簡(jiǎn)單的高頻問題,將疑難問題仍然交給人工客服團(tuán)隊(duì)。這是目前智能客服一個(gè)基本的技術(shù)目標(biāo),是一個(gè)比較現(xiàn)實(shí)的目標(biāo)。那么想讓客服的機(jī)器人來完全取代人工客服,這個(gè)目標(biāo)到目前為止,在絕大部分場(chǎng)景下還是沒有辦法實(shí)現(xiàn)的。 不過到現(xiàn)在為止,整個(gè)智能客服系統(tǒng)的發(fā)展非常快,應(yīng)用也劃分了很多的細(xì)分領(lǐng)域。這個(gè)不一定是一個(gè)完全準(zhǔn)確的分類,只是說從我個(gè)人角度來講,它可能是大致能分為這么幾類。 第一大類是對(duì)話操作系統(tǒng)級(jí)別的系統(tǒng)。那么這一類系統(tǒng)比較有代表性的有亞馬遜的 Alexa,這些系統(tǒng)都希望做操作系統(tǒng)級(jí)別的人機(jī)對(duì)話,就是把人機(jī)對(duì)話直接做成一個(gè)操作系統(tǒng),那在這個(gè)系統(tǒng)上開發(fā)各種各樣不同的智能硬件、軟件等等這些應(yīng)用。 第二大類,就是智能客服,智能客服里面又細(xì)分成兩類:一類是企業(yè)內(nèi)部的智能客服,為了企業(yè)自身的業(yè)務(wù)發(fā)展需要研發(fā)的智能客戶系統(tǒng);還有一類是對(duì)外服務(wù)的智能客服,并且以 SaaS 的方式對(duì)外服務(wù)。 第三大類就是個(gè)人助理類,最有名的就是蘋果的 Siri,還有微軟的 Cortana 等。智能家居現(xiàn)在做得比較火熱的就是一些智能音箱,比如說亞馬遜 Echo 等。還有些公司是做一些智能交互的服務(wù),這些智能交互服務(wù)主要是自然語言處理和意圖識(shí)別方面的服務(wù),其他的廠商可以基于這些智能交互服務(wù)做一些自己的應(yīng)用。 另外還有一些教育類的教育機(jī)器人,知識(shí)問答類的機(jī)器人和開放領(lǐng)域聊天類的機(jī)器人。 最后一類是開放平臺(tái),這個(gè)開放平臺(tái)也可以叫 Bot Factory,比較有代表性的,有 Google 的 API.AI、Facebook 的 Wit.AI、還有微軟的 Luis.AI 等等。這些開放平臺(tái)主要是做任務(wù)對(duì)話方面的一些定制。 在以上多個(gè)細(xì)分領(lǐng)域的應(yīng)用中,智能客服系統(tǒng)最常見的功能有哪些?目前最常見的形式是在人工客服系統(tǒng)基礎(chǔ)上,擴(kuò)展出智能客服的功能,最常見的功能有 單輪問答、功能對(duì)話和人機(jī)協(xié)作。
那么機(jī)器人和人工如何進(jìn)行協(xié)作呢?我們這里舉幾個(gè)例子:比如說上班的時(shí)候人工來回答,下班的時(shí)候機(jī)器人來回答;普通的客戶機(jī)器人來回答,VIP 客戶人工來回答;或者是說分渠道來選擇,比如說微信渠道來的機(jī)器人回答,手機(jī)渠道來的人工回答;還有就是機(jī)器人優(yōu)先,機(jī)器人答不出來,轉(zhuǎn)給人工回答。 當(dāng)然并不限于我們?cè)谶@里舉出的這幾個(gè)例子,還可以根據(jù)業(yè)務(wù)需求,定制復(fù)雜策略:機(jī)器人推薦答案給人工,人工客服來選擇和編輯答案、或者給出另外一個(gè)答案,機(jī)器人在這里起到了一個(gè)人工客服小助理的角色,這也是最常見的人機(jī)協(xié)作方式。 剛才我們是給智能客服做了一個(gè)概述。接下來,我們介紹一下智能客服的工作原理。 一個(gè)常見的智能客服,就包括以下這些模塊并且按照一個(gè)類似的流程進(jìn)行工作。 首先可能會(huì)有一個(gè) ASR(語音識(shí)別)模塊,也可能沒有,這取決于具體廠商的一個(gè)選擇,這個(gè)語音識(shí)別模塊會(huì)把語音轉(zhuǎn)換成文字。 如果沒有語音識(shí)別模塊,直接就是文字,會(huì)首先對(duì)這個(gè)文字做一個(gè)問句的理解,或者說做一個(gè)查詢的理解,理解完以后,再對(duì)意圖做一個(gè)識(shí)別;最后,我們把這個(gè)問句的理解和意圖識(shí)別的結(jié)果帶到對(duì)話管理系統(tǒng)里邊,對(duì)話管理系統(tǒng)會(huì)決定到底是給哪一種機(jī)器人發(fā)過去,這些機(jī)器人最后給出答案,將答案返回。 對(duì)話管理系統(tǒng)可以選擇一個(gè)機(jī)器人將問題發(fā)過去,也可以同時(shí)將問題發(fā)給所有的機(jī)器人,當(dāng)它們都回復(fù)答案時(shí),進(jìn)行答案選擇再返回,使用哪種方式取決于廠商自己的一個(gè)選擇。 上圖中這四種機(jī)器人分別對(duì)應(yīng)了四種不同的模塊: 第一種是任務(wù)管理類的模塊,比如說訂機(jī)票,它屬于一個(gè)特定的任務(wù),這種機(jī)器人就類似蘋果的 Siri,是任務(wù)處理類; 第二種是知識(shí)庫問答,也就是咨詢問答類的,只是做一些咨詢類的工作,一般情況下,它并不處理實(shí)際的一些任務(wù); 第三類是知識(shí)圖譜問答,知識(shí)圖譜是知識(shí)庫常見的是提供一個(gè)問答對(duì)結(jié)構(gòu)和一個(gè)樹型結(jié)構(gòu),知識(shí)圖譜提供一個(gè)圖結(jié)構(gòu),可以認(rèn)為是一個(gè)廣義上的知識(shí)庫問答。 第四類是聊天機(jī)器人的技術(shù),聊天并不是客服的首要功能,客服主要是解決問題的,不是來聊天的,為什么在一個(gè)智能客服系統(tǒng)里面會(huì)有聊天這么一個(gè)功能呢?原因在于,一是在用戶沒有輸入知識(shí)庫內(nèi)容的時(shí)候,這個(gè)聊天機(jī)器人會(huì)被客戶當(dāng)成是測(cè)試廠商機(jī)器人技術(shù)能力的評(píng)測(cè)對(duì)象;二是在某些場(chǎng)景下,會(huì)讓整個(gè)客服對(duì)話沒那么單調(diào)。在實(shí)際的智能客服系統(tǒng)里面,一般也可以選擇讓用戶可以關(guān)閉聊天功能。 接下來我們把這張圖展開,一個(gè)模塊一個(gè)模塊的講,因?yàn)橐话愫芏嗫蛻糁饕€是使用文字客服,語音識(shí)別屬于另外的一個(gè)領(lǐng)域了,所以我們這里暫時(shí)不展開語音識(shí)別的內(nèi)容。 自然語言理解主要做一些什么事情呢?比如說用戶的問題如果是多句話,那么我們做一個(gè)“分句”,對(duì)每一句話來尋找答案,最后呢,將答案組合起來,發(fā)給用戶;“分詞”很常見,分詞后才能理解,才能進(jìn)行標(biāo)注,進(jìn)行實(shí)體識(shí)別,這是常規(guī)的一些處理,然后就是句法分析、指代消解,再有就是詞權(quán)重、語義相似度等等,做這些分析都是為后面的算法做準(zhǔn)備,這是第一部分的預(yù)處理工作,就是自然語言理解或者自然語言處理的內(nèi)容。 第二部分的預(yù)處理工作就是意圖識(shí)別。意圖識(shí)別主要是用戶的這句話暴露了用戶什么樣的意圖,比如說我們這個(gè)例子里:“今天天氣怎么樣”,這個(gè)意圖實(shí)際上就是用戶要問天氣。那么如果用戶說“幫我定一張去上海的機(jī)票”,這個(gè)意思就是用戶要訂機(jī)票。 那么意圖識(shí)別一般是怎么實(shí)現(xiàn)的?就是有模板和分類器兩種方式。模板的方式,比如說:“北京今天天氣怎么樣?”我們會(huì)建一個(gè)叫“city”的詞典,這里面會(huì)有北京、上海、天津等城市;我們會(huì)把今天、明天、后天等等也做一個(gè)詞典,詞典名字叫做“date”。這樣如果滿足剛開始有一個(gè)“city”,中間有任意字符串,然后再有一個(gè)“date”,然后再有“天氣”這個(gè)詞,就滿足了一個(gè)模板,那么我們基本上可以認(rèn)為它是一個(gè)詢問天氣怎么樣的意圖,這是模板的方法。 分類器的方法很容易理解,我們?cè)谀骋粋€(gè)特定領(lǐng)域里面收集大量語料,人工去標(biāo)注這些語料是屬于哪種意圖的,用分類器模型來做一些二分類或者多分類的分類器,用來判斷意圖。但是分類器方法需要大量人工標(biāo)注的數(shù)據(jù),以及如何去收集多個(gè)領(lǐng)域里面的語料的問題。 接下來整個(gè)系統(tǒng)里面就進(jìn)入了功能模塊。我們先看功能模塊的第一個(gè)最常見的模塊,這也是智能客服系統(tǒng)里面常見的一個(gè)功能,就是知識(shí)庫問答的功能。 知識(shí)庫問答的技術(shù)本質(zhì)也是用一些跟搜索引擎相似的技術(shù),分為兩個(gè)階段:第一個(gè)階段是侯選集召回,第二個(gè)階段是重排序。 首先是侯選集,侯選集召回有很多種方式,和搜索引擎相比,相對(duì)簡(jiǎn)單,原因是搜索引擎要召回的量特別的大,但是知識(shí)庫,因?yàn)槭侨斯?dǎo)入的,它的召回的就沒有那么復(fù)雜。 第二是重排序,其實(shí)我們可以用文本相似度、檢索相關(guān)度,如果有足夠數(shù)據(jù)的話,還可以用神經(jīng)網(wǎng)絡(luò)的語義相似度等,來做重排序工作。這些工作也可以用多模型融合的方式來做,將多個(gè)模型的結(jié)果綜合考慮得到最終結(jié)果。這些都跟搜索引擎的技術(shù)沒有特別本質(zhì)的區(qū)別,也會(huì)有些微小的差別,這是知識(shí)庫這塊的工作。 接下來是跟知識(shí)庫比較相關(guān)的一種工作,知識(shí)圖譜問答。 知識(shí)圖譜問答最難的一點(diǎn)在于數(shù)據(jù)的整理,其次是工具方面。有很多開源的工具,我們列出來這幾種(見上圖),大家也可以自己去研發(fā)一些知識(shí)圖譜的工具。 假設(shè)我們解決了數(shù)據(jù)來源和更新的問題,同時(shí)也有了工具,接下來要做的事情就是查詢轉(zhuǎn)換的工作。 因?yàn)橐话愕闹R(shí)圖譜工具都會(huì)有一些自己的查詢語言,那么我們所要做的工作實(shí)際上就是把自然語言通過某種方式轉(zhuǎn)換成知識(shí)圖譜的工具所支持的查詢語言。 查詢轉(zhuǎn)換也有常見的兩種方式,一種是可以用模板,做一些查詢轉(zhuǎn)換的工作;如果有足夠多的數(shù)據(jù),也可以用機(jī)器翻譯的方式來做。 這里還有一些我們自己的系統(tǒng)支持的知識(shí)圖譜問答的例子。我們現(xiàn)在的系統(tǒng)已經(jīng)具備了通用知識(shí)圖譜的能力,行業(yè)知識(shí)圖譜或者自定義的知識(shí)圖譜很快會(huì)上線。大家就可以看到,這是第二個(gè)模塊,知識(shí)庫和知識(shí)圖譜可以整合成一個(gè)模塊來做,統(tǒng)稱為知識(shí)庫問答。 那么第三大塊就是對(duì)話技術(shù)。對(duì)話技術(shù)就是我們前面所說的任務(wù)對(duì)話等等,比較典型的有三大類: 第一大類是一種用狀態(tài)機(jī),或者和狀態(tài)機(jī)類似的填槽方式。這種方式的主要特點(diǎn)是將整個(gè)的對(duì)話過程抽象成一個(gè)有限狀態(tài)機(jī),每一輪對(duì)話,或者每幾輪作為一種狀態(tài),隨著對(duì)話狀態(tài)的進(jìn)行,這個(gè)狀態(tài)機(jī)在不斷的遷移,最終對(duì)話結(jié)束,狀態(tài)機(jī)也結(jié)束。這里面的所有狀態(tài),以及所要執(zhí)行的動(dòng)作都是事先約定好的,所以狀態(tài)機(jī)它比較適合一些場(chǎng)景簡(jiǎn)單的對(duì)話,對(duì)于場(chǎng)景復(fù)雜的對(duì)話,狀態(tài)機(jī)這種方式就已經(jīng)不太適應(yīng)了。 第二大類就是馬可夫決策過程(Markov Decision Process, MDP)的方式,它和狀態(tài)機(jī)的區(qū)別在于它里面增加了動(dòng)作,狀態(tài)機(jī)里面的動(dòng)作是我們事先約定好的,是固定的動(dòng)作,已經(jīng)事先知道對(duì)話到了那時(shí)候,于是就固定的采取這樣的動(dòng)作,但是 MDP 這種方式,狀態(tài)不確定,動(dòng)作也不確定,所以說我的狀態(tài)和動(dòng)作是需要根據(jù)我的上一個(gè)狀態(tài)和將要采用的動(dòng)作做了以后的回饋(Reward)來進(jìn)行決策的,所以說這個(gè)決策過程在特定領(lǐng)域里有足夠的語料的時(shí)候可以做出很好的效果,但是我們得想辦法去找到合適的領(lǐng)域,以及找到足夠的語料才能做這樣的事情。 最后一類是端到端的模型。端到端的模型主要出發(fā)點(diǎn)是:我有一個(gè)問題,把問題輸入到一個(gè)模型里面之后,這個(gè)模型是幫我解決了我們之前整個(gè)對(duì)話過程所有流程的所有問題,而這個(gè)模型是需要從數(shù)據(jù)里面去學(xué)習(xí),包括自然語言處理、意圖識(shí)別,包括整個(gè)系統(tǒng)里面方方面面的各種東西都要學(xué)習(xí)到。這個(gè)模型對(duì)于我們來說它是個(gè)黑盒,我給它一個(gè)問題,它也能給我答案,我并不需要仔細(xì)的去研究里面是怎么做得,我只需要設(shè)計(jì)訓(xùn)練這么一個(gè)模型就行了。 那么這三種方式是現(xiàn)在的比較常見的三類對(duì)話技術(shù),第一大類,像狀態(tài)機(jī)和填槽這一類是商用系統(tǒng)的主流;第二大類是學(xué)術(shù)界的主流,但是工業(yè)界也在積極的嘗試,有的也已經(jīng)落地,或者接近落地;端到端這種模型,主要還是停留在學(xué)術(shù)界的研究階段,我并沒有看到哪一個(gè)商業(yè)系統(tǒng)已經(jīng)做到了端到端的模型的產(chǎn)品化,還沒有成為商用主流的技術(shù)。 左上角是一個(gè)狀態(tài)機(jī)示意圖,右下角是一個(gè) MDP 模型示意圖。 最后一個(gè)模塊,就是聊天機(jī)器人。 在智能客服系統(tǒng)里面通常都會(huì)有聊天機(jī)器人的模塊。這個(gè)模塊主要有兩種做法: 第一種就是檢索式,比如答案是事先編輯好的,并不會(huì)隨便生成,在檢索式里面又會(huì)分為兩大類:第一類是用大量的語料和模型來訓(xùn)練,收集大量的語料,把問題和答案給一個(gè)神經(jīng)網(wǎng)絡(luò)的模型,用這個(gè)模型幫我去找到問題和答案之間的相關(guān)度,這樣的話,就能夠用大量的語料訓(xùn)練出聊天機(jī)器人模型,這是最常見的一種方式; 第二種方式是基于規(guī)則來做,使用類似于之前介紹過的 Alice 機(jī)器人所用到的 AIML 標(biāo)記語言,寫大量的 pattern,以及在這個(gè) pattern 下所需要的答案,寫大量這樣的人工規(guī)則就可以做一個(gè)檢索式的機(jī)器人,但是這僅限于少量的小規(guī)模應(yīng)用,如果需要編輯大量的規(guī)則,規(guī)則之間可能會(huì)有沖突等問題,所以主流的這種聊天機(jī)器人的方式是我們說到的第一種,用統(tǒng)計(jì)模型和大量的語料來訓(xùn)練聊天機(jī)器人。 第二種是生成式的聊天機(jī)器人,我需要把我的答案直接生成出來,這種方式是需要限定在一定的領(lǐng)域里面。開放領(lǐng)域里直接生成式的聊天機(jī)器人會(huì)有一些敏感詞的問題,因?yàn)檎Z料一般是網(wǎng)上收集的,想做到所有語料都人工審核成本是巨大的。所以說生成式需要把它限定在一個(gè)特定的領(lǐng)域里面,生成式分為兩種:一種是純粹的生成,一種是基于一些模板來生成。 基于一些模板來生成,是說對(duì)答案事先定制好一些模板,生成的答案只是在模板里填空,這樣的話就能控制答案;第二種生成是純粹的生成式,但是只能把它用在特定的一些場(chǎng)景下,并不用它來做全開放的聊天機(jī)器人答案的生成,只能夠用它來做一些限定領(lǐng)域的,比如對(duì)聯(lián)的生成、古詩詞的生成等,這些風(fēng)險(xiǎn)相對(duì)較小。 講到這里,我們基本上已經(jīng)把最開始的那張流程圖里的所有的技術(shù)點(diǎn)講的差不多了。 第三部分就是跟大家一起探討一下智能客服的技術(shù)難點(diǎn):我們?cè)谧鲋悄芸头@樣的一個(gè)系統(tǒng)的時(shí)候,可能會(huì)遇到哪些的技術(shù)難點(diǎn)?主要有這么幾類: 第一個(gè)難點(diǎn)是:數(shù)據(jù)冷啟動(dòng)的問題。 數(shù)據(jù)冷啟動(dòng)就是說在絕大多數(shù)情況下,我們實(shí)際上是沒有足夠的數(shù)據(jù)來訓(xùn)練模型的,這個(gè)時(shí)候,我們?cè)趺醋觯?/p> 在面對(duì)這種數(shù)據(jù)冷啟動(dòng)的問題,很多模塊的設(shè)計(jì)里面都會(huì)考慮怎么樣去在缺少數(shù)據(jù)的情況下把這個(gè)事情做起來,大致有兩種辦法:一是先用一個(gè)通用的模型,等到數(shù)據(jù)足夠多的時(shí)候優(yōu)化這個(gè)模型;第二種是先用規(guī)則的方法做,先把這個(gè)模塊做起來,等到數(shù)據(jù)足夠多的時(shí)候,再來啟用模型的方法,這兩種方法都可以走的通,但是要根據(jù)具體的情況來具體分析。 第二個(gè)難點(diǎn)是:多輪對(duì)話的問題。 尤其是多領(lǐng)域的對(duì)話,多領(lǐng)域的多輪對(duì)話仍然是一個(gè)難題。在一個(gè)單領(lǐng)域里面,我可以把對(duì)話技術(shù)做得很好,比如說像最簡(jiǎn)單的訂機(jī)票可以做得很好。但是如果說在很多不同的領(lǐng)域里面,這邊是訂機(jī)票、查物流、那邊又是去做一些其他的什么電商相關(guān)的事情,這個(gè)多領(lǐng)域的對(duì)話怎么辦?我們是沒有辦法在多個(gè)領(lǐng)域都拿到足夠的數(shù)據(jù),在這種情況下多輪對(duì)話是一個(gè)比較困難的問題。 第三個(gè)難點(diǎn)是:人機(jī)協(xié)作。 人機(jī)協(xié)作這塊現(xiàn)有的方式前面已經(jīng)提到過了,現(xiàn)有的方式實(shí)際上沒有辦法最大化機(jī)器人的價(jià)值,也就是說機(jī)器人在整個(gè)智能客服的系統(tǒng)里面它起的仍然是一個(gè)輔助的作用,而不是主要的作用。 為了發(fā)揮這個(gè)機(jī)器人的作用,我們需要去探索一些新的方式,比如說我們能不能做到人為輔助,然后機(jī)器人來主要回答這個(gè)用戶的問題呢?這也是我們現(xiàn)在正在研究的一個(gè)新的方向,對(duì)于這些技術(shù)難點(diǎn)其實(shí)我們也可以共同來討論有什么樣的解決方案。 那剛才我們講了很多,一個(gè)智能客服系統(tǒng),它是需要什么樣的能力呢?總結(jié)一下:
然而對(duì)于企業(yè)級(jí)開發(fā)者來說,智能客服的接入是有一定的門檻的。實(shí)際上,開發(fā)一套智能客服系統(tǒng),需擁有自然語言處理、意圖識(shí)別、知識(shí)圖譜、單輪 / 多輪對(duì)話等引擎作為支撐,其中涉及自然語言處理、語義相似度、狀態(tài)機(jī)、高維機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等諸多底層算法…… 這樣的門檻讓很多沒有人工智能人才與技術(shù)儲(chǔ)備的企業(yè)難以獲得智能客服。此外,現(xiàn)有的很多智能客服系統(tǒng)都是封閉的,你并不了解它里面是怎么工作的,它也不會(huì)去向外開放,這就讓用戶沒有辦法在它上面做二次開發(fā)。 為了改變這種行業(yè)困境,第四范式研發(fā)了智能客服的開放平臺(tái),幫助企業(yè)級(jí)開發(fā)者零成本、零門檻地搭建自己的智能客服系統(tǒng)。 首先看一下第四范式智能客服的一個(gè)概念圖: 我們會(huì)有基礎(chǔ)服務(wù)層,基礎(chǔ)服務(wù)層里面會(huì)有自然語言理解的各種服務(wù),因?yàn)檫@是我們系統(tǒng)的一個(gè)示意圖,所以它里面只寫了很少的幾個(gè)部分,實(shí)際上我們所做的遠(yuǎn)遠(yuǎn)不只這 5 個(gè)部分,自然語言理解有很多的事情,我們都做了。第二個(gè)是意圖識(shí)別的服務(wù),這兩個(gè)作為一個(gè)基礎(chǔ)服務(wù)層為上層的功能模塊來服務(wù)。 再往上就是四個(gè)功能模塊:任務(wù)對(duì)話、知識(shí)庫、知識(shí)圖譜,還有聊天機(jī)器人。在這之上是全渠道低門檻接入,我們現(xiàn)有五個(gè)渠道,后面還會(huì)擴(kuò)展更多的渠道,是一個(gè)真正的全渠道接入的智能客服。 還有一點(diǎn),有一個(gè)反饋?zhàn)詫W(xué)習(xí)層,這個(gè)反饋?zhàn)詫W(xué)習(xí)是根據(jù)客戶對(duì)答案的反饋,以及人工客服對(duì)答案的反饋進(jìn)行自我學(xué)習(xí),一是調(diào)整、問答質(zhì)量,二是對(duì)知識(shí)庫做一些生成。 圖中是我們所提供的四個(gè)功能模塊。我想重點(diǎn)想講一下我們整個(gè)產(chǎn)品有什么樣的特點(diǎn): 第一個(gè)特點(diǎn)就是針對(duì)之前講的,客戶覺得接入門檻高的問題,我們?nèi)蓝际欠昼娂?jí)接入,現(xiàn)有的渠道(APP、微信公眾號(hào)、Web 端、微博等),以及未來的一些渠道都可以在幾分鐘之內(nèi)快速接入,就是讓用戶快速的擁有智能的能力; 其次我們有一個(gè)自學(xué)習(xí)的模塊,自學(xué)習(xí)就是我前面所提到的,它在整個(gè)過程中會(huì)去學(xué)習(xí)一些反饋,這些反饋達(dá)到一定量的時(shí)候它會(huì)反映在這個(gè)問答的結(jié)果上,或者說對(duì)知識(shí)庫做一些調(diào)整; 再次,我重點(diǎn)想講一下開放平臺(tái),首先我們的智能客服產(chǎn)品是一個(gè)免費(fèi)的 SaaS 服務(wù),它的基礎(chǔ)服務(wù)是永久免費(fèi)的,如果一家公司想要使用我們的智能客服系統(tǒng),并且它的需求在我們的研發(fā)計(jì)劃之內(nèi),那么它可以永久免費(fèi)的使用我們的服務(wù)。 那么為什么我們要做這樣一個(gè)免費(fèi)的開放平臺(tái)呢?第四范式的企業(yè)愿景是把 AI 的能力賦能給企業(yè)客戶甚至是個(gè)人。因此我們希望做一個(gè)開放平臺(tái),允許企業(yè)的開發(fā)者、甚至是第三方的廠商,在這個(gè)已經(jīng)很成熟的基礎(chǔ)的技術(shù)平臺(tái)上,做出自己企業(yè)需要的智能客服系統(tǒng),或者做出自己細(xì)分領(lǐng)域的解決方案,只有這樣,智能客服這個(gè)市場(chǎng)需求量極大的技術(shù)才能真正遍地開花。 接下來這三張圖是通過不同的接入方式接入以后的實(shí)例: 下面兩張圖分別是安卓的手機(jī)接入和 IOS 的手機(jī),因?yàn)榘沧亢?IOS 采用的是 SDK。它最典型的場(chǎng)景是集成完以后,在這個(gè)手機(jī) APP 上點(diǎn)一個(gè)類似于“聯(lián)系客服”這樣一個(gè)按鈕,就會(huì)出現(xiàn)下圖中這樣的一個(gè)聊天窗口,用戶就可以和機(jī)器人對(duì)話。 最后再分享一下第四范式智能客服的開放平臺(tái)網(wǎng)址: 鏈接:https://bot. 建議用 Google 瀏覽器打開。 今天的分享就到此結(jié)束了。非常感謝大家的時(shí)間,謝謝。 邢少敏,第四范式智能客服負(fù)責(zé)人 & 資深數(shù)據(jù)科學(xué)家,畢業(yè)于北京航空航天大學(xué),獲博士學(xué)位。15 年研發(fā)經(jīng)驗(yàn),對(duì)話系統(tǒng)、智能客服領(lǐng)域?qū)<遥谧匀徽Z言處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、互聯(lián)網(wǎng)系統(tǒng)技術(shù)架構(gòu)等領(lǐng)域擁有豐富經(jīng)驗(yàn)。前 IBM 資深工程師,IBM Jazz 技術(shù)平臺(tái)核心工程師。前環(huán)信智能客服技術(shù)負(fù)責(zé)人,從 0 開始帶領(lǐng)團(tuán)隊(duì)研發(fā)了環(huán)信智能客服系統(tǒng)。目前主持第四范式智能客服的研發(fā)工作,帶領(lǐng)團(tuán)隊(duì)開發(fā)了智能客服開放平臺(tái)。 |
|