少妇脱了内裤让我添,久久久久亚洲精品无码网址蜜桃,性色av免费观看,久久人妻av无码中文专区

分享

15年研發(fā)經(jīng)驗(yàn)博士手把手教學(xué):從零開始搭建智能客服

 NeuAlec 2018-04-10
編輯|Vincent
AI 前線導(dǎo)讀:近年來,伴隨著消費(fèi)升級(jí)和企業(yè)服務(wù)意識(shí)強(qiáng)化,大量人工客服需求應(yīng)運(yùn)而生。第四范式不久前對(duì)外免費(fèi)開放智能客服平臺(tái)(鏈接:https://bot.) , 幫助各行各業(yè)的開發(fā)者都能上手使用上智能客服技術(shù)。本次課程將全面講解這套智能客服系統(tǒng)的底層算法與開發(fā)實(shí)踐,其技術(shù)實(shí)現(xiàn)原理和細(xì)節(jié),將對(duì)希望用智能客服來解決業(yè)務(wù)問題的用戶有一定指導(dǎo)意義。

更多干貨內(nèi)容請(qǐng)關(guān)注微信公眾號(hào)“AI 前線”,(ID:ai-front)

視頻時(shí)長(zhǎng)約1小時(shí),聲音較小,請(qǐng)佩戴耳機(jī)觀看

大家晚上好,首先非常感謝大家來參加本次的討論。今天給大家?guī)淼念}目是怎么樣去構(gòu)建一個(gè)智能客服系統(tǒng)。也很感謝極客邦提供的這次機(jī)會(huì),讓大家可以一起探討一下這樣的一個(gè)問題。

我是來自第四范式的邢少敏,首先允許我花一點(diǎn)時(shí)間介紹一下第四范式是一家什么樣的公司。第四范式是一家人工智能技術(shù)與服務(wù)的提供商,主要是基于機(jī)器學(xué)習(xí)為企業(yè)找到一些業(yè)績(jī)的增長(zhǎng)點(diǎn),已經(jīng)為銀行、保險(xiǎn)、互聯(lián)網(wǎng)等領(lǐng)域上百多家企業(yè)打造了人工智能產(chǎn)品及解決方案。

第四范式成立以來一直致力于降低人工智能的應(yīng)用門檻,我們的企業(yè)愿景是讓 AI for everyone,讓每一個(gè)人都能擁有駕馭人工智能的能力,正是基于這樣的一個(gè)企業(yè)愿景,我們?cè)诓痪们皩?duì)外免費(fèi)開放了我們的智能客服平臺(tái)(https://bot.) ,這是業(yè)界首個(gè)免費(fèi)的智能客服平臺(tái),僅需 2 分半鐘即可完成接入。自免費(fèi)對(duì)外發(fā)布以來,半個(gè)月時(shí)間已經(jīng)有上千家客戶在使用。今天這個(gè)話題也是圍繞智能客服的技術(shù)來展開。

其次是做一個(gè)簡(jiǎn)單的自我介紹。

我在第四范式做智能客服的研發(fā),畢業(yè)于北京航空航天大學(xué),大約有 15 年左右的研發(fā)經(jīng)驗(yàn),涉獵的領(lǐng)域也比較廣泛:有對(duì)話系統(tǒng)、智能客服、自然語言處理、機(jī)器學(xué)習(xí)等。我最早是在 IBM Jazz 技術(shù)平臺(tái)上的工程師,后來去了環(huán)信做智能客服的負(fù)責(zé)人,曾經(jīng)帶領(lǐng)團(tuán)隊(duì)研發(fā)了環(huán)信的智能客服系統(tǒng)。目前我在第四范式主持智能客服的研發(fā)工作,帶領(lǐng)團(tuán)隊(duì)研發(fā)了智能客服開放平臺(tái)。

今天分享的提綱主要是分為四個(gè)部分,希望通過分享我在智能客服領(lǐng)域的經(jīng)驗(yàn),對(duì)各位開發(fā)者對(duì)理解和應(yīng)用這個(gè)技術(shù)有一定幫助。


  • 第一部分是簡(jiǎn)單的描述一下智能客服產(chǎn)生的背景、歷史、應(yīng)用場(chǎng)景、發(fā)展現(xiàn)狀等;

  • 第二部分介紹一下智能客服的一般的工作流程,主要的技術(shù)模塊和工作原理等;

  • 第三部分跟大家分享一下整個(gè)智能客服的研發(fā)過程中所遇到的一些技術(shù)難點(diǎn);

  • 第四部分分享一下第四范式在智能客服的研發(fā)過程中所做的一些工作,以及遇到的一些問題,我們的技術(shù)特點(diǎn),產(chǎn)品特點(diǎn),研發(fā)現(xiàn)狀和未來的方向等。

智能客服技術(shù)概述

我們首先開始第一個(gè)部分的分享,第一部分是智能客服技術(shù)概述。

首先是智能客服產(chǎn)生的背景:為什么要有智能客服這樣的一個(gè)產(chǎn)品,或者說研究方向呢?主要有以下這幾個(gè)原因:


  • 我們?nèi)粘I钪袝?huì)遇到大量的客服問題,比如說你打電話給聯(lián)通、移動(dòng)等,或者說在淘寶上買東西,這些問題大部分都是一些重復(fù)的問題,而且頻率也特別高,非常的耗人工;

  • 對(duì)于一個(gè)客服密集型的企業(yè)來說,大量的人工客服,造成了企業(yè)的客服成本非常的高;

  • 人工客服是沒有辦法做到 24 小時(shí)全天候的服務(wù);

  • 在客戶和客服的對(duì)話的過程中產(chǎn)生了大量的有價(jià)值的數(shù)據(jù),這些數(shù)據(jù)也沒有被很好的利用起來。

基于以上的這些原因,我們就會(huì)產(chǎn)生一個(gè)想法:能不能有一個(gè)機(jī)器人來回答這些重復(fù)的問題,它能 24 小時(shí)的工作不用休息,降低客戶成本,還能挖掘聊天記錄里面的一些有價(jià)值的知識(shí)點(diǎn)。這就是智能客服產(chǎn)生的背景。

那智能客服的這個(gè)市場(chǎng)規(guī)模大致有多大呢?我們沒有辦法知道一個(gè)準(zhǔn)確的估計(jì),但是我們可以從一些第三方的調(diào)研報(bào)告里面得出一些大致的判斷,估算一下它的市場(chǎng)規(guī)模:

這是一個(gè)第三方在 2016 年做的 2017 年 SaaS 客服的一個(gè)市場(chǎng)規(guī)模預(yù)測(cè),它預(yù)測(cè) 2017 年 SaaS 客服的市場(chǎng)規(guī)模將達(dá)到 680 億人民幣。SaaS 客服只是客服中一種,除了 SaaS 客服之外還有企業(yè)自建的客服,還有私有部署的客服等等。假如說智能客服可以解決 30% 的客服的問題,這還只是一個(gè)非常保守的估計(jì),智能客服的市場(chǎng)規(guī)模也是非常大的。

接下來我們看一下如果說要做一個(gè)智能客服,那做智能客服的一個(gè)基本的目標(biāo),或者說它的技術(shù)目標(biāo)是要做到什么樣的程度呢?它是要完全的替代人工,還是要部分的替代人工呢?

一般情況下,一個(gè)智能客服的目標(biāo)就是我們這張圖里描述的這些:一個(gè)客服的機(jī)器人負(fù)責(zé)回答客戶的一些高頻簡(jiǎn)單問題,將疑難問題交給人工客服團(tuán)隊(duì)來回答。那這個(gè)一定比例是多大比例呢?我這邊寫了一個(gè)百分之 X,也就是說這個(gè)比例不太確定,它是根據(jù)不同的場(chǎng)景以及不同的技術(shù)條件,不同廠商的技術(shù)能力而不同的,有的廠商是 80%,有的是 90%,有的甚至 95%,這都是不確定的。

總之智能客服做的一個(gè)技術(shù)目標(biāo)就是:一定比例的解決客服的簡(jiǎn)單的高頻問題,將疑難問題仍然交給人工客服團(tuán)隊(duì)。這是目前智能客服一個(gè)基本的技術(shù)目標(biāo),是一個(gè)比較現(xiàn)實(shí)的目標(biāo)。那么想讓客服的機(jī)器人來完全取代人工客服,這個(gè)目標(biāo)到目前為止,在絕大部分場(chǎng)景下還是沒有辦法實(shí)現(xiàn)的。

不過到現(xiàn)在為止,整個(gè)智能客服系統(tǒng)的發(fā)展非常快,應(yīng)用也劃分了很多的細(xì)分領(lǐng)域。這個(gè)不一定是一個(gè)完全準(zhǔn)確的分類,只是說從我個(gè)人角度來講,它可能是大致能分為這么幾類。

第一大類是對(duì)話操作系統(tǒng)級(jí)別的系統(tǒng)。那么這一類系統(tǒng)比較有代表性的有亞馬遜的 Alexa,這些系統(tǒng)都希望做操作系統(tǒng)級(jí)別的人機(jī)對(duì)話,就是把人機(jī)對(duì)話直接做成一個(gè)操作系統(tǒng),那在這個(gè)系統(tǒng)上開發(fā)各種各樣不同的智能硬件、軟件等等這些應(yīng)用。

第二大類,就是智能客服,智能客服里面又細(xì)分成兩類:一類是企業(yè)內(nèi)部的智能客服,為了企業(yè)自身的業(yè)務(wù)發(fā)展需要研發(fā)的智能客戶系統(tǒng);還有一類是對(duì)外服務(wù)的智能客服,并且以 SaaS 的方式對(duì)外服務(wù)。

第三大類就是個(gè)人助理類,最有名的就是蘋果的 Siri,還有微軟的 Cortana 等。智能家居現(xiàn)在做得比較火熱的就是一些智能音箱,比如說亞馬遜 Echo 等。還有些公司是做一些智能交互的服務(wù),這些智能交互服務(wù)主要是自然語言處理和意圖識(shí)別方面的服務(wù),其他的廠商可以基于這些智能交互服務(wù)做一些自己的應(yīng)用。

另外還有一些教育類的教育機(jī)器人,知識(shí)問答類的機(jī)器人和開放領(lǐng)域聊天類的機(jī)器人。

最后一類是開放平臺(tái),這個(gè)開放平臺(tái)也可以叫 Bot Factory,比較有代表性的,有 Google 的 API.AI、Facebook 的 Wit.AI、還有微軟的 Luis.AI 等等。這些開放平臺(tái)主要是做任務(wù)對(duì)話方面的一些定制。

在以上多個(gè)細(xì)分領(lǐng)域的應(yīng)用中,智能客服系統(tǒng)最常見的功能有哪些?目前最常見的形式是在人工客服系統(tǒng)基礎(chǔ)上,擴(kuò)展出智能客服的功能,最常見的功能有 單輪問答、功能對(duì)話和人機(jī)協(xié)作


  • 單輪問答,單輪問答就是說,一問一答,但是沒有記錄上下文,每一次問答和下一次問答都沒有任何的關(guān)系;


  • 多輪對(duì)話,意思是說,是帶著上下文來問答,每個(gè)問答可能跟它的上文是有一定關(guān)系,或者是它記錄了上文的一些信息;


  • 人機(jī)協(xié)作,人機(jī)協(xié)作是一種比較有效的一種智能客服功能,現(xiàn)有的方式主要有兩大類:一類是機(jī)器人加人工進(jìn)行問答,另外一大類是機(jī)器人推薦答案,人工選擇回答 。

那么機(jī)器人和人工如何進(jìn)行協(xié)作呢?我們這里舉幾個(gè)例子:比如說上班的時(shí)候人工來回答,下班的時(shí)候機(jī)器人來回答;普通的客戶機(jī)器人來回答,VIP 客戶人工來回答;或者是說分渠道來選擇,比如說微信渠道來的機(jī)器人回答,手機(jī)渠道來的人工回答;還有就是機(jī)器人優(yōu)先,機(jī)器人答不出來,轉(zhuǎn)給人工回答。

當(dāng)然并不限于我們?cè)谶@里舉出的這幾個(gè)例子,還可以根據(jù)業(yè)務(wù)需求,定制復(fù)雜策略:機(jī)器人推薦答案給人工,人工客服來選擇和編輯答案、或者給出另外一個(gè)答案,機(jī)器人在這里起到了一個(gè)人工客服小助理的角色,這也是最常見的人機(jī)協(xié)作方式。

智能客服工作原理

剛才我們是給智能客服做了一個(gè)概述。接下來,我們介紹一下智能客服的工作原理。

一個(gè)常見的智能客服,就包括以下這些模塊并且按照一個(gè)類似的流程進(jìn)行工作。

首先可能會(huì)有一個(gè) ASR(語音識(shí)別)模塊,也可能沒有,這取決于具體廠商的一個(gè)選擇,這個(gè)語音識(shí)別模塊會(huì)把語音轉(zhuǎn)換成文字。

如果沒有語音識(shí)別模塊,直接就是文字,會(huì)首先對(duì)這個(gè)文字做一個(gè)問句的理解,或者說做一個(gè)查詢的理解,理解完以后,再對(duì)意圖做一個(gè)識(shí)別;最后,我們把這個(gè)問句的理解和意圖識(shí)別的結(jié)果帶到對(duì)話管理系統(tǒng)里邊,對(duì)話管理系統(tǒng)會(huì)決定到底是給哪一種機(jī)器人發(fā)過去,這些機(jī)器人最后給出答案,將答案返回。

對(duì)話管理系統(tǒng)可以選擇一個(gè)機(jī)器人將問題發(fā)過去,也可以同時(shí)將問題發(fā)給所有的機(jī)器人,當(dāng)它們都回復(fù)答案時(shí),進(jìn)行答案選擇再返回,使用哪種方式取決于廠商自己的一個(gè)選擇。

上圖中這四種機(jī)器人分別對(duì)應(yīng)了四種不同的模塊:

第一種是任務(wù)管理類的模塊,比如說訂機(jī)票,它屬于一個(gè)特定的任務(wù),這種機(jī)器人就類似蘋果的 Siri,是任務(wù)處理類;

第二種是知識(shí)庫問答,也就是咨詢問答類的,只是做一些咨詢類的工作,一般情況下,它并不處理實(shí)際的一些任務(wù);

第三類是知識(shí)圖譜問答,知識(shí)圖譜是知識(shí)庫常見的是提供一個(gè)問答對(duì)結(jié)構(gòu)和一個(gè)樹型結(jié)構(gòu),知識(shí)圖譜提供一個(gè)圖結(jié)構(gòu),可以認(rèn)為是一個(gè)廣義上的知識(shí)庫問答。

第四類是聊天機(jī)器人的技術(shù),聊天并不是客服的首要功能,客服主要是解決問題的,不是來聊天的,為什么在一個(gè)智能客服系統(tǒng)里面會(huì)有聊天這么一個(gè)功能呢?原因在于,一是在用戶沒有輸入知識(shí)庫內(nèi)容的時(shí)候,這個(gè)聊天機(jī)器人會(huì)被客戶當(dāng)成是測(cè)試廠商機(jī)器人技術(shù)能力的評(píng)測(cè)對(duì)象;二是在某些場(chǎng)景下,會(huì)讓整個(gè)客服對(duì)話沒那么單調(diào)。在實(shí)際的智能客服系統(tǒng)里面,一般也可以選擇讓用戶可以關(guān)閉聊天功能。

接下來我們把這張圖展開,一個(gè)模塊一個(gè)模塊的講,因?yàn)橐话愫芏嗫蛻糁饕€是使用文字客服,語音識(shí)別屬于另外的一個(gè)領(lǐng)域了,所以我們這里暫時(shí)不展開語音識(shí)別的內(nèi)容。

自然語言理解主要做一些什么事情呢?比如說用戶的問題如果是多句話,那么我們做一個(gè)“分句”,對(duì)每一句話來尋找答案,最后呢,將答案組合起來,發(fā)給用戶;“分詞”很常見,分詞后才能理解,才能進(jìn)行標(biāo)注,進(jìn)行實(shí)體識(shí)別,這是常規(guī)的一些處理,然后就是句法分析、指代消解,再有就是詞權(quán)重、語義相似度等等,做這些分析都是為后面的算法做準(zhǔn)備,這是第一部分的預(yù)處理工作,就是自然語言理解或者自然語言處理的內(nèi)容。

第二部分的預(yù)處理工作就是意圖識(shí)別。意圖識(shí)別主要是用戶的這句話暴露了用戶什么樣的意圖,比如說我們這個(gè)例子里:“今天天氣怎么樣”,這個(gè)意圖實(shí)際上就是用戶要問天氣。那么如果用戶說“幫我定一張去上海的機(jī)票”,這個(gè)意思就是用戶要訂機(jī)票。

那么意圖識(shí)別一般是怎么實(shí)現(xiàn)的?就是有模板和分類器兩種方式。模板的方式,比如說:“北京今天天氣怎么樣?”我們會(huì)建一個(gè)叫“city”的詞典,這里面會(huì)有北京、上海、天津等城市;我們會(huì)把今天、明天、后天等等也做一個(gè)詞典,詞典名字叫做“date”。這樣如果滿足剛開始有一個(gè)“city”,中間有任意字符串,然后再有一個(gè)“date”,然后再有“天氣”這個(gè)詞,就滿足了一個(gè)模板,那么我們基本上可以認(rèn)為它是一個(gè)詢問天氣怎么樣的意圖,這是模板的方法。

分類器的方法很容易理解,我們?cè)谀骋粋€(gè)特定領(lǐng)域里面收集大量語料,人工去標(biāo)注這些語料是屬于哪種意圖的,用分類器模型來做一些二分類或者多分類的分類器,用來判斷意圖。但是分類器方法需要大量人工標(biāo)注的數(shù)據(jù),以及如何去收集多個(gè)領(lǐng)域里面的語料的問題。

接下來整個(gè)系統(tǒng)里面就進(jìn)入了功能模塊。我們先看功能模塊的第一個(gè)最常見的模塊,這也是智能客服系統(tǒng)里面常見的一個(gè)功能,就是知識(shí)庫問答的功能。

知識(shí)庫問答的技術(shù)本質(zhì)也是用一些跟搜索引擎相似的技術(shù),分為兩個(gè)階段:第一個(gè)階段是侯選集召回,第二個(gè)階段是重排序。

首先是侯選集,侯選集召回有很多種方式,和搜索引擎相比,相對(duì)簡(jiǎn)單,原因是搜索引擎要召回的量特別的大,但是知識(shí)庫,因?yàn)槭侨斯?dǎo)入的,它的召回的就沒有那么復(fù)雜。

第二是重排序,其實(shí)我們可以用文本相似度、檢索相關(guān)度,如果有足夠數(shù)據(jù)的話,還可以用神經(jīng)網(wǎng)絡(luò)的語義相似度等,來做重排序工作。這些工作也可以用多模型融合的方式來做,將多個(gè)模型的結(jié)果綜合考慮得到最終結(jié)果。這些都跟搜索引擎的技術(shù)沒有特別本質(zhì)的區(qū)別,也會(huì)有些微小的差別,這是知識(shí)庫這塊的工作。

接下來是跟知識(shí)庫比較相關(guān)的一種工作,知識(shí)圖譜問答。

知識(shí)圖譜問答最難的一點(diǎn)在于數(shù)據(jù)的整理,其次是工具方面。有很多開源的工具,我們列出來這幾種(見上圖),大家也可以自己去研發(fā)一些知識(shí)圖譜的工具。

假設(shè)我們解決了數(shù)據(jù)來源和更新的問題,同時(shí)也有了工具,接下來要做的事情就是查詢轉(zhuǎn)換的工作。

因?yàn)橐话愕闹R(shí)圖譜工具都會(huì)有一些自己的查詢語言,那么我們所要做的工作實(shí)際上就是把自然語言通過某種方式轉(zhuǎn)換成知識(shí)圖譜的工具所支持的查詢語言。

查詢轉(zhuǎn)換也有常見的兩種方式,一種是可以用模板,做一些查詢轉(zhuǎn)換的工作;如果有足夠多的數(shù)據(jù),也可以用機(jī)器翻譯的方式來做。

這里還有一些我們自己的系統(tǒng)支持的知識(shí)圖譜問答的例子。我們現(xiàn)在的系統(tǒng)已經(jīng)具備了通用知識(shí)圖譜的能力,行業(yè)知識(shí)圖譜或者自定義的知識(shí)圖譜很快會(huì)上線。大家就可以看到,這是第二個(gè)模塊,知識(shí)庫和知識(shí)圖譜可以整合成一個(gè)模塊來做,統(tǒng)稱為知識(shí)庫問答。

那么第三大塊就是對(duì)話技術(shù)。對(duì)話技術(shù)就是我們前面所說的任務(wù)對(duì)話等等,比較典型的有三大類:

第一大類是一種用狀態(tài)機(jī),或者和狀態(tài)機(jī)類似的填槽方式。這種方式的主要特點(diǎn)是將整個(gè)的對(duì)話過程抽象成一個(gè)有限狀態(tài)機(jī),每一輪對(duì)話,或者每幾輪作為一種狀態(tài),隨著對(duì)話狀態(tài)的進(jìn)行,這個(gè)狀態(tài)機(jī)在不斷的遷移,最終對(duì)話結(jié)束,狀態(tài)機(jī)也結(jié)束。這里面的所有狀態(tài),以及所要執(zhí)行的動(dòng)作都是事先約定好的,所以狀態(tài)機(jī)它比較適合一些場(chǎng)景簡(jiǎn)單的對(duì)話,對(duì)于場(chǎng)景復(fù)雜的對(duì)話,狀態(tài)機(jī)這種方式就已經(jīng)不太適應(yīng)了。

第二大類就是馬可夫決策過程(Markov Decision Process, MDP)的方式,它和狀態(tài)機(jī)的區(qū)別在于它里面增加了動(dòng)作,狀態(tài)機(jī)里面的動(dòng)作是我們事先約定好的,是固定的動(dòng)作,已經(jīng)事先知道對(duì)話到了那時(shí)候,于是就固定的采取這樣的動(dòng)作,但是 MDP 這種方式,狀態(tài)不確定,動(dòng)作也不確定,所以說我的狀態(tài)和動(dòng)作是需要根據(jù)我的上一個(gè)狀態(tài)和將要采用的動(dòng)作做了以后的回饋(Reward)來進(jìn)行決策的,所以說這個(gè)決策過程在特定領(lǐng)域里有足夠的語料的時(shí)候可以做出很好的效果,但是我們得想辦法去找到合適的領(lǐng)域,以及找到足夠的語料才能做這樣的事情。

最后一類是端到端的模型。端到端的模型主要出發(fā)點(diǎn)是:我有一個(gè)問題,把問題輸入到一個(gè)模型里面之后,這個(gè)模型是幫我解決了我們之前整個(gè)對(duì)話過程所有流程的所有問題,而這個(gè)模型是需要從數(shù)據(jù)里面去學(xué)習(xí),包括自然語言處理、意圖識(shí)別,包括整個(gè)系統(tǒng)里面方方面面的各種東西都要學(xué)習(xí)到。這個(gè)模型對(duì)于我們來說它是個(gè)黑盒,我給它一個(gè)問題,它也能給我答案,我并不需要仔細(xì)的去研究里面是怎么做得,我只需要設(shè)計(jì)訓(xùn)練這么一個(gè)模型就行了。

那么這三種方式是現(xiàn)在的比較常見的三類對(duì)話技術(shù),第一大類,像狀態(tài)機(jī)和填槽這一類是商用系統(tǒng)的主流;第二大類是學(xué)術(shù)界的主流,但是工業(yè)界也在積極的嘗試,有的也已經(jīng)落地,或者接近落地;端到端這種模型,主要還是停留在學(xué)術(shù)界的研究階段,我并沒有看到哪一個(gè)商業(yè)系統(tǒng)已經(jīng)做到了端到端的模型的產(chǎn)品化,還沒有成為商用主流的技術(shù)。

左上角是一個(gè)狀態(tài)機(jī)示意圖,右下角是一個(gè) MDP 模型示意圖。

最后一個(gè)模塊,就是聊天機(jī)器人。

在智能客服系統(tǒng)里面通常都會(huì)有聊天機(jī)器人的模塊。這個(gè)模塊主要有兩種做法:

第一種就是檢索式,比如答案是事先編輯好的,并不會(huì)隨便生成,在檢索式里面又會(huì)分為兩大類:第一類是用大量的語料和模型來訓(xùn)練,收集大量的語料,把問題和答案給一個(gè)神經(jīng)網(wǎng)絡(luò)的模型,用這個(gè)模型幫我去找到問題和答案之間的相關(guān)度,這樣的話,就能夠用大量的語料訓(xùn)練出聊天機(jī)器人模型,這是最常見的一種方式;

第二種方式是基于規(guī)則來做,使用類似于之前介紹過的 Alice 機(jī)器人所用到的 AIML 標(biāo)記語言,寫大量的 pattern,以及在這個(gè) pattern 下所需要的答案,寫大量這樣的人工規(guī)則就可以做一個(gè)檢索式的機(jī)器人,但是這僅限于少量的小規(guī)模應(yīng)用,如果需要編輯大量的規(guī)則,規(guī)則之間可能會(huì)有沖突等問題,所以主流的這種聊天機(jī)器人的方式是我們說到的第一種,用統(tǒng)計(jì)模型和大量的語料來訓(xùn)練聊天機(jī)器人。

第二種是生成式的聊天機(jī)器人,我需要把我的答案直接生成出來,這種方式是需要限定在一定的領(lǐng)域里面。開放領(lǐng)域里直接生成式的聊天機(jī)器人會(huì)有一些敏感詞的問題,因?yàn)檎Z料一般是網(wǎng)上收集的,想做到所有語料都人工審核成本是巨大的。所以說生成式需要把它限定在一個(gè)特定的領(lǐng)域里面,生成式分為兩種:一種是純粹的生成,一種是基于一些模板來生成。

基于一些模板來生成,是說對(duì)答案事先定制好一些模板,生成的答案只是在模板里填空,這樣的話就能控制答案;第二種生成是純粹的生成式,但是只能把它用在特定的一些場(chǎng)景下,并不用它來做全開放的聊天機(jī)器人答案的生成,只能夠用它來做一些限定領(lǐng)域的,比如對(duì)聯(lián)的生成、古詩詞的生成等,這些風(fēng)險(xiǎn)相對(duì)較小。

講到這里,我們基本上已經(jīng)把最開始的那張流程圖里的所有的技術(shù)點(diǎn)講的差不多了。

智能客服的技術(shù)難點(diǎn)

第三部分就是跟大家一起探討一下智能客服的技術(shù)難點(diǎn):我們?cè)谧鲋悄芸头@樣的一個(gè)系統(tǒng)的時(shí)候,可能會(huì)遇到哪些的技術(shù)難點(diǎn)?主要有這么幾類:

第一個(gè)難點(diǎn)是:數(shù)據(jù)冷啟動(dòng)的問題

數(shù)據(jù)冷啟動(dòng)就是說在絕大多數(shù)情況下,我們實(shí)際上是沒有足夠的數(shù)據(jù)來訓(xùn)練模型的,這個(gè)時(shí)候,我們?cè)趺醋觯?/p>

在面對(duì)這種數(shù)據(jù)冷啟動(dòng)的問題,很多模塊的設(shè)計(jì)里面都會(huì)考慮怎么樣去在缺少數(shù)據(jù)的情況下把這個(gè)事情做起來,大致有兩種辦法:一是先用一個(gè)通用的模型,等到數(shù)據(jù)足夠多的時(shí)候優(yōu)化這個(gè)模型;第二種是先用規(guī)則的方法做,先把這個(gè)模塊做起來,等到數(shù)據(jù)足夠多的時(shí)候,再來啟用模型的方法,這兩種方法都可以走的通,但是要根據(jù)具體的情況來具體分析。

第二個(gè)難點(diǎn)是:多輪對(duì)話的問題

尤其是多領(lǐng)域的對(duì)話,多領(lǐng)域的多輪對(duì)話仍然是一個(gè)難題。在一個(gè)單領(lǐng)域里面,我可以把對(duì)話技術(shù)做得很好,比如說像最簡(jiǎn)單的訂機(jī)票可以做得很好。但是如果說在很多不同的領(lǐng)域里面,這邊是訂機(jī)票、查物流、那邊又是去做一些其他的什么電商相關(guān)的事情,這個(gè)多領(lǐng)域的對(duì)話怎么辦?我們是沒有辦法在多個(gè)領(lǐng)域都拿到足夠的數(shù)據(jù),在這種情況下多輪對(duì)話是一個(gè)比較困難的問題。

第三個(gè)難點(diǎn)是:人機(jī)協(xié)作

人機(jī)協(xié)作這塊現(xiàn)有的方式前面已經(jīng)提到過了,現(xiàn)有的方式實(shí)際上沒有辦法最大化機(jī)器人的價(jià)值,也就是說機(jī)器人在整個(gè)智能客服的系統(tǒng)里面它起的仍然是一個(gè)輔助的作用,而不是主要的作用。

為了發(fā)揮這個(gè)機(jī)器人的作用,我們需要去探索一些新的方式,比如說我們能不能做到人為輔助,然后機(jī)器人來主要回答這個(gè)用戶的問題呢?這也是我們現(xiàn)在正在研究的一個(gè)新的方向,對(duì)于這些技術(shù)難點(diǎn)其實(shí)我們也可以共同來討論有什么樣的解決方案。

第四范式智能客服

那剛才我們講了很多,一個(gè)智能客服系統(tǒng),它是需要什么樣的能力呢?總結(jié)一下:

  • 首先需要有自然語言處理的能力,一個(gè)智能客服系統(tǒng)其本質(zhì)就是一個(gè)自然語言的對(duì)話系統(tǒng)。而機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等都只是實(shí)現(xiàn)自然語言對(duì)話系統(tǒng)的手段。

  • 其次要有意圖識(shí)別的能力,要有一些知識(shí)庫問答、知識(shí)圖譜問答、任務(wù)型對(duì)話等能力。一般情況下,還需要對(duì)智能客服系統(tǒng)提供聊天的功能,這才是一個(gè)比較完整的智能客服系統(tǒng)。

然而對(duì)于企業(yè)級(jí)開發(fā)者來說,智能客服的接入是有一定的門檻的。實(shí)際上,開發(fā)一套智能客服系統(tǒng),需擁有自然語言處理、意圖識(shí)別、知識(shí)圖譜、單輪 / 多輪對(duì)話等引擎作為支撐,其中涉及自然語言處理、語義相似度、狀態(tài)機(jī)、高維機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等諸多底層算法…… 這樣的門檻讓很多沒有人工智能人才與技術(shù)儲(chǔ)備的企業(yè)難以獲得智能客服。此外,現(xiàn)有的很多智能客服系統(tǒng)都是封閉的,你并不了解它里面是怎么工作的,它也不會(huì)去向外開放,這就讓用戶沒有辦法在它上面做二次開發(fā)。

為了改變這種行業(yè)困境,第四范式研發(fā)了智能客服的開放平臺(tái),幫助企業(yè)級(jí)開發(fā)者零成本、零門檻地搭建自己的智能客服系統(tǒng)。

首先看一下第四范式智能客服的一個(gè)概念圖:

我們會(huì)有基礎(chǔ)服務(wù)層,基礎(chǔ)服務(wù)層里面會(huì)有自然語言理解的各種服務(wù),因?yàn)檫@是我們系統(tǒng)的一個(gè)示意圖,所以它里面只寫了很少的幾個(gè)部分,實(shí)際上我們所做的遠(yuǎn)遠(yuǎn)不只這 5 個(gè)部分,自然語言理解有很多的事情,我們都做了。第二個(gè)是意圖識(shí)別的服務(wù),這兩個(gè)作為一個(gè)基礎(chǔ)服務(wù)層為上層的功能模塊來服務(wù)。

再往上就是四個(gè)功能模塊:任務(wù)對(duì)話、知識(shí)庫、知識(shí)圖譜,還有聊天機(jī)器人。在這之上是全渠道低門檻接入,我們現(xiàn)有五個(gè)渠道,后面還會(huì)擴(kuò)展更多的渠道,是一個(gè)真正的全渠道接入的智能客服。

還有一點(diǎn),有一個(gè)反饋?zhàn)詫W(xué)習(xí)層,這個(gè)反饋?zhàn)詫W(xué)習(xí)是根據(jù)客戶對(duì)答案的反饋,以及人工客服對(duì)答案的反饋進(jìn)行自我學(xué)習(xí),一是調(diào)整、問答質(zhì)量,二是對(duì)知識(shí)庫做一些生成。

圖中是我們所提供的四個(gè)功能模塊。我想重點(diǎn)想講一下我們整個(gè)產(chǎn)品有什么樣的特點(diǎn):

第一個(gè)特點(diǎn)就是針對(duì)之前講的,客戶覺得接入門檻高的問題,我們?nèi)蓝际欠昼娂?jí)接入,現(xiàn)有的渠道(APP、微信公眾號(hào)、Web 端、微博等),以及未來的一些渠道都可以在幾分鐘之內(nèi)快速接入,就是讓用戶快速的擁有智能的能力;

其次我們有一個(gè)自學(xué)習(xí)的模塊,自學(xué)習(xí)就是我前面所提到的,它在整個(gè)過程中會(huì)去學(xué)習(xí)一些反饋,這些反饋達(dá)到一定量的時(shí)候它會(huì)反映在這個(gè)問答的結(jié)果上,或者說對(duì)知識(shí)庫做一些調(diào)整;

再次,我重點(diǎn)想講一下開放平臺(tái),首先我們的智能客服產(chǎn)品是一個(gè)免費(fèi)的 SaaS 服務(wù),它的基礎(chǔ)服務(wù)是永久免費(fèi)的,如果一家公司想要使用我們的智能客服系統(tǒng),并且它的需求在我們的研發(fā)計(jì)劃之內(nèi),那么它可以永久免費(fèi)的使用我們的服務(wù)。

那么為什么我們要做這樣一個(gè)免費(fèi)的開放平臺(tái)呢?第四范式的企業(yè)愿景是把 AI 的能力賦能給企業(yè)客戶甚至是個(gè)人。因此我們希望做一個(gè)開放平臺(tái),允許企業(yè)的開發(fā)者、甚至是第三方的廠商,在這個(gè)已經(jīng)很成熟的基礎(chǔ)的技術(shù)平臺(tái)上,做出自己企業(yè)需要的智能客服系統(tǒng),或者做出自己細(xì)分領(lǐng)域的解決方案,只有這樣,智能客服這個(gè)市場(chǎng)需求量極大的技術(shù)才能真正遍地開花。

接下來這三張圖是通過不同的接入方式接入以后的實(shí)例:

下面兩張圖分別是安卓的手機(jī)接入和 IOS 的手機(jī),因?yàn)榘沧亢?IOS 采用的是 SDK。它最典型的場(chǎng)景是集成完以后,在這個(gè)手機(jī) APP 上點(diǎn)一個(gè)類似于“聯(lián)系客服”這樣一個(gè)按鈕,就會(huì)出現(xiàn)下圖中這樣的一個(gè)聊天窗口,用戶就可以和機(jī)器人對(duì)話。

最后再分享一下第四范式智能客服的開放平臺(tái)網(wǎng)址:

鏈接:https://bot.

建議用 Google 瀏覽器打開。

今天的分享就到此結(jié)束了。非常感謝大家的時(shí)間,謝謝。

 講師介紹

邢少敏,第四范式智能客服負(fù)責(zé)人 & 資深數(shù)據(jù)科學(xué)家,畢業(yè)于北京航空航天大學(xué),獲博士學(xué)位。15 年研發(fā)經(jīng)驗(yàn),對(duì)話系統(tǒng)、智能客服領(lǐng)域?qū)<遥谧匀徽Z言處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、互聯(lián)網(wǎng)系統(tǒng)技術(shù)架構(gòu)等領(lǐng)域擁有豐富經(jīng)驗(yàn)。前 IBM 資深工程師,IBM Jazz 技術(shù)平臺(tái)核心工程師。前環(huán)信智能客服技術(shù)負(fù)責(zé)人,從 0 開始帶領(lǐng)團(tuán)隊(duì)研發(fā)了環(huán)信智能客服系統(tǒng)。目前主持第四范式智能客服的研發(fā)工作,帶領(lǐng)團(tuán)隊(duì)開發(fā)了智能客服開放平臺(tái)。


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    主站蜘蛛池模板: 国产精品va在线观看老妇女| 国产成人无码av一区二区| 337p日本欧洲亚洲大胆色噜噜| 天天av天天av天天透| 国产又黄又爽又猛免费视频播放| www国产成人免费观看视频| 在线人成视频播放午夜福利| 亚洲熟女片嫩草影院| 亚洲最新版av无码中文字幕一区| 精品熟女碰碰人人a久久| 亚洲色中文字幕无码av| 欧美性欧美巨大黑白大战| 国产一性一交一伦一a片| 国产在线精品一区二区三区| 麻豆国产av穿旗袍强迫女佣人| 亚洲欧洲精品成人久久曰影片| 国产精品内射久久久久欢欢| 亚洲精品乱码久久久久久日本麻豆| 精品欧洲av无码一区二区14| 男女肉粗暴进来动态图| 上司人妻互换hd无码| 国产成人av在线播放不卡| 国产精品国产三级国产剧情| 亚洲最大的成人网| 无码人妻熟妇av又粗又大| 狠狠爱五月丁香亚洲综合| 精品女同一区二区| 国产99re热这里只有精品| 无码专区aaaaaa免费视频| 欧美精品一区二区a片免费| 久久国产午夜精品理论片34页| 中文无码制服丝袜人妻av| 成人无码影片精品久久久| 四虎永久在线精品视频| 青青草99久久精品国产综合| 天天影视网色香欲综合网| 久久精品无码一区二区日韩av| 亚洲国产成人综合一区二区三区| 无码av不卡免费播放| 亚洲精品美女久久久久99| 天天躁夜夜躁av天天爽|