校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁(yè) > 知識(shí)庫(kù) > 淺談智能問答機(jī)器人如何識(shí)別你的意圖

淺談智能問答機(jī)器人如何識(shí)別你的意圖

熱門標(biāo)簽:福州哪里有羿智云外呼系統(tǒng) 海北高德地圖標(biāo)注位置怎么弄 什么通電話機(jī)器人 電銷機(jī)器人是不是不用那么累了 西安美食地圖標(biāo)注 閑魚地圖標(biāo)注店名 河南精確外呼管理系統(tǒng) 來(lái)安百度地圖標(biāo)注 電話外呼營(yíng)銷平臺(tái)系統(tǒng)
  任務(wù)型對(duì)話系統(tǒng)主要包括自然語(yǔ)言理解、對(duì)話管理和對(duì)話生成。其中,自然語(yǔ)言理解指的是分析識(shí)別為文本的用戶輸入,得到用戶的意圖和輸入中的關(guān)鍵信息,包括領(lǐng)域、意圖識(shí)別、實(shí)體識(shí)別和槽的提取等。
  隨著自然語(yǔ)言處理技術(shù)的發(fā)展,一些新的方法運(yùn)用到了自然語(yǔ)言理解中,并取得了不錯(cuò)的效果。本文將針對(duì)意圖識(shí)別這部分,淺談在參與某項(xiàng)目中的一些經(jīng)驗(yàn)和思考。
  01.從規(guī)則到模型
  以往意圖識(shí)別主要采用規(guī)則系統(tǒng),規(guī)則系統(tǒng)的模板需要人工配置。
  例如,我們需要支持開空調(diào)的意圖,那么可以做如下的配置:
  意圖:開空調(diào)
  模板:(請(qǐng)|幫我)(打開|啟動(dòng))(這個(gè)|那個(gè))?(空調(diào)|冷風(fēng)機(jī))(啊|吧)?
  用戶輸入:幫我打開空調(diào),即可通過模板匹配到開空調(diào)意圖
  規(guī)則系統(tǒng)的優(yōu)點(diǎn)是可配置,如果需要增加支持的模板,只需在配置系統(tǒng)內(nèi)加入,這在線上產(chǎn)生重要遺漏時(shí)顯得尤為重要,能夠及時(shí)修復(fù)。缺點(diǎn)是復(fù)雜的語(yǔ)言表述需要更復(fù)雜的模板,再考慮到語(yǔ)言的隨意性,配置靈活的模板又會(huì)使規(guī)則系統(tǒng)接受很多本來(lái)沒有意圖的用戶輸入,降低規(guī)則系統(tǒng)的準(zhǔn)確率。
  基于機(jī)器學(xué)習(xí)的方法,可以一定程度上彌補(bǔ)這些問題,大幅提高召回率。規(guī)則系統(tǒng)結(jié)合機(jī)器學(xué)習(xí),在實(shí)際操作中是較為靈活的方案。
  02.無(wú)監(jiān)督方法
  傳統(tǒng)方法依賴特征工程,神經(jīng)網(wǎng)絡(luò)需要大量標(biāo)注,如何以較少的標(biāo)注數(shù)據(jù)獲得較好的模型效果成為了研究和實(shí)驗(yàn)重點(diǎn)。
  近年,自監(jiān)督學(xué)習(xí)的語(yǔ)言模型研究[1]獲得重大進(jìn)展,各種使用大規(guī)模文本語(yǔ)料庫(kù)預(yù)訓(xùn)練的模型層出不窮,這些預(yù)訓(xùn)練模型提供了強(qiáng)大的語(yǔ)義表征能力,使得一些無(wú)監(jiān)督方法重新煥發(fā)了活力,這里介紹一種使用語(yǔ)言模型+KNN[2]進(jìn)行意圖識(shí)別的方法
  該方法可以在沒有人工標(biāo)注的情況,快速建立預(yù)測(cè),同時(shí)獲得還不錯(cuò)的效果,在某場(chǎng)景中驗(yàn)證準(zhǔn)確率達(dá)到93%。
  03.有監(jiān)督樣本構(gòu)造
  當(dāng)面臨復(fù)雜語(yǔ)義場(chǎng)景或低容錯(cuò)時(shí),監(jiān)督學(xué)習(xí)值得嘗試。而對(duì)話場(chǎng)景的數(shù)據(jù)常常是匱乏、昂貴和敏感的,除了人工構(gòu)造和標(biāo)注以外,我們需要盡可能的尋找方法獲取標(biāo)注數(shù)據(jù)。
  有規(guī)則模板:對(duì)規(guī)則系統(tǒng)中的模板按照語(yǔ)法拆分,依據(jù)關(guān)鍵詞重要程度,采用笛卡爾積方式構(gòu)建樣本,這些樣本某種程度上可以用來(lái)作為baseline測(cè)試集。
  有大量無(wú)標(biāo)注對(duì)話語(yǔ)料:采用弱監(jiān)督方法,使用如Snorkel[3]的工具,基于知識(shí)庫(kù)、模板、字典、句法和專家規(guī)則等構(gòu)建推理邏輯,為無(wú)標(biāo)注數(shù)據(jù)打上概率標(biāo)簽。
圖片來(lái)源:Snorkel:Rapid Training Data Creation with Weak Supervision
  負(fù)樣本構(gòu)造:在某些場(chǎng)景中,包含了大量與業(yè)務(wù)意圖無(wú)關(guān)的對(duì)話,而訓(xùn)練語(yǔ)料通常只有正樣本,或者模型對(duì)某些詞過于敏感,模型對(duì)無(wú)意圖和意圖不明的對(duì)話會(huì)產(chǎn)生錯(cuò)誤的判斷,除常規(guī)閑聊語(yǔ)料的運(yùn)用,需要構(gòu)建無(wú)意圖的負(fù)樣本參與模型的訓(xùn)練和驗(yàn)證
  在實(shí)際操作中,可以基于正樣本的字或詞構(gòu)建一定區(qū)間長(zhǎng)度的隨機(jī)序列作為負(fù)樣本,也可以對(duì)字詞做一定篩選后構(gòu)建。同時(shí),對(duì)于multi-class為了不增加新的無(wú)意圖類別,可以將負(fù)樣本的標(biāo)簽概率化為1/n,在預(yù)測(cè)時(shí)設(shè)置最大類別概率閾值過濾。
  正樣本意圖向量:[0,0,1,0,0]
  弱監(jiān)督意圖向量:[0.1,0.2,0.5,0.1,0.1]
  負(fù)樣本意圖向量:[0.2,0.2,0.2,0.2,0.2]
  實(shí)驗(yàn)證明,通過加入隨機(jī)負(fù)樣本訓(xùn)練,對(duì)無(wú)序輸入文本的識(shí)別能提升50%:
  04.預(yù)訓(xùn)練模型微調(diào)
  使用預(yù)訓(xùn)練模型加任務(wù)微調(diào),現(xiàn)在幾乎成為各類NLP任務(wù)的標(biāo)配,僅僅需要較少標(biāo)注數(shù)據(jù)就能達(dá)到以往較多標(biāo)注數(shù)據(jù)的訓(xùn)練效果,在意圖分類中嘗試,同樣有較大提升。
  領(lǐng)域自適應(yīng)
  開源預(yù)訓(xùn)練模型大多基于百科、新聞等語(yǔ)料訓(xùn)練,屬于通用領(lǐng)域。而對(duì)話系統(tǒng)中的文本更加偏向口語(yǔ)化,那么在開源預(yù)訓(xùn)練模型上,加入領(lǐng)域數(shù)據(jù)繼續(xù)訓(xùn)練,進(jìn)行領(lǐng)域自適應(yīng)將變得十分必要。在無(wú)業(yè)務(wù)數(shù)據(jù)的情況下,可以使用開源對(duì)話數(shù)據(jù)來(lái)遷移,學(xué)習(xí)口語(yǔ)化的表征,使得模型更加匹配對(duì)話業(yè)務(wù)場(chǎng)景。
  性能優(yōu)化
  使用預(yù)訓(xùn)練模型微調(diào)盡管能取得較好的效果,但是由于其深層的網(wǎng)絡(luò)結(jié)構(gòu)和龐大的參數(shù)量,如果部署上線,將面臨資源和性能問題。對(duì)此一般做法是,在模型訓(xùn)練和推理中使用低精度,同時(shí)減少模型層數(shù)。近期google提出了一種輕量級(jí)ALBERT[4],通過兩種參數(shù)精簡(jiǎn)方法來(lái)提升推理性能,而效果依然達(dá)到了SOTA,目前已經(jīng)開源中文預(yù)訓(xùn)練模型,十分值得關(guān)注。
  05.學(xué)習(xí)意圖分布
  在某些場(chǎng)景,意圖會(huì)比較接近,常規(guī)的分類方法無(wú)法區(qū)分,一種思路[5]是將意圖類別和用戶輸入文本嵌入到相同向量空間,基于相似度進(jìn)行對(duì)比學(xué)習(xí),目標(biāo)函數(shù):
  • a是用戶輸入的文本
  • b是對(duì)應(yīng)的意圖,b^-從其他意圖中采樣獲取
  • sim(·,·)是相似度函數(shù),cosine或inner
  • L是目標(biāo)函數(shù),最大化正確樣本對(duì)相似度和最小化錯(cuò)誤樣本對(duì)相似度

# mu_pos: 0.8 (should be 0.0 … 1.0 for ‘cosine’) is how similar the algorithm should try to make embedding vectors for correct intent labels

# mu_neg: -0.4 (should be -1.0 … 1.0 for ‘cosine’) is maximum negative similarity for incorrect intent labels

# loss for maximizing similarity with correct action

loss = tf.maximum(0., mu_pos - sim_op[:, 0])

# minimize only maximum similarity over incorrect actions

max_sim_neg = tf.reduce_max(sim_op[:, 1:], -1) loss += tf.maximum(0., mu_neg + max_sim_neg)

# average the loss over the batch and add regularization losses

loss=(tf.reduce_mean(loss)+tf.losses.get_regularization_loss())

  這種思路有多種好處,能學(xué)習(xí)到意圖的向量表示,可以在預(yù)測(cè)時(shí)直接基于相似度排序輸出最大意圖;當(dāng)意圖類別較多時(shí),還能對(duì)意圖進(jìn)行歸類比較;同時(shí)這些向量表示也能作為特征用于其他任務(wù),如推薦等。
  06.少樣本學(xué)習(xí)冷啟動(dòng)
  目前少樣本學(xué)習(xí)在圖像領(lǐng)域非常火,用戶只需要上傳一張圖片,就可以遷移各種臉部表情和肢體動(dòng)作,引領(lǐng)一波社交應(yīng)用風(fēng)潮。
  在自然語(yǔ)言處理領(lǐng)域,這方面的嘗試還并不是很成功,阿里巴巴的小蜜團(tuán)隊(duì)在打造的智能對(duì)話開發(fā)平臺(tái)Dialog Studio中提出了少樣本學(xué)習(xí)方法Induction Network[6],并將該方法用于創(chuàng)建新的對(duì)話任務(wù)時(shí)意圖識(shí)別冷啟動(dòng),不過代碼并沒有開源。我們對(duì)論文中的方法進(jìn)行了復(fù)現(xiàn)并公布了代碼(github地址),在少樣本關(guān)系抽取數(shù)據(jù)集上進(jìn)行驗(yàn)證,歡迎fork和交流。
  通過積累線上數(shù)據(jù),迭代訓(xùn)練,常常是提升效果最大的方式,數(shù)據(jù)決定上限,長(zhǎng)遠(yuǎn)來(lái)講,構(gòu)建自動(dòng)化的迭代機(jī)制勢(shì)在必行。同時(shí),將多輪對(duì)話作為輸入,會(huì)有更多的探索空間。
  和美信息自然語(yǔ)言處理團(tuán)隊(duì)三年磨一劍,圍繞銀行智能化場(chǎng)景展開了多種探索并取得不錯(cuò)的成績(jī)。例如,某銀行項(xiàng)目中催收意圖識(shí)別服務(wù)于總行與分行,滲透率已超過70%,每天20萬(wàn)+人次的調(diào)用。新的一年,和美信息人工智能研究院自然語(yǔ)言處理組將繼續(xù)努力,圍繞自然語(yǔ)言訓(xùn)練平臺(tái)、智能對(duì)話工廠進(jìn)行展開,通過相關(guān)技術(shù)與業(yè)務(wù)人員緊密合作、快速迭代,將公司先進(jìn)技術(shù)與銀行智能化場(chǎng)景結(jié)合,實(shí)現(xiàn)快速落地應(yīng)用,未來(lái)將有更多AI產(chǎn)品加速銀行智能化轉(zhuǎn)型進(jìn)程,也歡迎各位志同道合的小伙伴加入一起探索未來(lái)!
  目前和美信息自然語(yǔ)言處理在銀行場(chǎng)景已落地:智能客服、智能搜索、合同文檔自動(dòng)解析、人崗精準(zhǔn)匹配、文檔查重、客戶意見分析、智能推薦、用戶畫像、輿情監(jiān)控與預(yù)警、報(bào)告摘要、報(bào)告生成、智能審閱等產(chǎn)品,服務(wù)各銀行業(yè)務(wù)部門。 參考文獻(xiàn):
[1]DevlinJ, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectionaltransformers for language understanding[J]. arXiv preprint arXiv:1810.04805,2018.
[2]CoverT, Hart P. Nearest neighbor pattern classification[J]. IEEE transactions oninformation theory, 1967, 13(1): 21-27.
[3]Alexander R,et al. Snorkel: Rapid Training Data Creation with Weak Supervision[J].Supervision[J].[J].arXiv:1711.10160,2017.
[4]Zhenzhong Lan,et al. ALBERT: A Lite BERT for Self-supervised Learning of Language Representations[J].arXiv:1909.11942,2019.
[5]Ledell Wu, Adam Fisch. StarSpace: Embed All The Things![J]arXiv:1709.03856,2017.
[6]Ruiying Geng, Binhua Li,et al. Induction Networks for Few-Shot Text Classification[J]. arXiv:1902.10482,2019.

標(biāo)簽:銅陵 錫林郭勒盟 資陽(yáng) 牡丹江 東營(yíng) 營(yíng)口 巴中 東營(yíng)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《淺談智能問答機(jī)器人如何識(shí)別你的意圖》,本文關(guān)鍵詞  淺談,智能,問答,機(jī)器人,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《淺談智能問答機(jī)器人如何識(shí)別你的意圖》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于淺談智能問答機(jī)器人如何識(shí)別你的意圖的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    69堂成人精品免费视频| 欧美一级免费大片| 亚洲国产精品尤物yw在线观看| 日韩三级免费观看| 91蜜桃在线免费视频| 久久精品国产一区二区三区免费看| 中文字幕不卡的av| 欧美一区二区播放| 色综合天天性综合| 国产伦精品一区二区三区视频青涩 | 国产精品二区一区二区aⅴ污介绍| 欧美三级在线看| 不卡在线视频中文字幕| 麻豆传媒一区二区三区| 一区二区三区在线免费| 久久精品一区蜜桃臀影院| 欧美精品一二三| 91在线播放网址| 国产成人午夜视频| 全国精品久久少妇| 亚洲一区二区三区影院| 国产精品精品国产色婷婷| 精品国产91亚洲一区二区三区婷婷| 欧美色精品在线视频| 成人精品免费视频| 国产福利一区二区三区视频在线 | 大陆成人av片| 韩国一区二区三区| 毛片av一区二区三区| 亚洲高清不卡在线| 亚洲综合视频在线观看| 1024成人网| 国产精品乱码人人做人人爱| 久久理论电影网| 精品久久久久久久久久久久久久久久久| 欧美亚洲综合在线| 一本久久精品一区二区| 成人av先锋影音| 豆国产96在线|亚洲| 国产成人亚洲综合色影视 | 91啪亚洲精品| 成人黄色av网站在线| 国产高清亚洲一区| 大胆亚洲人体视频| 成人理论电影网| 97超碰欧美中文字幕| a亚洲天堂av| 91小视频免费观看| 色婷婷综合久久| 在线看日本不卡| 欧美日韩视频在线第一区| 3atv在线一区二区三区| 91精品国产全国免费观看| 日韩精品专区在线| 久久老女人爱爱| 国产精品久线在线观看| 亚洲欧洲一区二区三区| 一级特黄大欧美久久久| 一片黄亚洲嫩模| 午夜在线成人av| 琪琪一区二区三区| 国产毛片精品国产一区二区三区| 成人综合婷婷国产精品久久| 成人免费av在线| 91久久一区二区| 日韩欧美一级精品久久| 久久女同互慰一区二区三区| 中文字幕在线免费不卡| 亚洲国产视频网站| 免费成人在线播放| 成人性视频网站| 欧美性做爰猛烈叫床潮| 日韩精品一区二区三区视频播放| 欧美精品一区二区三区一线天视频| 中文av一区二区| 亚洲午夜日本在线观看| 看电视剧不卡顿的网站| 福利电影一区二区三区| 91久久精品国产91性色tv | 欧美影院午夜播放| 日韩欧美成人午夜| 国产精品久久国产精麻豆99网站 | 石原莉奈一区二区三区在线观看| 久久91精品久久久久久秒播| k8久久久一区二区三区| 欧美日韩中字一区| 国产日韩欧美综合在线| 亚洲自拍偷拍av| 国产激情一区二区三区| 在线免费不卡电影| 国产亚洲精品超碰| 亚洲第一主播视频| 成人综合在线视频| 欧美一区中文字幕| 亚洲四区在线观看| 国产精品影视在线观看| 欧美午夜理伦三级在线观看| 2020日本不卡一区二区视频| 一区二区三区高清| 丁香六月综合激情| 欧美岛国在线观看| 午夜亚洲福利老司机| 成人免费看黄yyy456| 欧美精品乱码久久久久久按摩| 国产欧美日韩综合| 免费久久精品视频| 在线精品观看国产| 中文字幕电影一区| 狠狠色伊人亚洲综合成人| 欧美日本在线播放| 亚洲色图视频免费播放| 国产成人超碰人人澡人人澡| 欧美一区二区三区视频| 樱桃国产成人精品视频| 成人动漫一区二区| www国产成人| 狂野欧美性猛交blacked| 欧美色电影在线| 一区二区三区精品视频在线| 成人免费毛片高清视频| 久久久91精品国产一区二区三区| 日韩精品成人一区二区三区| 欧洲精品视频在线观看| 亚洲欧美一区二区久久| 99精品视频免费在线观看| 国产亚洲1区2区3区| 黄色小说综合网站| 欧美变态凌虐bdsm| 久久99国内精品| 精品国产一区二区三区久久久蜜月| 性感美女极品91精品| 欧美日韩在线直播| 亚洲美女屁股眼交3| 91理论电影在线观看| 中文字幕一区二区三中文字幕| 国产精品影音先锋| 国产亚洲精品aa午夜观看| 国产精品综合在线视频| 久久丝袜美腿综合| 国产激情视频一区二区在线观看| 久久久不卡影院| 国产成人夜色高潮福利影视| 国产欧美日韩综合精品一区二区| 国产精品99久久久久久久vr| 亚洲国产精品激情在线观看| 成人一道本在线| 亚洲精品国产品国语在线app| 一本高清dvd不卡在线观看| 亚洲精品乱码久久久久久久久 | 99免费精品视频| 1024成人网| 欧美亚洲一区二区在线| 国产自产视频一区二区三区| 精品蜜桃在线看| 粉嫩av亚洲一区二区图片| 成人免费一区二区三区在线观看| 色综合天天综合网国产成人综合天| 亚洲一区二区三区四区在线| 欧美日韩视频第一区| 久久成人久久爱| 国产精品久久久久9999吃药| 在线视频欧美区| 午夜精彩视频在线观看不卡| 911精品国产一区二区在线| 18成人在线观看| 91福利国产成人精品照片| 亚洲一区二区三区影院| 正在播放一区二区| 久久精品国产精品青草| 国产精品久久久久久久久久久免费看 | 蜜桃av一区二区三区| 日韩三级高清在线| 国精产品一区一区三区mba桃花| 精品奇米国产一区二区三区| 狠狠色丁香久久婷婷综合丁香| www激情久久| 99久久99久久精品免费看蜜桃| 亚洲国产日韩一区二区| 欧美疯狂做受xxxx富婆| 日韩高清不卡在线| www久久久久| 欧美日韩午夜在线视频| 九九精品视频在线看| 国产精品美女久久久久高潮| av在线这里只有精品| 日本va欧美va精品发布| 久久久国产精品麻豆| 一本色道综合亚洲| 日本少妇一区二区| 日本一区二区三区高清不卡| 91免费看视频| 麻豆成人91精品二区三区| 亚洲乱码中文字幕综合| 欧美精品日韩一本| 国产大陆亚洲精品国产| 天天色综合天天| 中文字幕av一区 二区| 欧美专区日韩专区| 国产一区免费电影| 日韩精品三区四区|