人機語音交互服務商「一知智能」完成超億元人民幣B輪融資

訪問原網址

36氪獲悉,人機語音交互服務商「一知智能」已完成超億元人民幣B輪融資,由凱泰資本、億聯凱泰以及中信證券投資共同投資。據悉,本輪融資資金將用於算法開發、產品升級、團隊建設與新業務開拓。

一知智能是36氪曾報道過的一家企業,於2017年成立,創始團隊來自浙大人工智能研究所,是一家專註於人機語音交互技術的SaaS服務商,通過電話、微信、短信等載體為企業觸達用戶,並實現精細化智能運營。公司憑藉自研的語音識別、語義理解和語音合成三大人機交互核心算法,為零售、生活服務等泛消費行業,以及公共服務提供AI場景化智能服務。據一知智能介紹,公司曾先後獲得浙江省高新技術企業研究開發中心、杭州市領軍型創新團隊,中國人工智能學會語音對話與聽覺專業委員會單位。

近年來,在AI產業落地的浪潮中,智能語音交互因其交叉學科屬性,包含ASR(語音識別)、NLP(自然語言處理)、TTS(文本語音轉換)等多項高難度AI技術,至今依然有較高的應用落地門檻。而從場景需求上來看,在商業活動與政務工作中,以微信和電話為主要交流載體的人員排查、信息採集、定向通知、政務諮詢等環節,往往是最費時費力的部分,因此大到各地政府的防疫提示來電,小到消費品牌的大促上新通知,投入智能語音交互技術也已成為政���服務實現降本增效的趨勢之一。因此,如何迅速適應通話場景,提升AI語音的對話體驗,成為業內人機交互服務商進行技術優化的首要考驗。

一知智能創始人、CEO陳哲乾在介紹團隊的賽道選擇時,把創業故事比喻為“拿着鎚子找釘子”的科研式創業之路。彼時,求學於浙江大學人工智能研究所的公司創始團隊,便在人機智能交互領域有了豐富的研究成果,曾代表浙江大學多次獲得國際性NLP比賽冠軍。與AI賽道內其他帶有科研基因的團隊相類似,一知智能的創業方式也是帶着較強的技術尋找擁有商業前景的落地場景。經過近3年時間,在調研機器可以取代人類工作的諸多行業領域后,一知團隊最終將產品定位在高頻次的人機互動載體——電話,再通過已積累的AI語音技術為智能外呼找到應用場景,由此確定了公司核心技術的商業化方向。也因為擁有了核心算法、算力與數據的支持,後續公司業務的發展錨定雙向互動需求較多的消費廣告與公共服務領域,便進入了“逢山開路,遇水迭橋”的發展階段。

對比業內同樣聚焦於AI語音機器人與智能語音賽道的百應科技、網易七魚、智齒客服等企業,陳哲乾認為一知智能的主要差異點在於將公司定位於技術研髮型服務商,通過人機對話技術的不斷迭代來做深消費品牌的會員智能化服務。從這一定位出發,近年來一知智能在核心技術上有了以下升級:

·ASR:在語音識別提取的過程中,一知智能在webRTCNS(降噪處理代碼)的框架基礎上,對環境音降噪與人聲增強進行雙向優化,實現雙模并行。同時,公司使用MFCC+resCNN提取算法方案,細化機器人在性別、年齡與情緒識別中的感知顆粒度。

在通用場景識別的E2E(端到端)模型中,一知智能在傳統語音識別架構AED(Attention-Encoder-Decoder基於注意力機制的編解碼模型)的基礎上做了場景化升級,自研了基於上下文文本定製增強模塊的Context-Aware Encoder算法,在模型訓練過程中,使用額外補充的場景文本作為強化信息,讓模型建立起針對特定輸入的強化架構,提高特定垂直場景中的語音識別率。

體現在場景應用上,該項技術能過濾溝通中的環境噪音干擾,並使機器人能快速識別用戶的年齡、性別與情緒,根據當前情景選擇最合適的對話內容。

·NLP:一知智能已於日前升級了新一代對話架構NLP2.0。在實現意圖識別、情感識別、問答識別、任務對話、智能糾錯,知識圖譜等NLP常見任務之外,新的對話架構還提出了在泛消費領域的專用大���模預訓練語言模型“EAZI”——在Transformer架構基礎上,基於語言學知識與大量垂直數據,以NLP算法驅動語義理解,改進模型架構與預訓練策略,並且針對大量的消費領域信息與公司已積累的消費場景對話進行專項訓練。

體現在場景應用上,此項創新在問卷調研、用戶滿意度調研等外呼需求中,解決了時間、地址、組織名稱等實體信息提取的難點,機器人在應對消費場景客戶調研中的複雜問題時,也能快速找到對應答案。

·Fastspeech 系列語音合成算法: 浙大 一知人工智能聯合研究中心,聯合微軟共同推出FastSpeech1和FastSpeech2兩代算法系列,集合了語音合成、情感合成和語音克隆算法,以及相應的語氣詞回復生成算法。

據一知智能介紹,該算法系列相較於谷歌的tacotron兩代算法,在同等實現效果上,速度分別提升了38倍和260倍。體現在場景應用上,機器人在溝通中能夠逼真地模擬人類情緒,並能在識別對話方情緒后及時給出回應。

人機語音交互服務商「一知智能」完成超億元人民幣B輪融資

一知智能行業knowhow沉澱

關於公司的商業模式與應用,一知智能CFO張蕾介紹到,公司的服務場景主要包括:會員激活、邀請加微信私域、生日&會員節關鍵時刻打造、大促節點活動通知、公安反電詐、疫情回訪通知、銀行逾期提醒等。目前已為300餘家消費品牌、100餘家地市公安局提供AI語音服務。在泛消費領域,公司已與雅詩蘭黛、薇諾娜、奶酪博士、湯臣倍健等消費品牌達成合作,主要需求方為消費品牌的電商、用戶增長及營銷部門。核心產品以廣告投放邏輯按季度/年充值服務費,按CPA結算,收取成功觸達費,中大型客戶的年框合作客單價為50至100萬元不等。

在團隊方面,一知智能目前有200多名員工,核心創始團隊來自浙大人工智能研究所。公司於2019年2月成立浙大·一知人工智能聯合研究中心,圍繞多模態人機交互展開產學研結合,在語音、語義領域與華為、微軟亞洲研究院、阿里達摩院等多家企業進行聯合研發,並進行相應工程化落地。

本輪融資后,公司將推進海外業務布局,推進跨語種人機對話技術自研與商業落地,打造面向全球的智能語音交互SaaS平台。

從市場發展看,根據鯨准研究院數據,目前國內呼叫中心約有100億的市場規模,但在智能語音賽道主要切入的存量市場,始終是機遇與挑戰並存的狀態,一方面,當前消費與公共生活服務智能化改革的深入,人機語音交互服務已成消費企業與政務部門提效的有力工具,而另一方面,隨着綜合整治個人隱私專項政策的出台,對智能外呼行業的嚴格監管也將市場規模收窄在數據隱私安全的框架之內。目前賽道中的AI語音公司,除了以AI語音通話算法為業務核心的垂直服務商,像一知智能,也有互聯大廠對於智能雲客服系統部署的企業,像網易七魚、京東言犀,更有私域營銷出發嘗試人機交互新技術的企業。底層技術與開源架構趨同的智能外呼公司,如何在賽道中跑出差異化,需要在技術與客戶場景雙重層面尋找答案,對於國內市場逐漸趨於飽和化的狀態,跑通出海服務的商業模式也成為了新的機遇之一。此外,在不斷拓寬服務場景邊界的同時,如何解決隨之而來的信息隱私與安全的隱患,也是賽道內企業在戰略優化中需要深思的問題。

媒體報道

      36Kr  創業邦  投中網  動點科技

相關事件

  • 人機語音交互服務商「一知智能」完成超億元人民幣B輪融資  2022-06-20
  • 智能客服提供商小能科技完成C輪1.25億元融資  2020-04-03
  • 智能客服服務商Udesk 宣布完成2.5億元C+輪融資  2020-03-25
  • 智能客服公司“一知智能”完成4000萬元A+輪融資  2019-12-20
  • 智能獲客服務商百鍊智能獲 5000 萬元 Pre-A 輪融資  2019-07-09
(0)
上一篇 2022-06-20 13:48
下一篇 2022-06-20 14:00

相关推荐