
極限元是國(guó)內(nèi)領(lǐng)先的人工智能技術(shù)公司,以“智能交互”為核心,擁有自主產(chǎn)權(quán)的智能語音、人機(jī)對(duì)話、機(jī)器視覺、大數(shù)據(jù)分析等AI技術(shù),推出了云端、桌面、嵌入式等跨平臺(tái)AI技術(shù)解決方案,產(chǎn)品和服務(wù)廣泛應(yīng)用于教育、安全、交通、智能硬件等多個(gè)領(lǐng)域。
公司致力于發(fā)展智能交互技術(shù),與中國(guó)科學(xué)院自動(dòng)化研究所掛牌成立了“智能交互聯(lián)合實(shí)驗(yàn)室”服務(wù)于騰訊、奇虎360、搜狗等公司以及網(wǎng)信辦、公安部門等國(guó)家相關(guān)安全機(jī)構(gòu)。
核心技術(shù)優(yōu)勢(shì):
。1)前端信號(hào)處理
通過前端處理模塊可以有效抑制噪聲、混響、回聲的干擾,增強(qiáng)語音的可懂度,提高真實(shí)環(huán)境下語音識(shí)別的魯棒性;在智能家居、智能車載等領(lǐng)域有廣泛應(yīng)用。
。2)聲紋識(shí)別
聲音就是密碼,自動(dòng)識(shí)別說話人身份,實(shí)現(xiàn)快速精準(zhǔn)的身份認(rèn)證。
。3)情感識(shí)別
能夠精確探測(cè)用戶的面部表情、語音語調(diào)、語言情緒等特征,識(shí)別喜、怒、哀、驚、懼情緒,并在此基礎(chǔ)上,制定擬人化的情感交互模型和對(duì)話策略。(如使用于呼叫中心質(zhì)檢等場(chǎng)景)
。4)語音識(shí)別
將語音識(shí)別成文字,讓機(jī)器具有人類一樣的聽力。識(shí)別準(zhǔn)確率達(dá)97%以上,支持方言口音識(shí)別、智能降噪,識(shí)別實(shí)時(shí)率<0.15.
。5)語音合成
將文字合成為語音,讓機(jī)器說話,媲美真人發(fā)聲,專業(yè)MOS分可達(dá)4.4,多方言、多語種、多音色的音庫(kù)選擇,支持個(gè)性化語音定制。
。6)人機(jī)對(duì)話
實(shí)現(xiàn)多類型人機(jī)對(duì)話管理,結(jié)合上下文的多輪對(duì)話,面向口語的語義理解,基于語音的魯棒性問答。
解決方案
。1)語音質(zhì)檢
針對(duì)現(xiàn)行業(yè)內(nèi)運(yùn)用的質(zhì)檢方式的諸多弊端,“極限元”采用了基于語音識(shí)別、語音關(guān)鍵詞檢索技術(shù)、音頻對(duì)比技術(shù)、情感識(shí)別技術(shù)的錄音質(zhì)檢方案。本方法有效的減少語音識(shí)別準(zhǔn)確率不高帶來的錄音質(zhì)檢誤差,有效提升了錄音質(zhì)檢效率,全面覆蓋人工客服與用戶的每一次對(duì)話,基于度神經(jīng)網(wǎng)絡(luò)算法,智能分析人工客服對(duì)話內(nèi)容,節(jié)約大量的人工成本,同時(shí)根據(jù)各客服系統(tǒng)的工作重點(diǎn)和特點(diǎn),進(jìn)行個(gè)性化設(shè)定與定制。

。2)智能客服
基于語音識(shí)別、語音合成、語義理解等技術(shù),可以實(shí)現(xiàn)呼叫中心撥號(hào)音檢測(cè)、智能外呼、智能問答、語音導(dǎo)航、智能營(yíng)銷等一系列的功能。應(yīng)用場(chǎng)景:客戶回訪、產(chǎn)品推薦、債務(wù)提醒、信息資訊、業(yè)務(wù)辦理、電話訂購(gòu)等,可應(yīng)用領(lǐng)域包括:金融、保險(xiǎn)、電商、教育、企業(yè)服務(wù)、生活服務(wù)。

。3)語音轉(zhuǎn)寫
錄音轉(zhuǎn)寫文稿、快速定位回聽、視頻字幕制作,可實(shí)現(xiàn)長(zhǎng)句子連續(xù)語音識(shí)別,音頻文本對(duì)齊時(shí)間軸,普通話識(shí)別準(zhǔn)確率高達(dá)96%,幫助各行各業(yè)的用戶實(shí)現(xiàn)高效記錄和信息輸入。應(yīng)用場(chǎng)景包括演講或授課、記者訪談、會(huì)議辦公、影視娛樂視頻字幕等。
(4)智能交互
多通道語音前端信號(hào)處理方案,嵌入式遠(yuǎn)講語音喚醒,離線模式下語音/指令詞識(shí)別,云-端一體化語音交互方案,可應(yīng)用領(lǐng)域:車載導(dǎo)航、智能音箱、智能家居、機(jī)器人等。
企業(yè)網(wǎng)址:www.jixianyuan.com