“讓機(jī)器行為看起來就像是人所表現(xiàn)出來的智能行為一樣,包含言語、圖畫、行為等的自主了解、判斷、履行”。是目前智能語音芯片還處于開展早期的一個定義。在應(yīng)對市場,只有極少數(shù)語音芯片廠家推出了量產(chǎn)型芯片產(chǎn)品,大部分公司的芯片產(chǎn)品仍處于規(guī)劃或樣品樣品摸索階段來應(yīng)對需求。
智能語音芯片的玩家主要分為三類:
一直從事語音或主控芯片研發(fā)及生產(chǎn)的公司
代表性公司是科勝訊、MicroSemi、聯(lián)發(fā)科、九芯電子、全志、瑞芯微等
科勝訊:發(fā)布AudioSmart語音處理計劃,包含CX20924 四麥克風(fēng)和CX20921 雙麥克風(fēng)語音輸入處理芯片,首要的功用包含語音增強(qiáng)(4麥回聲消除、噪聲按捺、去混響)、360度聲源定位和語音喚醒。
MicroSemi:發(fā)布ZL38051芯片計劃,首要功用包含語音增強(qiáng)(回聲消除、波束成形、噪聲按捺、聲源定位),支撐全雙工通話,支撐音頻播映,支撐編解碼。
聯(lián)發(fā)科:現(xiàn)在主推的是MT8516語音專用芯片, 支撐高達(dá) 8 通道的 TDM 麥克風(fēng)陣列接口和 2 通道的 PDM 數(shù)字麥克風(fēng)接口,非常合適遠(yuǎn)場麥克風(fēng)語音控制和智能音響設(shè)備?,F(xiàn)在阿里天貓精靈、百度 DuerOS、索尼的谷歌語音幫手智能音箱均采用了聯(lián)發(fā)科的計劃。
九芯電子:推出與華邦深度合作的N588D語音芯片產(chǎn)品,是一款集單片機(jī)和語音電路于一體的可編輯語音芯片。工業(yè)級性能,有串口按鍵并口等多種觸發(fā)方式,有上位機(jī)軟件,用戶可以編輯語音并下載,完全傻瓜式操作語音芯片。
全志:R16采用了極具性價比的四核ARM Cortex-A7架構(gòu)處理器,具有強(qiáng)壯的運(yùn)算功能和豐厚的接口;支撐根據(jù)Linux的開源體系Tina(全志自己開發(fā)的體系), 現(xiàn)在被叮咚音箱、小愛mini等產(chǎn)品采用;同步推出的R311,內(nèi)置了完好的降噪算法,并支撐帶屏音箱的計劃,降低了產(chǎn)品公司的開發(fā)難度。
瑞芯微:RK3229根據(jù)Cortex-A7四核,支撐4-8Mic。在語音算法上,支撐聲源定位、聲源增強(qiáng)、回聲消除、噪音按捺技術(shù)。RK3229仍是首先支撐8路數(shù)字I2S數(shù)字硅麥直連的芯片計劃,不只大大節(jié)約本錢,并且兼容不同麥克風(fēng)陣列算法及渠道。
人工智能草創(chuàng)企業(yè)
代表性公司是微納感知、啟英泰倫、Rokid、聲智科技等
微納感知:供給從軟核算法、芯片模組、到聲學(xué)規(guī)劃的一站式聲學(xué)處理計劃公司?,F(xiàn)在現(xiàn)已與君正聯(lián)合推出X1800智能音箱計劃,與杭州中天微聯(lián)合發(fā)布CK805輕量級AIoT處理器。同是自主智能語音芯片計劃規(guī)劃現(xiàn)已完結(jié),第四季度完結(jié)投片,該芯片集成了AD、DSP和神經(jīng)網(wǎng)絡(luò)加速模塊,可以完結(jié)2~8麥陣列的遠(yuǎn)場拾音、喚醒和打斷、降噪和回聲消除等功用。
啟英泰倫:是一家專注于人工智能芯片規(guī)劃及配套智能算法引擎開發(fā)的公司,它于2016年9月推出了專用的深度神經(jīng)網(wǎng)絡(luò)智能語音識別芯片CI1006,并已完結(jié)了量產(chǎn)和出貨。
智能語音芯片的未來趨勢
邊際計算
現(xiàn)在除了語音喚醒及前端的音頻處理可以在本地完結(jié)之外,雜亂場景的語音辨認(rèn)、語音交互和實(shí)時翻譯等都必須連接云端的服務(wù)器來完結(jié)。未來當(dāng)芯片算力滿意,完全可以完結(jié)悉數(shù)語音處理流程都在片上運(yùn)行,而無須依靠云端和網(wǎng)絡(luò),在保證用戶數(shù)據(jù)隱私的一起拓寬更多的移動端使用。
可以兼容多種神經(jīng)網(wǎng)絡(luò)框架
現(xiàn)在的智能語音芯片一部分是依靠傳統(tǒng)的數(shù)字信號處理算法,一部分是利用RNN/CNN等神經(jīng)網(wǎng)絡(luò)算法進(jìn)行數(shù)據(jù)處理,未來或許出現(xiàn)更多類型的神經(jīng)網(wǎng)絡(luò)算法,滿意各種語音交互的場景,而這些算法都可以被同一顆智能芯片所兼容,在不同的狀況調(diào)用不同的網(wǎng)絡(luò)來滿意客戶需求。
低功耗,小體積
現(xiàn)在的各類語音芯片因?yàn)楣暮腕w積的問題,無法大規(guī)模使用于可穿戴、玩具、無人機(jī)等不通過電源供電、硬件空間及其有限的設(shè)備,如果可以處理這些問題,那么語音交互將可以深入到更多的行業(yè),落地更多的產(chǎn)品。