今天,百度召開新品發布會,宣布百度輸入法 AI 探索版正式發布,這是一款默認輸入方式為全語音輸入,并調動表情、肢體等全感官輸入的產品。
據了解,百度首先宣布了在語音技術方面取得的突破,流式截斷的多層注意力建模(SMLTA)已經將在線語音識別精度提升了 15%,這一技術能夠解決傳統 Attention 模型在識別中的時延性,以及因此導致的無法進行大規模在線語音實時交互的問題。
在離線語音識別方面,百度優化了 Deep Peak 2 系統,讓離線語音輸入相對準確率得以高于行業平均水平。此外,中英文混合語音輸入技術,以及方言與方言、方言與普通話的混合語音輸入等百度 AI 輸入法都針對性進行了優化。
在新玩法方面,百度輸入法 AI 探索版推出了拍立活、秀場、凌空手寫等新功能,“拍立活”功能可以讓用戶通過自己的動作“驅動”對方做出相同表情;“秀場”功能運用了圖像分割技術,用戶可以“穿越”到不同的虛擬場景之中;凌空手寫,可以讓在空中書寫也能被識別。
本次發布會,百度還介紹了百度海外輸入法的相關情況,展示了日語識別、印地語識別和印英混輸功能。據第三方數據顯示,百度日文輸入法 Simeji 的語音識別結果用戶可接受度占比 90%;在文盲率高達 30% 的印度地區,百度海外輸入法推出的印英混輸識別功能使用率 21%。
據悉,截至 2018 年底,百度輸入法月活躍人數為 5 億,語音日請求量峰值 5.5 億,AR 表情使用次數 1 億。海外輸入法全球安裝量 1 億,支持 120 種語言。
這款輸入法有以下特點:
-唯一實現方言免切換語音輸入識別,支持普通話+六地方言混輸。
-唯一實現高精準中英混合語音識別輸入的輸入法
-唯一實現全語音智能助手操控,切換輸入模式、查天氣、搜表情全部用語音就能完成。
之前,百度輸入法v8.0版本發布之時,百度副總裁、AI技術平臺體系總負責人王海峰就提到“真正讓輸入法這種人機交互模式發生變革的,是正在到來的AI時代。”
他說,“AI時代,人無需學習如何使用機器,用自然語言就能和機器順暢交互,甚至無需主動交互就能讓機器理解人的意圖……當AI發展到一定階段,輸入法甚至不需要獨立存在,它將融入人機交互系統,支持人和機器以各種形式進行信息交互。”