识别准确率高
相较我们上一代模型,全新的“端到端”架构在各业务场景,识别性能有较大的提升
高速解码速率
国内独创的LFR解码技术, 在不损失识别精度的情况下,将解码速率大幅提升
自学习模型优化工具
提供自学习平台系统,同时支持热词定制和模型定制
广泛的领域覆盖
目前已经积累了大量行业客户,业务场景包括智能问答、智能质检、庭审记录、字幕翻译、语音助手等等
典型场景
云上通用
场景优势
满足出行场景,导航场景,搜索场景,物流场景,读书场景,直播、音视频、游戏、聊天、质检、翻译、笔记、输入法等各行各业场景需求。
政企会议、谈话等场景
场景优势
在长时间会议或谈话过程中,辅助记录人员解决误记、漏记等的问题,做到记录可快速、可定位查询。
智慧法庭等
场景优势
由于离线端到端直接在移动端进行识别,无需将语音上传到云端,因此为高隐私要求的场景使用语音识别提供了可行的方案。
智能语音交互都解决了哪些问题
呼叫中心语音质检
上传呼叫中心的录音文件,通过录音文件识别得到文本,进一步通过文本检索,质检服务合规性、友好性;
实时直播字幕及管理
现场演讲场景、直播场景下,将视频中的音频实时转写成字幕。还可以辅助视频平台进行内容合规治理;
业务电话内容分析
传统中介业务中容易出现客户双方建立联系后抛弃中介的事情,如房东诱导房客进行线下交易,从而导致中介公司经济损失;
智能语音问询终端
该套方案中集合了语音识别,自然语言理解,对话管理,音频信号处理,语音合成,机器视觉等多项人工智能技术,给用户提供一种全新的,多模态的语音交互方式;
语音搜索
支持各种场景下的语音搜索,比如地图导航、浏览器搜索等。可以集成到任何形式的手机应用中,很大程度上解放了双手;
语音指令
通过语音命令控制智能设备,实现快捷便利的操作。比如控制空调的开关、电视的换台等。可以集成到智能家居等设备中;