智能语音交互解决方案

智能语音交互是阿里达摩院研发的原子产品,基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。

语音产品速览

语音识别

语音识别目前支持中文普通话(含重口音),四川话、河南话、东北话,粤语,英语。

语音合成

依托深度学习技术,将文本转换成自然流畅的语音。

语言模型自学习工具

用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。

易用

一键式的自助
语音优化方案

快速

数分钟内完成
业务专属定制

准确

得到内外合作
伙伴充分验证

模型热词

输入泛热词/类热词提高特定词汇识别度,热词功能秒级生效。

应用场景领域

智慧安防

给安防监控设备装上聪慧的耳朵,听音识向,配合摄像头智能联动。

服务机器人

为服务型机器人提供声源定位、个性唤醒、语义理解等交互功能。

智能车载

用于智能车机、智能后视镜、便携式导航仪HUD等全程语音操作。

智能家居

对WIFI音箱、电视、灯、空调等智能家居产品实现语音交互控制。

智能音箱

提供包含模组、通用麦克风阵列和引擎对接的智能音箱解决方案。

课程会议

课程和会议远场识音,声源定向,可在客户现有方案即插即用。

解决方案示例

智联网汽车语音解决方案

方案介绍

借助阿里云人工智能强大技术,做到智能前端降噪,语音唤醒,智能识别和理解,智慧进行对话管理,输出悦耳的合成语音。

业务痛点

语义理解不精准,易受环境噪音干扰,对话逻辑差强人意等。

解决优势

智能语音独创字级LC-BLSTM/DFSMN-CTC建模,大大提高了精度;实现强噪声环境下的高质量人机交互。