阿里云智能语音-提供轻量化本地部署方案

帮助企业在自己的数据中心部署与阿里云公共云同款的智能语音服务

为什么选择智能语音专有云
安全性高
  • 本地部署是基于客户自身的服务器部署
  • 私密数据的安全性更有保障
资源可控及灵活调配
  • 数据均在本地,更方便于二次整理和开发
  • 通过内联网,集成相对容易
  • 数据在系统之间的传输会更快

智能语音 本地部署VS公共云

阿里智能语音专有云服务,面向企业级云平台,包含完整且可定制的
智能语音全产品家族,帮助企业在自己的数据中心部署与阿里云公共云同款的智能语音服务。

本地部署 公共云
算法

国内独创的字级LC-BLSTM/DFSMN-CTC建模

国内独创的字级LC-BLSTM/DFSMN-CTC建模

功能

一句话识别 • 录音文件识别 • 实时语音识别
• 语言自学习模型 • 语音合成 •语音合成定制服务

一句话识别 • 录音文件识别 • 实时语音识别
• 语言自学习模型 • 语音合成 •语音合成定制服务

对接

• 线下调用,部署在单独的服务器上

• 在线服务,公共云调用

价格

• 按路数售卖

• 按调用量收费

范围

安全性要求高:政府、金融、司法等行业客户

通用客户:客服、教育、直播等行业

价格

       ASR: 30路起售        TTS:  30路起售         
      其他规格请直接联系阿里云专家

资源包预付费
立即购买

使用智能语音专有云的主要优势

交付简单

标准docker交付
真正实现run anywhere

使用方便

交互协议全新升级
更友好,更健壮

全新交互

开箱即用(逐步开放)
自主管控运维监控能力开放

了解更多
应用场景

智能外呼

智能客服质检

实时直播及监控

智慧课堂

实时会议记录转写

语音播报

  • 智能外呼
  • 智能客服质检
  • 实时直播及监控
  • 智慧课堂
  • 实时会议记录转写
  • 语音播报

智能外呼方案

帮助传统客服向智能客服转型,已应用在蚂蚁金服95188热线智能客服、阿里云智能客服等

业务痛点及需求

客服人员流动性大、培训成本高、客服效果难以把控、大量重复性问题过度消耗人工成本,人工客服不可能全天保持最好状态,容易造成用户体验不足。

优势

1. 减少了大量的人力成本,节省了企业资源;
2. 算法技术保持行业领先,满足商业化需求;
3. 依靠互联网公司海量的数据资源训练,准确率不断提高。

智能客服质检

传统质检一般是对客服电话录音以人工听的方式进行检查,存在效率问题以及人员瓶颈。智能质检能够对所有服务过程进行全量的实时质检,帮助企业的服务部门摆脱人的限制,全面把控服务质量。

使用流程

将待检的语音数据转换成文本之后,通过质检引擎产生质检结果,并生成统计数据。质检人也可以在管控台上定位查看到每条数据命中的规则点、以边听边看的方式对结果进行校验。

优势

1. 全量自动化——能实现全量客服通话、工单的自动化质检;
2. 实时性——能做到电话一挂立即完成质检,实时看到最新的结果;
3. 规则灵活性——规则配置超灵活,覆盖到各类复杂的业务场景。

实时直播及监控

现场演讲场景、直播场景下,将视频中的音频实时转写成字幕。在直播场景下,还可以进一步对内容进行监控。

业务痛点及需求

1. 在开大会做演讲时,现场环境如果比较嘈杂,座位靠后或远程做直播时,可能会听不清演讲内容;
2. 一个直播APP,每天产生的视频数量多达数十万小时。严肃直播有字幕需求,娱乐直播有监控需求。

优势

1. 在阿里云栖大会现场做了演讲的转写,在正确率上击败国际速记比赛亚军,目前已经成为云栖大会的标配产品;
2. 实时转写速度极快,几乎与直播同步。

智慧课堂

在线教室场景中,对教师和学生的视音频分析,结合课程内容做质量评估,老师教学手段多样化

使用流程

将电话实时传给阿里云的语音转文本接口,阿里云将及时返回数据,客户可使用阿里云的质检系统或者自建分析系统对返回的文字做分析,从而及时发现问题。

优势

1. 无需人工介入,减少人力成本;
2. 实时性好,可以及时发现问题。

实时会议转写方案

日常工作会议中,需要将参会人发言实时转写成文字,从而代替了会议记录员的角色。阿里云实时会议转写方案已经在部分企业投入使用,得到了客户的一致好评。

业务痛点及需求

政府机关以及企事业单位在日常工作中,往往会有各种沟通、交流的需要,在此过程中势必要有大量的文本记录工作。但人工记录可能会产生各种纰漏、错误等情况,且记录工作受个人主观情绪影响较大。

优势

1.识别准确率高,相对业界传统CTC方法降低了20%的错误率;
2.自学习模型可以定制热词优化,以此来提升正确率;
3.支持本地部署,保证安全性

语音播报应用方案

将文本转换成自然流畅的语音,多种银色可供选择,并提供调节语速、语调、音量等功能。

使用流程

提供多行业多场景的智能语音合成能力,主要应用于智能客服、智能设备、语音交互、文学有声阅读和无障碍播报等场景。

优势

1.海量音频训练,达到业内顶级水准;
2.多领域覆盖,积累了大量的词库,各领域、各行业的词汇发音更准确;
3.根据用户需求定制,满足个性化需求;
4.支持本地化部署。

常见问题
相比较竞品,你们的优势在哪里?算法的优势体现在哪里?
阿里的智能语音方案,在语音识别方面具有三方面的独特的功能优势:语音模型自学习训练平台、语音文本后处理模块、雷音模块。 阿里的智能语音核心技术能力是DFSMN + Low Frame Rate应用,两种技术都是业界首次在非科研领域的应用并大获成功,使得语音交互的准确率大幅度提高,并使性能提高3倍。
有没有我们行业的模型?
目前有泛领域、质检、客服、法院、政务、金融(保险,银行)行业的模型。
立即注册

智能语音专有云需求  专家一对一交流