百度语音离在线语音合成技术免费开放
近日,百度语音对外展示了其免费开放的语音技术和平台。而在语音技术最为核心的语音识别、语义解析、语音合成三种技术之中,百度语音不但在技术上处于业界领先地位,同时也是业界最为开放的免费语音技术服务供应商,这其中就包含离在线语音合成服务。据了解,百度语音已率先在业内提供完全免费的离在线融合的语音合成解决方案,让用户在WIFI环境下可以体验高自然度的音质,而在移动络环境下,也可以实现“0”流量消耗的优质语音体验。百度率先实现拼接合成和参数合成两项技术的融合语音合成即将文本输入转换为语音输出,英文称之为Text to Speech(TTS)。百度语音能够提供在线、离线两种模式的TTS引擎,在线TTS利用云端资源,可将络请求的文本转换为自然流畅的语音,而离线TTS则只使用本地资源,让用户在不消耗流量的情况下也能获取服务。与在线TTS和离线TTS相对应,百度已实现了业界领先的拼接合成和参数合成两项技术的研发。拼接式合成,基于海量文本语料的自然语言理解技术和深度加工的专业发音库,经过多层次的建模让韵律表现更稳健又有表现力。而其智能的弹性单元挑选策略,能从大规模录音语料库中找到所求。由于拼接合成所需资源较多,所以通过在线合成的方式提供服务。参数合成则来源于高质量声学建模和模型压缩技术,以及音质优良的声码器技术,在大大降低资源的同时,可以离线生成接近真人发声的合成效果。有了业界领先的拼接合成和参数合成技术作为基础,百度通过对不同应用场景的深入分析,推出了离在线融合的语音合成解决方案,让语音合成技术的使用更加便捷、人性化。SDK免费开放,为用户与开发者节约成本、提升体验离在线融合的语音合成技术解决方案,通过一套SDK,为开发者提供了自动根据络状况提供合成语音服务的功能,大大降低了开发成本。同时,由于在线合成在文本分析准确率、合成音质等方面有一定的优势,在络条件允许的情况下,可以最大限度地改善用户体验,节约用户的移动络使用成本。目前,百度语音合成已应用至百度框、百度翻译、百度语音助手、百度百科、百度导航、百度书城以及去哪儿等软件之中,SDK支持Android,IOS,Linux三大平台,免费开放给广大合作伙伴和开发者,帮助其创造更符合用户语音需求的特色产品。据百度语音相关负责人介绍,除了语音合成外,百度语音识别、语义解析技术也具有业界领先的技术水平。目前,百度语音已面向多个领域免费开放,包括智能手机领域的联想、中兴、魅族等行业重量级伙伴,智能家居领域的联想智能电视、康佳智能电视、SONY智能电视等。此外,还有信利智能可穿戴设备、特斯拉电动汽车等厂商,都使用了百度语音开放技术。