微软的Azure文本转语音

最近又被这个弔功能给搞头大了,Emmmmm.....

基于上面的聊天页面将拿到的文本内容转成语音并播放
第一个要注意的点你要是个纯前端开发就要好好去看看官方文档,要不然会很emo。。
https://learn.microsoft.com/en-us/azure/ai-services/speech-service/get-started-text-to-speech?tabs=macos%2Cterminal&pivots=programming-language-javascript

包含基本的音色的文本转语音和更高级的ssml方式的改进合成(主要是可以让合成的音频带有更多的感情色彩,比如高兴的,大声的等)
自己封装了个js实现了这个弔功能,虽然还是有个坑没有完全处理

至于文本转语音想要用最基本的是你要有subscriptionKey、region,这两个弔东西来自于Microsoft Azure你所创建的资源组


随便点进去一个自己创建的resources就可以看到里面的详情信息了


这就是开发的时候要用到的两个弔参数,至于怎么创建resources自己去百度吧

再往下就是你肯定需要引入sdk啊,
import * as sdk from "microsoft-cognitiveservices-speech-sdk";
设计到合成的时候也就是只用到了下面的两个方法的一部分


如果result.reason返回10 那么恭喜你,至于合成之后的音频怎么处理就看自己的需求了,比如我的需求是合成音频后还要存储到云端,方便后续可以直接下载使用,不用反复的走合成,毕竟合成是按字节收费的,就算公司不是你家 也不能那么造啊,azure有自己的存储storage,由于本人较懒就直接用了腾讯云的存储,包括查询,上传,下载等

还有个需要注意的点要提示一下,合成的语音是二进制的,而且合成后会自动播放的,所以需要配置第二个参数null的直接就不播放了,也可以配置第二个参数Audioconfig手动控制暂停

以上也就是大概js 文本转语音的基本实现方法了

猜你喜欢

转载自blog.csdn.net/weixin_39852181/article/details/134140869