智力题《你是几班的?》
上一篇重点讲解整体流程的组织,这篇讲细节的实现。
有几个比较关键的技术
- 文本转语音
- 图片的生成
- 图片组合为视频
- 音频视频融合
- 视频连接
第一个技术这个技术比较成熟,直接使用了百度的语音接口。参考源代码和百度相关文档。须安装一个百度的库。
python -m pip install urllib
第二个功能,大量使用了PIL库来实现。
后面几个,都是依靠ffmpeg来实现,详见相关的代码。
最终实现在一个函数makeNovel(根路径, 图片资源路径, 剧本文件名)