爬取得到的数据是比较脏的,要进行整理,包括统一后缀和重命名。
统一后缀可以减少以后写数据API时的压力,也可以测试图片是不是可以正常的读取,及时防止未知问题的出现。这很重要。
首先我们看下爬取完些的数据有多少种数据格式。
https://blog.csdn.net/bevison/article/details/79126410
总之:
爬取下来的数据:
- 统一命名:数据更好观察。
- 预先读取一遍数据:测试图片是不是可以正常的读取
- 统一后缀名:方便下一步转换为其他格式。
-
数据转换为 jpg,或者 bmp,(前提是统计了文件夹里数据格式)
C++版本
-
Python-OpenCV读取png图像转成jpg图像存储_Python_Be Blessed,Be Vision.-CSDN博客