转载请注明出处。
由于跑编码的需要,所以需要制作一个.yuv格式的图片数据集,但是手头只有.png/.jpg格式的,故记录下转换过程。其他图片格式也可以,代码里修改一下就行。
单个文件转换的命令为:
ffmpeg -i xxx.png -s WxH -pix_fmt yuv420p10le xxx.yuv
-i表示输入的图片的路径 -s表示输出图片的分辨率
-pix_fmt是图片格式,详见https://blog.csdn.net/yuejisuo1948/article/details/83617359
最后面是输出图片的路径
批量转换可以写bat文件,也可以直接用以下的方式:
①安装ffmpeg
官网(各种版本):ffmepg官网
window版:https://ffmpeg.zeranoe.com/builds/
②安装ffmpeg的python3接口ffmpy3
在命令行中输入以下命令:
pip install ffmpy3
③将下载好的windows版解压,把ffmpeg.exe复制到你将要跑python代码的文件夹里
④python代码如下:
# -*- coding: utf-8 -*-
import os
from PIL import Image
from ffmpy3 import FFmpeg
in_jpgDatasetPath = 'I:/VOC/trainval'
out_yuvDatasetPath = 'I:/VVC/loop/yuvdataset'
piclist = os.listdir(in_jpgDatasetPath)
for pic in piclist:
picname = pic.split('.')[0]
picpath = os.path.join(in_jpgDatasetPath,pic)
img = Image.open(picpath)
in_wid,in_hei = img.size
out_wid = in_wid//16*16
out_hei = in_hei//16*16
size = '{}x{}'.format(out_wid,out_hei) #输出文件会缩放成这个大小
outname = out_yuvDatasetPath + '/' + picname + '_'+size+ '.yuv'
ff = FFmpeg(inputs={picpath:None},
outputs={outname:'-s {} -pix_fmt yuv420p'.format(size)})
print(ff.cmd)
ff.run()