colab が yolov5 トレーニング データ セットを使用すると、次のエラーが発生しますが、トレーニング結果には影響しません。
Corrupt JPEG data: 2 extraneous bytes before marker 0xd9
解決:
次のコードを utils/dateset.py ファイルに追加します。
if im.format.lower() in ('jpg', 'jpeg'):
with open(im_file, 'rb') as f:
f.seek(-2, 2)
assert f.read() == b'\xff\xd9', 'corrupted JPEG'
参加場所: このスニペットの後に上記のコードをコピーします。
def verify_image_label(args):
# Verify one image-label pair
im_file, lb_file, prefix = args
nm, nf, ne, nc = 0, 0, 0, 0 # number missing, found, empty, corrupt
try:
# verify images
im = Image.open(im_file)
im.verify() # PIL verify
shape = exif_size(im) # image size
assert (shape[0] > 9) & (shape[1] > 9), f'image size {shape} <10 pixels'
assert im.format.lower() in img_formats, f'invalid image format {im.format}'
原則: このエラーを回避するにはデータチェックを追加します
間違った理由:
yolov5 のオリジナル作成者である Glen Joch 氏は、その理由について次のように説明しています。「これは、データセット内の破損または不完全な JPEG 画像によって引き起こされる低レベルの C エラーであり、Python で検出するのは簡単ではありません。」