NITIRE 2023 公式 PSNR および SSIM 計算コード
問題の説明
PSNR
画像修復作業を行う場合、総和や総和などの画質評価指標の計算が避けられませんがSSIM
、インターネット上にはこれらの指標を計算するためのコードが多すぎて、コードによって計算結果が異なる場合があります。matlabを使用して計算されるものSSIM
と、pythonを使用して計算されるものがありますSSIM
。サードパーティのライブラリを使用してskimage
を計算する場合SSIM
もあれば、サードパーティのライブラリを使用してpyiqa
を計算する場合もありますSSIM
。以前ブログ主がUrban100
テストセットの計算をしてみSSIM
たところ、SR画像とHR画像の計算ではSSIM
数値の差が大きく、matlabでの計算でSSIM
は0.9644、pythonでの計算でSSIM
は0.7980でした。そのため、どれがいわゆる標準なのか、人々は混乱してしまいます。
ニティアコンテスト
ブロガーは、今年の NITIRE 2023 超解像度トラック コンテストに注目し、軽量超解像度トラック NTIRE 2023 Challenge on Efficient Super-Resolution に、出場者がモデルのビデオ メモリ使用量を自分でテストできるようにコード テンプレートが提供されていることに気付きました。、推論時間、PSNRおよびSSIM。元の報告書には次のような一文がある。
これらのメトリクスを計算するコード例は、https://github.com/ofsoundof/NTIRE2023_ESRで入手できます。提出されたソリューションのコードと事前トレーニングされた重みも、このリポジトリで入手できます。
これらのメトリクスを計算するコード例は、 https://github.com/ofsoundof/NTIRE2023_ESRにあります。提出されたソリューションのコードと事前トレーニングされた重みは、このリポジトリにあります。
つまり、NITIRE の公式計算コードはhttps://github.com/ofsoundof/NTIRE2023_ESRで見つけることができます。NITREコンペティションは、CVPR (IEEE Conference on Computer Vision andパターン認識) タスク競争の信頼性が高いため、このコードを計算に使用することをお勧めします。PSNR
SSIM
コアコード
PSNR と SSIM を計算するためのコア コード
'''
# =======================================
# metric, PSNR and SSIM
# =======================================
'''
# ----------
# PSNR
# ----------
def calculate_psnr(img1, img2, border=0):
img1 = _bord_img(img1)
img2 = _bord_img(img2)
return _calculate_psnr(img1, img2)
# ----------
# SSIM
# ----------
def calculate_ssim(img1, img2, border=0):
img1 = _bord_img(img1)
img2 = _bord_img(img2)
return _calculate_ssim(img1, img2)
def _calculate_ssim(img, img2, test_y_channel=True):
if test_y_channel:
img = to_y_channel(img)
img2 = to_y_channel(img2)
ssims = []
for i in range(img.shape[2]):
ssims.append(_ssim(img[..., i], img2[..., i]))
return np.array(ssims).mean()
# 在y通道上计算
def _calculate_psnr(img, img2, test_y_channel=True,):
if test_y_channel:
img = to_y_channel(img)
img2 = to_y_channel(img2)
mse = np.mean((img - img2)**2)
if mse == 0:
return float('inf')
return 20. * np.log10(255. / np.sqrt(mse))
def _ssim(img, img2):
c1 = (0.01 * 255)**2
c2 = (0.03 * 255)**2
img = img.astype(np.float64)
img2 = img2.astype(np.float64)
kernel = cv2.getGaussianKernel(11, 1.5)
window = np.outer(kernel, kernel.transpose())
mu1 = cv2.filter2D(img, -1, window)[5:-5, 5:-5]
mu2 = cv2.filter2D(img2, -1, window)[5:-5, 5:-5]
mu1_sq = mu1**2
mu2_sq = mu2**2
mu1_mu2 = mu1 * mu2
sigma1_sq = cv2.filter2D(img**2, -1, window)[5:-5, 5:-5] - mu1_sq
sigma2_sq = cv2.filter2D(img2**2, -1, window)[5:-5, 5:-5] - mu2_sq
sigma12 = cv2.filter2D(img * img2, -1, window)[5:-5, 5:-5] - mu1_mu2
ssim_map = ((2 * mu1_mu2 + c1) * (2 * sigma12 + c2)) / ((mu1_sq + mu2_sq + c1) * (sigma1_sq + sigma2_sq + c2))
return ssim_map.mean()
最後に、勉強してくれた友達に感謝します~
最後に、2023 年の効率的な超解像度コンテストのレポートへのリンクが添付されています。どなたでも読んで共有することができます:効率的な超解像度に関する NTIRE 2023 チャレンジ: 方法と結果