[画像説明] Visual Question Answering コードのグリッド機能の防御に基づいてカスタム データ セットのグリッド機能を生成する

In Defense of Grid features for Visual Question Answering コードに基づいてカスタム データ セットのグリッド フィーチャを生成する

著者: Quiet to Silent個人ホームページ

参考番号:facebookresearch/grid-feats-vqa: 視覚的な質問応答のためのグリッド機能の事前トレーニング コード (github.com)

元の作成者は、coco ソース イメージと対応する instances_val2014.json ファイルをロードし、操作を通じて対応するグリッド フィーチャを生成しました。簡単にするために、カスタム データ セットを coco 形式に偽装して、グリッド フィーチャを生成できます。

coco データセットの検証セットを例にとると、instances_val2014 に含まれるキーの値は次のとおりです。

 

おすすめ

転載: blog.csdn.net/lihuanyu520/article/details/132701707