In Defense of Grid features for Visual Question Answering コードに基づいてカスタム データ セットのグリッド フィーチャを生成する
著者: Quiet to Silent個人ホームページ
目次
参考番号:facebookresearch/grid-feats-vqa: 視覚的な質問応答のためのグリッド機能の事前トレーニング コード (github.com)
元の作成者は、coco ソース イメージと対応する instances_val2014.json ファイルをロードし、操作を通じて対応するグリッド フィーチャを生成しました。簡単にするために、カスタム データ セットを coco 形式に偽装して、グリッド フィーチャを生成できます。
coco データセットの検証セットを例にとると、instances_val2014 に含まれるキーの値は次のとおりです。