論文集中講義 | Shengsi MindSpore Quantum に基づく FRQI とその圧縮形式を実現し、画像分類タスクに使用する

簡単な紹介

この論文は、量子ニューラル ネットワークに基づいて大きな画像を分類するためのフレームワークを提案しています。このフレームワークにおける画像符号化にはFRQI方式が採用されており、これに基づいた圧縮方式が提案されている。この論文では、CRADL と CRAML という 2 つの量子ニューラル ネットワーク層も提案されています。オリジナルの作者は、MNIST の 3 と 6 のアルゴリズムの有効性を検証し、ラップトップ上で 8x8 と 16x16 の画像のシミュレーションを実現しました。

関連論文

标题:量子ビットと量子深層学習を使用した画像圧縮と分類

作者:Ali Mohsen, Mo Tiwari

arXiv:  2110.05476 (2021 年 10 月 8 日)

論文再現コード

コードリンク: https://gitee.com/mindspore/mindquantum/tree/research/paper_recurrence/2023/47_richybai

ビデオを視聴するには、以下のリンクをクリックしてください。

[ライブ] 量子コンピューティング グループが一緒に開きます | Shengsi MindSpore Quantum に基づく FRQI とその圧縮形式を実現し、画像分類タスクに使用します

01 FRQIコーディングと画像圧縮

FRQI (Flexible Representation of Quantum Image) [1] エンコード方式は、画像内の色を対応する位置に関連付けます。

(式1)

ここで、q はピクセル点の位置を表し、点の色を表します。

この論文では、画像のエンコードに使用される量子ビットをさらに圧縮するために FRQI が改良されています。そのエンコード方法は次のとおりです。

(式2)

式 1 と式 2 を比較すると、作成者がコーディング位置の最後の 2 量子ビットの情報をコーディング色の量子ビットに圧縮していることがわかります。

(式3)

圧縮後の新しい角度式は次のとおりです。

(式4)

式 4 のマッピングにより、新しい角度はそれぞれ [0,] の範囲内になります。さまざまな方法で画像をエンコードするために使用される量子ビットを以下の表に示します。

02 量子ニューラルネットワーク

この論文では、量子ニューラル ネットワークの 2 つの層構造、CRADL (Color-Readout-Alternating-Double-Layer) と CRAML (Color-Readout-Alternating-Mixed-Layer) を提案しています。回路内には異なる機能を持つ 3 種類の量子ビットがあり、それぞれ画素位置 (ピクセル)、画素色 (カラー) をエンコードし、出力結果 (読み出し) の測定専用の 1 量子ビットがあります。どちらの量子回路も XX ゲートまたは ZZ ゲートで構成されており、各ゲートは 2 量子ビット ゲートであり、最初の量子ビットはピクセル位置をエンコードするビット、2 番目の量子ビットはピクセルの色をエンコードする量子ビットです。出力。2 つの層構造の違いは、XX ゲートと ZZ ゲートの動作順序にあります。2 つの構造を図 1 と図 2 に示します。

図 1. 6 量子ビットの位置をエンコードするための CRADL 層。最初に連続ピクセル読み出し、ピクセルカラー XX ゲートに作用し、次に同様の構造を持つ ZZ ゲートに作用します。(出典:論文原文)

図 2. 6 量子ビットの位置をエンコードするための CRAML 層。ピクセル読み出し、ピクセルカラーの XX ゲートと ZZ ゲートが交互に動作します。(出典:論文原文)

量子ニューラルネットワーク層が初期状態に作用した後、著者は読み取ったビットに対してZ測定を実行して古典的な結果を取得し、損失関数としてヒンジ損失を使用し、確率的勾配降下法を使用して層内のパラメータを最適化します。 。

03 実験結果

著者は、MNIST の 3 と 6 について、古典と量子の 2 つのカテゴリを含む 5 セットの実験を実行しました。まず、画像がダウンサンプリングされて 2 値化され、その結果が図 3 に示されています。

図 3. さまざまなダウンサンプリング解像度でのデジタル画像。一番上の行は、元のデータセットと同じ、0 ≤ color ≤ 1 の範囲の色を持つグレースケール画像です。一番下の行は、上の対応する画像のピクセル カラーを閾値処理することによって得られた白黒画像です。(出典:論文原文)

実験では、著者は、二重の隠れ層で構成され、活性化関数が ReLu である古典的なニューラル ネットワークを使用して、8x8 と 16x16 の画像を分類しました。量子ニューラル ネットワークでは、作成者はすべての CRADL 層を使用し、非圧縮 FRQI エンコードで 8x8 画像を分類し、圧縮 FRQI エンコードで 8x8 および 16x16 画像を分類しました。

上記の論文の結果を MindSpore Quantum で再現し、結果を改善するために損失関数として MSE を使用します。分類精度は次の表に示されています。

トレーニング プロセス中のテスト セットの正解率の変化の比較を図 4 と図 5 に示します。

図 4. 論文の結果 (出典: 論文の原文)

図 5. 再現された結果

反復分類の精度は論文と基本的に同じである. 16x16 画像下の量子ニューラル ネットワークでは、MSE の使用により精度が約 7% 向上した. 反復トレーニング プロセスの傾向は基本的に論文と同じ紙の中で。

引用:

[1]Le、PQ、Dong、F.、およびhirota, K. (2011)。多項式の準備、画像圧縮、および処理操作のための量子画像の柔軟な表現。量子情報 プロセス.10 63–84。

おすすめ

転載: blog.csdn.net/Kenji_Shinji/article/details/131420339