主な貢献:
対応するアルゴリズムとアーキテクチャのマッピングと効率的な実装を備えた完全なバイナリ ネットワーク (bCorNET) トポロジ。CorNETを量子化すると計算量が削減され、モーションアーティファクトの低減効果が得られます。このフレームワークは、22 の IEEE SPC 被験者で 6.67±5.49 bpm の MAE を達成します。この設計は ST65 nm テクノロジー フレームワークを採用し、1 MHz で 3 GOPS を実現し、ウィンドウあたり 56.1 μ J \μ Jを消費します。μ Jは 1634K NAND2 相当のセル領域を占有し、PPG 信号からの 2 秒ごとの推定 HR 遅延は 32 ms になります。重要なのは、CNN LSTM ネットワークをハードウェアで直接構築することです。このアルゴリズムとハードウェアは強すぎるでしょう!
理论部分の量化公式:
quantize ( x ) =round ( Clip ( x , − 1 , 1 ) × M ) / MQ ( x ) = s × quantize ( x − ps ) + p \begin{gathered} quantize(x) =round(clip(x,-1,1)\times M)/M \\ Q(x)=s\times quantize\left(\frac{xp}{s}\right)+p \end{gathered}量( x ) _ _ _ _ _=ラウンド(クリップ( x , _ _ _ _ _ _− 1 、1 )×男)/男Q ( × )=s×質問してください_ _(sバツ−p)+p
アルゴリズムのフローチャート:
ハードウェア実装フローとタイミング図:
ハードウェア実装:
CNN1 単一層の実装:
バイナリライザーのアーキテクチャ:
バイナリ最大プーリング単位:
転置バッファの構造:
CNN:
LSTM:
bLSTM タイミング図:
実験結果:
**参考:**
Wrist-PPG からの心拍数推定のためのバイナリ CorNET アクセラレータ