アプリケーション隠れマルコフモデル(HMM)オプション:お金攻略にするシモンズ

要約

神は円を定量化する定量化した後、シモンズが広く求められている、ファンドのメダリオンは、数多くの神話を作成しました。ウェールズアルゴリズム-初期の頃の創設者は、広く音声認識および他の分野バウムで使用される発明した科学者があります。隠れマルコフモデル(HMM)が成功した工学の分野で適用され、科学的意義と応用価値の重要な成果を達成してきました。

この記事シモンズメダリオン基金の武器-隠れマルコフモデルは、パターン認識の在庫データ配列によって、私たちの国で株式市場を予測する市場動向を予測します

 

I.はじめに:メダリオンについてましょう話

シモンズは広く神定量化、2008年の世界的な金融危機の量子化サークルの後に求められている、ほとんどのヘッジファンドは80%と高いとしてその利益の文脈でお金を失いました。

シモンズは、ルネッサンス・テクノロジーズは、物理学者や数学者のグループを持って設立された、人々のこのグループは、お金を稼ぐためにどのような武器を思い付く最後に一緒に取得しますか?外の世界は、推測されています。これの意見、隠れマルコフモデルがまた出て選出されるためにいくつかの理由です。

この記事では、在庫データ系列パターン認識の市場動向を予測することによって、私たちの国で株式市場を予測するためのマルコフモデルを非表示になります。

 

二、HMMの例と原則

まずマルコフ連鎖の簡単なレビュー。マルコフ連鎖は、離散事象確率過程は、自然のマルコフインデックスの科学を持っています。以下のように数学的に表現するマルコフ:

マルコフ古典的な例:

将来の気象条件を予測することは、現在の天気によります。一つの方法は、毎日の気象条件であると仮定することであるだけに依存状態の前日。次のショーの天気を予測するためのマルコフモデルの状態遷移図:

次のように気象予測モデルは、状態遷移行列を想定しています。

行列表現昨日が曇った場合、今日に25%が存在する可能性が高い晴れであることが、12.5%の確率曇った、雨の62.5%の確率は、各行列の行とが1であることは明らかです。

このようなシステムを開始するために、我々は、初期確率ベクトルが必要になります。

初日のためのベクターは晴れです。ここで、我々は、次の3つの部分を定義した一次マルコフ過程の上にあります。

ステータス:晴れ、曇りや雨。

初期ベクトル:確率が0である時のシステム状態の定義。

状態遷移行列:各気象遷移確率。すべてのこのようなシステムを記述することができマルコフ過程です。

 しかし、いくつかのケースでは、十分ではない、我々はパターンを見つけたいマルコフ過程を説明します。観察シーケンスと暗黙的変数に基づいてHMMモデルを確立し、パターン認識における特定の利点があります。

HMM(隠れマルコフ)古典的な例:

三つの異なるサイコロがあるとします。1つのダイスはD6として知られている6つの面を有し、各数は1/6の確率を向いているように見える、ダイス2をD4として知られている4つの面を有し、各数が確率を向いているように見える1/4です。 D8と呼ばれる8面を有する3つのダイスは、各数が確率は1/8である向いているように見えます。

今10をダイシングし、その仮定の数字の文字列を与えること:1635273524この文字列は、観測シーケンスと呼ばれています。しかし、隠れマルコフモデルでは、私たちは目に見えるチェーンの束だけでなく、隠された状態のチェーンの束を持っているので。この例では、この文字列の順序チェーンは暗黙のサイコロであなたのステータスです。D4 D6 D8 D6 D4 D8 D6 D6 D6 D4:例えば、隠れ状態鎖があってもよいです。

HMMマルコフ連鎖は、実際に来る一般的に、暗黙的な状態(ダイス)との間の遷移確率ため、暗黙状態鎖を意味します。

この例では、次の状態D6はD8確率が1/3である、D4、D6です。D4は、D8はD4、D6、D8遷移確率もある次の状態の1/3と同じです。これは、最初は簡単にクリアするための設定ですが、実際には、我々は、遷移確率を設定することは自由です。たとえば、私たちは、定義することができD6 D4を取り戻すことができない、D6の背後にあるD6は、確率が0.9である、確率D8は0.1です。これは新しいHMMです。

目に見える遷移状態間の確率が、そこには、状態間隠されていないと目に見える状態出力確率は、確率と呼ばれています。この例では、六面ダイス(D6)は、各番号の出力確率が1/6(ダイスが改ざんされていないと仮定して)で得ました。

そして、上記のような場合の状態シーケンスは、それを観察することができる隠された状態系列を確率に関係しています。私たちは隠されたマルコフ過程のこのタイプとマルコフ過程に関連する確率をモデル化プロセスにすることができ、状態は、この隠されたコレクションで観察できるように、隠れマルコフモデルである(隠れマルコフモデル)、HMMと呼びます。

HMMアルゴリズムと3つの質問:

株式市場のために我々は、多くの場合、次のような問題に直面している:私たちは、ドライバを知ることができないの後ろに株価を予測し、さらには株価原理の浮き沈みを予測するために限られた情報(価格、数量および変動性)に基づいて観察することを願って、 HMMの不足でこの予測モデリングプロセスには多くの類似点を持っています。

それぞれ焦点を当てHMMモデルの構築には、解決する問題の3種類

質問1:いくつかのサイコロ(暗黙の状態の数)があることを知って、サイコロのそれぞれは、(遷移確率)であるサイコロの結果に応じてどのような(可視チェーン)投げ、私は知りたいが、すべてを捨てることですダイス(暗黙状態鎖)。

質問2:いくつかのサイコロ(暗黙の状態の数)があることを知って、サイコロのそれぞれが何であるか(遷移確率)、サイコロの結果によると、私は確率は、この結果を投げる知りたい(可視チェーン)がスローされます。

質問3:いくつかのサイコロ(暗黙の状態の数)があることを知って、私はサイコロのそれぞれは、(遷移確率)であるかわからない、結果はサイコロ(可視チェーン)の何倍ロールを観察し、私は抗サイコロを起動したいです何ごと(遷移確率)。

第三に、証券の予測におけるアプリケーションHMM

 

音声認識処理におけるHMMの応用:

(1)まず、入力された音声は、それぞれのデジタル署名シーケンスから抽出され、モデル、局所最適パラメータ推定を訓練します。下に示すように、HMM音声認識モデルトレーニングプロセス:

認識を達成するために、最大出力確率モデルを得るために、様々なタイプのバックワードアルゴリズム尤推定モデル - (2)次に、入力音声認識は、その後、フォワードを使用する、デジタル署名シーケンスを、対応する抽出することによって、必要とされます。モデルHMM音声認識処理を以下に示します:

株式市場予測のためのHMMベースのパターン認識モデル:

(1)まず、前の分類に従って、順番に対応した在庫データを形成するために、いくつかの特徴的な指標(取引価格、ボリューム、など)を抽出、歴史の動向に同じデータに属している株式の日前に数週間の日付と番号を選択しますモデルへの入力として、バウム=ウェルチアルゴリズム及びトレーニング、トレーニングプロセスの様々なモデルの適用は、以下のように:

(2)第二に、訓練されたHMMモデルによれば、選択された株価指数入力シーケンスとして(取引価格、数量、等)、フォワードアプリケーションの数週間機能 - バックワードアルゴリズムは、最大値を選択し、各モデルの出現確率を算出します在庫移動の次の段階の結果の認識を得るために、対応する確率モデル。次のように図が確認さ:

四、HMM戦略実証結果

 

4.1ポリシー説明

オプションのインデックス: CSI 300指数。

時間間隔: 2007年7月23日2016年9月9日まで。

次のように私たちは、このような観測系列変数として異なる市場の上昇とアクティブなデータ構造の秋、売上高、売上高および受注日量に基づいています。

X1: 証券デイリーリターンレート;

X2: その日のすべての日々の流動性の資金純流入割合。

X3: 毎日の総流動性チェーン;

X4: 標準化、キャッシュフロー、すなわち:(毎日総流動性-昨年一年間の平均運転資本/流動性のボラティリティ。

X5: 環境上の回転率。

X6: 環境上の回転率。

X7: 標準化離職の日。

 

観察された異なる構成を選択する変数は、観測変数HMMモデルトレーニングの異なる組み合わせを用いて、それぞれ、変数を合わせ、すべての週のサンプルを(それぞれ上、下)は、2つのカテゴリに分類され、基礎となる指標の変更ケースに基づきます。

HMMたときに、インデックスの選択の原理に基づいて4.2、

インデックスに基づいてHMM2のHMM1と、入力変数として、新たな観測値の確率は、テープへの引き潮来週のレベルに基づいて決定された後、ロングとショートの操作:(ポイントアップ、2ダウン)に対応する訓練サンプルデータは、様々なタイプのモデルに基づいている得ました。また、戦略の大きな損失モデルの連続予測誤差を避けるために、我々は、停止信号メカニズムを追加しました:戦略アップ最後の信号のオープンは、蓄積されたときの損失が一定のしきい値(例えば5%)に達し、現在の位置でした次に表示される反対の信号までオープンしてから再オープン

4.3戦略のパフォーマンス

(1)短期考慮していません

信号は、2007年2016年7月20日9月9日JCPの間で450週で、その後、短いに関係なく、インデックスのショートポジション、空の場合、62倍、61倍の買いシグナル売り信号の総発行され、停止信号信号の損失が8回。平均売買シグナルごとに3.8週間に1回。これらの中でも、正確に250週の結果を予測し、正解率は56%、21.1パーセントの年率183パーセント戦略のリターンの累積率でした。

(2)短期を考えます

信号が空の場合、インデックスはショート・ポジションを開いた場合、2007 2016年7月20日9月9日JCPの間に450週で、信号停止信号を62倍と61倍の買いシグナル売り信号の合計を発行しました16、ストップロスとショートポジション31週間に起因。平均売買シグナルごとに3.8週間に1回。これらの中でも、正確に250週の結果を予測し、正解率は56%、899パーセントの戦略のリターンの累積率、年率103.9パーセントでした。

V.の概要

 

5.1、意義とイノベーション

報告書は、最初の学習の問題に取り組むことで、株価のボラティリティの予測問題HMMパターン認識モデルに導入し、HMMモデルが確立された問題を特定することが提案されたときの株価指数の選択に株式ベースの日々のリターンとキャッシュフローの日付と他の変数モデル、それが復帰精度のとき政策を予測し、かなりの理論と実践の意義と、比較的良好な結果を達成しているモデルを選択するかどうかを実証的テスト、。

HMMのアルゴリズムがかなり成熟ため、高効率を持って、良い効果と既存のデータやその他の特性によってモデルを訓練しやすいので、HMMモデルの株式のボラティリティのパターン認識が唯一の偉大な技術革新ではありません選択し、それは価値がありますディスカッションの選択。

5.2未満、モデル

予測精度は、(1)モデルをさらに向上させることができます。

入力ベクトルは、キーHMMモデルである(2)を選択し、この記事のは限界があるだけで、入力設定変数の株価、為替相場や資本の流れ、抽出することができる株式市場の情報のためです。

-------------------------

参考資料:

1.定量的戦略家の告白(グッドテキストを強くお勧めします)

市場で入手可能2.古典的な定量的トレーディング戦略はここにあります!(出典)

3.先物/在庫データDaquanのクエリ(歴史/リアルタイム/ティック/金融、など)

4.ドライ|、重要なモデル、定量金融Daquanの古典理論の簡単な歴史

定量化するための高頻度取引から5、5冊の本を読むことができません

6. HFT 4つの派閥大きな秘密

元の記事を公開 ウォンの賞賛6 ビュー4942

おすすめ

転載: blog.csdn.net/zk168_net/article/details/104690445