【良書推薦・第30号】開発者の方はご注意ください!因果推論と機械学習、ついに誰かがわかりやすく説明してくれる!

今日はすべての読者に良い本をお勧めします。「機械学習の高度な実践: 計算による広告、需要と供給の予測、インテリジェント マーケティング、ダイナミックプライシング」良い本のリンク< /span>

2023 年の初めは人工知能の爆発的なマイルストーンであり重要な段階です。OpenAI によって開発された GPT に代表される大規模モデルは非常に人気があり、NLP 分野の ChatGPT モデルは非常に人気があり、人々の間で激しい議論を引き起こしています。 GPT-4 の最新アップデートでは、大規模マルチモーダル モデルが飛躍的に進歩し、画像とテキストの入力を同時に受け入れ、正しいテキスト応答を出力できるようになりました。人工知能に携わる多くの同僚は、GPT-4 の優れたパフォーマンスに驚く一方で、自分のキャリアについて心配しています。 「大きなコンピューティング能力 + 強力なアルゴリズム」という大規模なモデルが人工知能の将来の開発トレンドである場合、従来の機械学習アルゴリズムは実際のビジネス シナリオでも依然として有用でしょうか?遅かれ早かれ大型モデルに置き換わるのでしょうか?私はそうは思わない。すべてのビジネス シナリオには独自の特徴があり、優れたアルゴリズム エンジニアにとって最も価値のあることは、ビジネス知識の徹底的な理解と長期的な蓄積です。ビジネス知識は機械学習プロジェクトの大木の根のようなもの、理論的知識は大木の枝のようなもの、アルゴリズム アプリケーションはその枝にある葉のようなものです。根が十分に深くなければ、この大木は枝分かれすることができません。 . ゆるやかな葉、花、果実。これまでのところ、大規模モデルは、刻々と変化し、複雑かつ多様なビジネス形態を理解して考える人間のアルゴリズムエンジニアのレベルにはまだ達していませんが、いつか大規模モデルに基づいてさまざまなビジネスシナリオに対応するアルゴリズムアプリケーションを開発できるようになったとしても、それは実現するでしょう。アルゴリズム エンジニアは、急速に変化し、複雑で多様なビジネス形態を理解して考えることは依然として困難であり、アルゴリズム エンジニアは、大規模なモデルが特定のビジネス シナリオを効果的に学習できるよう、強力なビジネス能力と機械学習の確かな理論的知識を持っていることが求められます。

人工知能が爆発的に成長する時代における機械学習の実践者は間違いなく幸運であり、人工知能を人間の生活のあらゆる側面にどのようにより適切に統合するかは、この時代に解決すべき重要な課題です。 Didi International のシニア アルゴリズム エンジニアである Wang Congying 教師は、多くの新人は業界に入った当初に高レベルのモデル理論を暗記することが多いが、実際に適用する際には方法を理解し、重要なポイントを把握することができないことを発見しました。その結果、良い鋼が役に立たなくなり、最先端のビジネスでは実際の利益を得ることができなくなります。新人を入門から習得まで、理論から実践までガイドできる技術書があれば素晴らしいと思います。これにより、会社は新人の研修コストを節約できるだけでなく、新人が学び、成長するための余地も残されます。自分の。

この当初の意図を念頭に置き、王氏は空き時間を利用して、Xiaobi から資格のあるアルゴリズム エンジニアに至るまでの自分と同僚の成長プロセスとプロジェクトの経験をレビューし、要約し、最終的にこの本の中で「高度な実践」を執筆しました。機械学習: 計算による広告、需要と供給の予測、インテリジェント マーケティング、およびダイナミックプライシング」では、彼の経験を通じて、機械学習アルゴリズムに興味のある読者を真に支援できることを願っています。

JD 購入リンク:https://item.jd.com/14256304.html
ここに画像の説明を挿入します
この記事では、書籍の一部を抜粋しています。このコンテンツでは、誰もが関心を寄せている機械学習と因果推論の分野で新たに登場した分野を簡単に紹介します。

1. 因果推論

因果推論は、機械学習の分野で近年新たに登場した分野であり、主に「鶏が先か卵が先か」の問題を解決します。したがって、因果推論と相関の主な違いは次のとおりです。 因果推論は、変数 X の変化を通じて結果 Y に対する変数 X の影響を推論しようとしますが、相関は、2 つの変数などの変数間の傾向の変化を表現することに焦点を当てます。 2 つの可変画像は、画像の増加に伴って画像が増加する場合は、画像と画像が正の関係にあることを意味し、画像の増加に伴って画像が減少する場合は、両者が負の関係にあることを意味します。したがって、因果関係と相関関係には本質的な違いがあります。読者の理解を深めるために、ここに例を示します。

ある研究では、朝食を食べる人は朝食を食べない人よりも体重が軽いことが示されたため、「専門家」は朝食を食べると体重を減らすことができると結論付けました。しかし実際には、朝食を食べることと低体重の間には因果関係ではなく、相関関係がある可能性があります。朝食を食べる人は、規則的な食事、規則的な運動、十分な睡眠などの一連の健康的なライフスタイルを実践している可能性があり、それが最終的に体重の減少につながります。図 1 は、因果推論における交絡因子を示しており、健康的なライフスタイル、朝食の摂取、および低体重の関係を示しています。
ここに画像の説明を挿入します
明らかに、健康的なライフスタイルを持つ人は朝食を食べるでしょう。また、健康的なライフスタイルは体重の軽さにつながります。健康的なライフスタイルが朝食を食べることと体重が軽いことの共通の原因であることがわかります。 。このような共通の理由が存在するからこそ、朝食を食べることと低体重との間に因果関係があるとは簡単に結論付けることができず、「専門家」の結論は性急であると考えられます。朝食を食べることと体重減少の間には相関関係があるだけで、因果関係はありません。因果関係の推論を妨げる共通の原因は交絡因子と呼ばれます。図1の右側にあるように、交絡因子を排除し、2つの変数間の因果関係を見つけ、ある独立変数Xの変化が従属変数Yの変化に影響を与える程度を定量化することが、因果推論の主な内容です。 。

2. 因果推論の過去と現在

統計学と機械学習の分野における因果推論の発展の歴史を振り返ると、1978年に有名なRCM(ルービン因果モデル、潜在的因果関係の枠組みに相当)を提案したドナルド・ルービンという二人の偉人を挙げなければなりません。もう一人は、1995 年に因果図フレームワークを提案したジューデア・パールです。 2021年10月のノーベル経済学賞は、因果関係の分析に顕著な貢献を果たしたジョシュア・D・アングリスト氏とグイド・W・インベンス氏に授与される予定で、彼らの因果関係の研究は、ルービンが提案した潜在的結果の枠組みに基づいている。推論 現場への影響は明らかです。ルービンのもう 1 つの主な貢献は、観測データの交絡因子の問題を解決する PSM (傾向スコア マッチング) フレームワークを提案したことです。 Pearl が提案した因果図フレームワークは、ルービンの RCM フレームワークから完全に分離されており、変数間の因果関係を視覚的に表現するために有向非循環グラフを使用します。因果関係図のアイデアは、2011 年に因果推論の研究のために提案されました。スピリット賞を受賞しました。因果推論の分野における 2 人の巨人が、この分野で 2 つの異なるフレームワークを作成しました。パールは 2000 年に 2 つのフレームワークが同等であることを証明しましたが、ルービンは彼の見解に同意しませんでした。ルービンは、潜在的な結果のフレームワークがより明確になる可能性があると信じていました。現在、因果推論の分野では、因果関係図よりも因果推論、潜在的結果フレームワークの方が一般的に使用されている分析フレームワークです。以下では、2 つの因果推論フレームワークの分析的観点を紹介します。

(1) 潜在的な結果の枠組み

潜在的な結果のフレームワークを紹介する前に、個々の因果関係を説明するために記載する必要がある 2 つの仮定を最初にリストします。さらに、誰もがより早く始められるように、この記事では二項扱いのみについて説明することに注意してください。 2 つの状況を処理し、2 つの処理方法の結果に対応します。

ここに画像の説明を挿入します
しかし、現実世界では、個々の画像は同時に処理されるか処理されないかのどちらかであり、同時に処理されることと処理されないことは不可能であるため、個々の因果関係を特定することはできません。

個人の因果関係がわかっていても特定できない場合、どのように因果推論を行うのでしょうか?おそらく効果的な解決策は、因果関係の特定を個人から身体全体に移すことであるため、平均治療効果 (ATE、平均治療効果) の概念が誕生しました。平均因果効果は、個人の因果効果を比較するのではなく、異なる治療を受けた 2 つのグループの潜在的な結果を比較します。異なる治療を受けることに加えて、2 つのグループは均一な属性を持っている必要があります。このようにして計算された平均は因果効果です。ランダム化比較試験(RCT)は、2 つのグループにおける不偏性を確保するための基本的な実験方法です。データ全体がランダムに実験グループ (治療グループ) と対照グループ (対照グループ) に分けられます。実験グループは T=1、対照グループは T=0 です。平均因果効果の式は次のとおりです。 ATE=E(Y(1)-Y(0))

このうち、Y(1)、Y(0)はそれぞれ治療を受けた条件下での実験群の結果、治療を受けていない条件下での対照群の結果である。ここまで、潜在的結果の枠組みに基づいた因果推論の基本的な理論的知識を説明しましたが、要約すると、次の 2 つの主要な点があります。

1) ランダム化比較試験により、グループの均一性が保証されます。

2)評価不可能な個別の因果効果から、全体の平均的な因果効果の評価へ。

ランダム化比較試験は一体全体でしょうか?実際にはそうではありません。次のような質問を想像してください。「がん患者に対する抗がん剤 A の因果関係を評価したいのですが、このシナリオでもランダム化比較試験を実施するのは適切でしょうか?」答えは明らかに「ノー」です。第一に、がんは重篤な病気です。人道上の理由から、抗がん剤治療なしで対照群を完全にランダムに選ぶことは不可能です。第二に、たとえ献身的ながん患者が治療に参加することに同意したとしても、ランダム化比較試験、医療の文脈では、長い実験期間と高額な費用もランダム化比較試験の最大の欠点です。上記の例から、現実のすべてのシナリオがランダム化制御実験に適しているわけではないことがわかるため、研究者は観測データに一連の処理を実行することでランダム化制御実験の効果を達成しようとします。 Rubin 著、傾向スコア マッチング (PSM)。

(2) 構造因果モデル(SCM)

構造因果モデルは、2 つの変数間の因果関係をグラフ構造に基づいて記述します。そのため、SCM を導入する前に、まずベイジアン ネットワークについて理解しましょう。ベイジアン ネットワークは、有向非巡回グラフ (DAG) に基づく確率的グラフィカル モデルです。それ自体で因果関係を表現することはできません。変数間の相関関係を表現しますが、ベイジアン ネットワーク有向非巡回グラフは、構造因果モデルのグラフ構造の基礎であり、確率ベイジアンネットワークの計算手法は構造因果モデルの推論基盤でもあります。

有向非巡回グラフはノードと有向枝で構成され、有向枝の上流が親ノード、有向枝の指す方向が子ノードとなります。 DAG 内のノードの親ノードとその子以外のノードは独立しています。合計確率公式と条件付き独立性に従って、有向非巡回グラフ内のすべてのノードの結合確率分布は次のように表すことができます。

ここに画像の説明を挿入します
ピクチャは、それを指すすべてのピクチャの親ノードです。読者が有向非巡回グラフの結合分布式をよりよく理解できるように、図 2 に示すように、ここでは具体的な DAG の例を示します。

ここに画像の説明を挿入します
有向非巡回グラフの条件付き独立性と結合確率分布の公式によれば、図 2 の結合分布は次のように表すことができます。

ここに画像の説明を挿入します
各有向非巡回グラフは一意の結合分布を生成しますが、結合分布は必ずしも 1 つの有向非巡回グラフのみに対応するとは限りません。たとえば、 P (X1, X2) の結合確率分布は X1->X2 である可能性があります。このため、ベイジアン ネットワークは因果関係モデルには適していません。 DAG を因果関係を表現できる因果グラフに変換するには、do 演算子を導入する必要があります。ここで do 演算子は介入を表します. do(Xi) はノード Xi を指すすべての有向辺を切り取り, ノード Xi に定数値を代入することを意味します. do 演算子が介入した後, DAG の結合確率分布は変化します. 、次の形式で表現されます。

ここに画像の説明を挿入します
引き続き図 2 を例として、do 演算子がノード X3 に介入すると仮定すると、介入後の DAG の同時確率分布は次のように表されます。
ここに画像の説明を挿入します
要約すると、 do 演算子を使用した DAG 図は因果関係を表現でき、その平均的な因果関係式は次のとおりです。
ここに画像の説明を挿入します
do 演算子を使用した DAG 図は因果推論の魂を持っていますが、新たな問題が発生します。 . 、すべての実践的な問題が明示的なグラフ構造を与えるわけではありません。実際の状況のほとんどは、グラフ構造もすべての変数も観察できないことです。上記の問題を解決するために、Pearl はバックドア基準という手法を提案しましたが、バックドア基準を導入する前に、まず d 分離の概念を見てみましょう。

d-分離の正式名は方向性分離であり、変数が独立しているかどうかを判断する方法です。主にグラフ構造である因果関係図の場合、図 3 に示す 3 つの一般的なパス構造があります。
ここに画像の説明を挿入します
図 3 には、チェーン、フォーク、インバースの 3 つのパス構造があります。 fork. , アンチフォーク構造の A と C は当然互いに独立しており、B はコライダー、チェーン、またはフォーク構造とも呼ばれます。B を条件として使用すると、A と C の関連付けをブロックして、A を実現できます。 C は互いに独立しています。 D 分離は、変数の独立性の目的を達成するために、異なるパス構造に対するブロック操作であり、具体的な d 分離規則は次のように要約されます。

1) 特定のパス上に特定の変数を指す 2 つの矢印が同時にある場合、その変数はコライダーと呼ばれ、このパスはコライダーによってブロックされます。
2) パスに非コライダーが含まれている場合、非コライダーが条件の場合、このパスはブロックされる可能性があります。
3) 特定のパスがコライダーで条件付けされている場合、このパスはブロックされないだけでなく、開かれます。
ここで注意が必要なのは、変数を条件として使用するとは、ある変数の値を指定することです。たとえば、年齢変数を条件として使用する場合は、年齢を 0 または 1 で指定することを意味します。 。

特定の変数に基づいて d 分離ルールをブロックして変数間の独立性を実現できることを理解した後、バックドア基準を組み合わせて交絡因子を排除し、未知の構造の因果図に対して因果推論を行うことができます。バックドアのガイドラインを明確にする前に、バックドア パスとフロントドア パスの概念を理解する必要があります。変数 X から変数 Y へのバックドア パスは、X から Y に接続するパスですが、矢印は X から始まりません。対応するフロントドア パスは、X から Y に接続するパスで、矢印はすべて d 分離ブロックから始まります。 X と Y の間にバックドア パスが存在すると、X から Y への因果関係が特定できると考えられ、バックドア パスをブロックする要因を交絡因子と呼びます。このとき、バックドアの基準を知っている手法は、すべての変数を観察する必要はなく、どの変数がバックドアパスを条件として排除できるかを観察するだけで、XとYの因果関係を特定することができる。

(3) 概要
潜在的結果フレームワークであれ構造的因果モデルであれ、因果推論は主に原因から結果 Y を推論するプロセスです。一般的に交絡因子はありません。 、データサンプルが十分で実験条件が許せば、ランダム化比較実験が行われます。ランダム化比較実験ができない条件の場合、観察データを処理することで原因 X に対する交絡因子の影響を排除できます。

ここに画像の説明を挿入します

3. まとめ

開発者向けに調整された高品質のコンテンツに加えて、この本は多くの専門家からも認められ、推奨されています。

ここに画像の説明を挿入します
ここに画像の説明を挿入します

4. 書籍のプレゼント条件

JD 購入リンク:https://item.jd.com/14256304.html


1. 点赞+收藏 文章
2. 评论区留言:我要成为架构师(留言才能进入奖池,每人最多留言三条)
3. 周五晚(2023121号)八点随机抽奖34. 京东购买链接:https://item.jd.com/14256304.html

おすすめ

転載: blog.csdn.net/weixin_51484460/article/details/134643483