フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

計量経済学に従事する人は誰でもこのアカウントに注意を払います

原稿:[email protected]

すべてのコードプログラム、マクロおよびマイクロデータベース、および計量経済学サークル方法論のさまざまなソフトウェアがコミュニティに配置されています。交換と訪問のための計量経済学サークルコミュニティへようこそ。
フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

関連する測定方法のビデオコース、記事、データ、およびコードについては、1を参照してください。パネルデータ方法の無料コース、記事、データ、およびコードはすべてここにあり、優秀な学者が収集して学習します。2.ダブルディファレンシャルDIDメソッド、記事、データ、コードの無料コースがすべてここにあります。優秀な学者は収集して研究する必要があります。3.操作変数のIV推定のための無料のコース、記事、データ、およびコードはここにあります。学習しなくても後悔しないでください。4.さまざまなマッチング方法、記事、データ、コードに関する無料のコースがすべてここにあります。マッチング方法を習得することは夢ではありません。5.ブレークポイント回帰RDと合成制御法SCMの無料コース、記事、データ、コードがすべてここにあります。注意深く勉強する必要があります。6.宇宙測定、記事、データ、コードに関する無料のコースがすべてここにあります。宇宙関連の学者はそれらをチェックするために注意を払います!7.Stata、R、Pythonのビデオコース、記事、データ、コードがすべてここにあり、本当に便利です!

テキスト

コンテンツの下のテキストについて、著者:Wu Aoba、オーストラリア国立大学ビジネススクールおよび経済学部、コミュニケーションメール:[email protected]

著者の前の記事:

①三田、2020年ノーベル賞RDDクイーンの最も影響力のある傑作、データと測定手順

②選択したモデルは本当に正しいのか?75のトップ外国ジャーナルについての真実を見て、最も権威のある使用戦略を提示する

Pedro HCSant、AnnaJunZhao。(2020)。二重にロバストな差分差分推定量。計量経済学ジャーナル。

この記事では、差分差分(DID)研究デザインにおける、処理済み(ATT)に対する平均処理効果の二重にロバストな推定量を提案します。代替のDID推定量とは対照的に、提案された推定量は、傾向スコアまたは結果回帰作業モデルのいずれか(必ずしも両方ではない)が正しく指定されている場合に一貫性があります。また、パネルまたは繰り返し断面データのいずれかが利用可能な場合、DID設計のATTのセミパラメトリック効率限界を導き出し、提案された推定量が、作業モデルが正しく指定されたときにセミパラメトリック効率限界を達成することを示します。さらに、繰り返しの断面データの代わりにパネルデータにアクセスすることによる潜在的な効率の向上を定量化します。最後に、迷惑パラメータの推定に使用される推定方法に特に注意を払うことにより、ATTに対して二重にロバストなDID推定量を構築できる場合があり、推論に対しても二重にロバストであることを示します。シミュレーション研究と経験的アプリケーションは、提案された推定量の望ましい有限サンプル性能を示しています。提案されたポリシー評価ツールを実装するためのオープンソースソフトウェアが利用可能です。

要約:
この記事では、DIDモデルでDR推定法を使用して、実験グループの平均効果(ATT)を提案します。DID推定量と比較して、傾向スコアまたは結果回帰モデルが正しく設定されている場合、推定量は一貫しています。さらに、著者は、パネルデータまたは繰り返し断面データの場合のDIDモデルにおけるATTのセミパラメトリック有効範囲も導き出し、著者によって提案された推定量のセミパラメトリック有効範囲が次のようになることを証明します。モデルが正しく設定されている場合に取得されます。さらに、著者らは、繰り返される断面データの代わりにパネルデータを使用することによる潜在的な効率の向上を定量化しました。最後に、著者は、ATT用に構築された二重ロバスト推定量が統計的推論に対しても二重ロバストである場合があることを証明します。
1.はじめに
DIDは、観測データを使用してポリシーを評価するために研究者が使用する最も一般的な方法です。その古典的なモデルでは、DIDは、実験の前後の2つのグループの結果を比較することによって実験グループの平均効果を決定します。1つのグループをテストし、もう1つのグループをコントロールとして使用しました。因果関係の説明を容易にするために、研究者は通常、Parallel Trend Hypothesis(PTA)を引用します。実験の前に、実験グループと対照グループの平均値は一定期間平行です。PTAは基本的にテスト不可能ですが、その信頼性はしばしば疑問視されます。観察された特性が結果の​​進化に関連していると見なされ、結果の進化が2つのグループ間でバランスが取れていないかどうか。この場合、研究者は通常、標準のDIDモデル設定から逸脱し、実験前の共変量をDIDモデル分析に組み込み、PTAはこれらの共変量条件下でのみ満たされると想定します。
この記事では、共変量の条件に基づいてPTAの仮定が満たされた場合に、DIDモデルのATT推定量のロバスト性と妥当性を研究しています。著者は、パネルデータの場合と繰り返し断面データのみの場合の両方を検討しました。著者は、さまざまな側面でDIDの研究に貢献してきました。まず、著者はDIDモデル設定の下でDR法によるATTの推定を紹介し、傾向スコアと結果モデルが正しく設定されている場合、DR法の推定結果が一貫していることを証明しました。著者は、DR法を使用したATTの2つの異なる推定を提案しています。これらは同じ実験グループに属していますが、1つは治療前の結果の回帰に基づいており、もう1つは治療後の結果の回帰に基づいています。それにもかかわらず、著者らは、DRメソッド推定量がそのような選択に依存しないことを発見しました。
次に、著者はDID設計の下でATTのセミパラメトリック有効範囲を導き出します。著者は、研究者が傾向スコア関数と結果回帰関数をある程度理解しているとは想定していないため、著者が導出したセミパラメトリック有効範囲はノンパラメトリックです。したがって、これらの境界は、研究者がATTのセミパラメトリックDID推定値を比較できる基準を提供します。これらのセミパラメトリック有効範囲には、認識仮説によって暗示されるすべての制約が明示的に含まれていることも強調する価値があります。これらの制限は、パネルデータであるか繰り返し断面データであるかによって異なることが重要です。どちらの場合も、条件付きPTAによって暗示される制約が含まれますが、断面データが繰り返される場合は、識別仮説によって暗示される制約、つまり共変量と処理状態の同時分布も含まれます。サンプリング期間の影響を受けません。これらの暗黙の制約が考慮されない場合、導出された効率境界の違いにつながることを強調する必要があります。これは、実際にはそうではないのに、一部の推定量がセミパラメトリックに有効であることを示している可能性があります。
セミパラメトリック有効範囲を使用すると、いくつかの質問に答えることができます。たとえば、繰り返しの断面データの代わりにパネルデータを使用すると効率が向上するかどうか疑問に思うかもしれません。これら2つの設定で有効範囲を直接比較すると、上記の質問に対する答えは肯定的であるだけでなく、実験の前後に繰り返される断面データのサンプルサイズがより不均衡である場合にもわかります。ゲインは大きくなる傾向があります。
著者が議論するもう1つの問題は、DR法を使用してDIDモデルを推定する記事で提案された推定量が、セミパラメトリック有効限界に到達できるかどうかです。著者は、傾向スコアリング作業モデルと対照群の結果回帰モデルが正しく設定されている場合、DR DID推定量はパネルデータ設定では部分的に有効ですが、断面データ設定では有効ではないことを示しています。実際、繰り返しの断面データしかない場合、著者は、傾向スコアモデルと実験群および対照群の結果に応じて回帰モデルが正しく設定されている限り、DRDID推定量が到達できることを発見しました。セミパラメトリック有効限界。著者は、局所的な有効推定量の代わりに非効率的なDR DID推定量を使用した場合の効率損失を定量化し、モンテカルロシミュレーションによって損失が非常に大きいことを示しました。
この記事で提案されている方法は、干渉関数の線形および非線形の作業モデルに適しています。一般的なパラメータ作業モデルが干渉関数に使用される場合、作成者は、DRDID推定量の画像の一貫性と漸近正規性を確立します。著者によって提案された推定量の漸近分散の正しい形式は、傾向スコアおよび/または結果回帰モデルが正しく設定されているかどうかによって異なります。実際の適用過程では、どのモデルが正しく設定されているかわからないため、漸近分散を推定する際には、最初の推定量すべての推定効果を考慮する必要があります。そうしないと、無効になる可能性があります。統計的推論。
この記事の3番目の貢献は、冗長パラメーターの推定に使用される推定方法を観察することにより、DIDモデルで単純な計算可能なATT推定量を確立できる場合があることです。DRの一貫性とローカルセミパラメトリック効果だけでなく、ダブルロバスト。
2.関連文献
の理論的枠組みは、主に因果推論研究の2つの分野に基づいています。まず、この記事の方法論は、Imbens and Wooldridge(2009)のセクション6.5やその参考文献など、他のDID文献に本質的に関連しています。この記事に関連するこのブランチの2つの主な貢献は、1997年にHeckman et al。によって提案されたカーネル関数に基づくDIDモデルの回帰推定量と(パラメトリックおよびノンパラメトリック)DID逆確率加重(IPW)推定量です。 Abadie(2005)によって提案されました。著者らは、共変量の次元が非常に高い場合、または中程度の場合でも、完全にノンパラメトリックな方法では通常、有用な推論が得られないことに注意しています。この場合、研究者は通常、パラメトリック手法を使用します。この記事で提案されているDRDIDは、後者の種類に属します。
第二に、記事の内容は、双安定推定に関する古典的な文献、たとえば、Robins et al。(1994)、Scharfstein et al。(1999)、Bang and Robins(2005)、Wooldridge(2007)、 Chen et al。(2008)、Cattaneo(2010)、Graham et al。(2012,2016)、Vermeulen&Vansteelandt(2015)、Lee et al。(2017)、Sloczynski&Wooldridge(2018)、Seaman&Vansteelandt(2018)。最近、DR推定法は、適応データと機械学習を使用して干渉関数を推定する際にも重要な役割を果たしています。たとえば、Belloni et al。(2014)、Farrell(2015)、Chernozhukov et al。(2017)、Belloni et al。 。(2017))およびTan(2019)。一方、著者は、上記の論文が「観測の選択モデル」または「IV / LATE」タイプの仮定に焦点を当てていることに気づき、著者は特に条件付きDIDモデルの設計に注目したので、記事は既存の研究への追加と矛盾していました。
DIDフレームワークの下でATT推定量のセミパラメトリック有効範囲を導出するために、この記事はHahn(1998)とChen et al。(2008)の研究に基づいています。著者は、上記の論文から導き出されたセミパラメトリック有効境界の構造に従いますが、結果はクロスの下での「選択モデル」タイプの仮定に依存するため、著者によって導き出されたセミパラメトリック有効境界は彼らの研究を補足します。断面データの設定。DIDのモデル設計に焦点を当てます。
DR DID推定量のさらなる改善に関する研究は、Vermeulen&Vansteelandt(2015)の研究に基づいています。彼らは、観測可能なタイプの選択を前提として、断面データ設定における統計的推論のためのDR推定量を提案しました。傾向スコア推定量が記事の重要な部分であるため、記事の内容もGraham et al。(2012)に基づいています。
最後に、記事に関連しているが記事の内容とは無関係に、Zimmert(2019)の研究があります。彼は、高レベルの条件下で、研究者は機械学習の最初の推定量を使用してDIDのATT統計を推定できることを提案しました。モデル。彼の研究結果は著者の研究結果を補足しますが、著者は繰り返し断面積の推定が著者によって導き出されたセミパラメトリック有効限界に達していないことに気づき、効率の損失も一次的に重要です。同時に、著者は、Zimmert(2019)がパネルデータと繰り返される断面データアプリケーションの詳細な比較を提供しておらず、モデルが正しくない場合に非常に関連するDRの推論プロセスについても説明していないことにも気づきました。セットする。
3.DIDモデル
1.背景
記事で使用されるモデル記号は次のとおりです。
フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!
フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!

フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!
フロンティア:2倍の堅牢なDID、DIDにロックを追加してください!
結論とモデル表現の感度を評価するために、著者は3つの異なるモデル表現を検討しました。(i)すべての共変量が線形である線形モデル。(ii)DWに基づいて、年齢の2乗を加算します。線形モデルの、年齢の3乗を1000で割った値、教育年数の2乗、1974年のゼロ所得のダミー変数、1974年の教育年数と実際の所得の積変数。 DWモデル、既婚および1974年を追加実質所得の積変数、1974年の既婚およびゼロ所得の積変数。
表3は、結果をまとめたものです。STが指摘したように、これらの相対偏差は各サンプル内のDID推定値を比較するのに役立ちますが、ATTの実験ベンチマークは3つの実験サンプル間で大きく異なるため、サンプル間の比較には使用しないでください。表3は、他のいくつかの現象も反映しています。第1に、双方向固定効果回帰モデルに基づく推定量は、さまざまなモデル表現で比較的安定していますが、それらはすべて有意な正の評価バイアスを示しています。第2に、回帰法に基づくDID推定量は、最も正確な推定につながります。ただし、ラロンドのサンプルでは、​​点推定が大幅に過小評価されており、評価に大きな偏りが生じています。AbadieのIPW推定量は、すべての推定量の中で最大の標準誤差を持っていますが、その評価バイアスは比較的小さいです。モンテカルロシミュレーション結果と同様に、標準化されたIPW推定器は推定の安定性を向上させることができます。最後に、著者は、DR DID推定量には、AdadieのIPW推定量の評価誤差が小さいという利点があるだけでなく、標準偏差も小さいことを発見しました。同時に、比較を通じて、著者は、提案したDR DID推定値が、既存のDIDフレームワークの貴重な代替手段であることを発見しました。
画像

7.まとめ
DIDモデルでは、実験前の共変量に基づく並列傾向の仮定が満たされると、著者はATTの二重ロバスト推定を提案します。傾向スコアリングモデルまたは結果回帰モデルのいずれかが正しく指定されている場合、作成者によって提案された推定量は一貫しています。作業モデルの干渉モデルも正しく指定されている場合、セミパラメトリック有効限界を取得できます。同時に、著者は、この推定量がモンテカルロシミュレーションと経験的アプリケーションを通じて因果推論ツールとして使用できることも確認しています。
以下の短いリンクの記事はコレクションに属しています。それらを収集して読むことができます。そうしないと、将来それらを見つけることができなくなります。

おすすめ

転載: blog.51cto.com/15057855/2674776