Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!

Cualquiera que se dedique a la econometría presta atención a esta cuenta

Manuscrito: [email protected]

Todos los programas de código, macro y micro bases de datos y varios software de la metodología del círculo econométrico se colocan en la comunidad Bienvenido a la comunidad del círculo econométrico para intercambios y visitas.
Frontier: DID doble robusto, ¡agregue un candado a su DID!

Para ver los cursos en video, artículos, datos y códigos relacionados con el método de medición, consulte 1. El curso gratuito del método de datos del panel, los artículos, los datos y los códigos están aquí, ¡excelentes académicos recopilan y estudian! 2. El curso gratuito del método DID de doble diferencial, los artículos, los datos y los códigos están todos aquí, ¡excelentes académicos deben recopilar y estudiar! 3. Aquí están los cursos, artículos, datos y códigos gratuitos para la estimación IV de variables instrumentales ¡No te arrepientas si no aprendes! 4. Los cursos gratuitos sobre varios métodos, artículos, datos y códigos de emparejamiento están aquí, ¡dominar los métodos de emparejamiento no es un sueño! 5. Regresión de punto de ruptura RD y método de control sintético SCM Los cursos, artículos, datos y códigos gratuitos están todos aquí, ¡es necesario estudiarlo cuidadosamente! 6. Los cursos gratuitos sobre medición espacial, artículos, datos y códigos están aquí, ¡los académicos relacionados con el espacio presten atención para verificarlos! 7.Los cursos de video, artículos, datos y códigos de Stata, R y Python están todos aquí, ¡es realmente útil!

texto

Acerca del texto debajo del contenido, autor: Wu Aoba, Escuela de Negocios y Escuela de Economía de la Universidad Nacional de Australia, correo de comunicación: [email protected]

Artículo anterior del autor:

①Mita, la obra maestra más influyente del RDD Queen del Premio Nobel de 2020, con procedimientos de medición y datos

②¿Es el modelo seleccionado realmente el correcto? Eche un vistazo a la verdad sobre las 75 principales revistas extranjeras y presente la estrategia de uso más autorizada.

Pedro HCSant, AnnaJunZhao. (2020). Estimadores de diferencias en diferencias doblemente robustos. Revista de Econometría.

Este artículo propone estimadores doblemente robustos para el efecto del tratamiento promedio en los diseños de investigación tratados (ATT) en diferencias en diferencias (DID). A diferencia de los estimadores DID alternativos, los estimadores propuestos son consistentes si se especifica correctamente uno (pero no necesariamente ambos) un puntaje de propensión o modelos de trabajo de regresión de resultados. También derivamos el límite de eficiencia semiparamétrico para el ATT en diseños DID cuando se dispone de datos de panel o de sección transversal repetida, y mostramos que nuestros estimadores propuestos alcanzan el límite de eficiencia semiparamétrico cuando los modelos de trabajo se especifican correctamente. Además, cuantificamos las ganancias potenciales de eficiencia de tener acceso a datos de panel en lugar de datos repetidos de sección transversal. Finalmente, prestando especial atención al método de estimación utilizado para estimar los parámetros de molestia, mostramos que a veces se pueden construir estimadores DID doblemente robustos para el ATT que también son doblemente robustos para la inferencia. Los estudios de simulación y una aplicación empírica ilustran el rendimiento de muestra finita deseable de los estimadores propuestos. Se encuentra disponible un software de código abierto para implementar las herramientas de evaluación de políticas propuestas.

Resumen:
Este artículo propone el efecto promedio (ATT) del grupo experimental utilizando el método de estimación DR en el modelo DID. En comparación con el estimador DID, si se establece correctamente un puntaje de propensión o un modelo de regresión de resultados, entonces el estimador es consistente. Además, el autor también deriva los límites efectivos semiparamétricos de ATT en el modelo DID en el caso de datos de panel o datos transversales repetidos, y demuestra que los límites efectivos semiparamétricos del estimador propuesto por el autor pueden ser obtenido cuando el modelo está configurado correctamente. Además, los autores cuantificaron las ganancias potenciales de eficiencia del uso de datos de panel en lugar de datos transversales repetidos. Finalmente, el autor demuestra que a veces el estimador de doble robustez construido para ATT también es doblemente robusto para inferencia estadística.
1. Introducción
DID es el método más popular utilizado por los investigadores para evaluar políticas utilizando datos de observación. En su modelo clásico, DID determina el efecto promedio del grupo experimental comparando los resultados de los dos grupos antes y después del experimento: se probó un grupo y el otro grupo se usó como control. Para facilitar las explicaciones causales, los investigadores suelen citar la Hipótesis de tendencia paralela (PTA): antes del experimento, el valor promedio del grupo experimental y el grupo de control son paralelos durante un período de tiempo. Aunque la PTA es fundamentalmente incontrolable, su credibilidad a menudo se cuestiona: si se considera que las características observadas están relacionadas con la evolución de los resultados y la evolución de los resultados no está equilibrada entre los dos grupos. En este caso, el investigador generalmente se desvía de la configuración del modelo DID estándar e incorpora las covariables pre-experimentales en el análisis del modelo DID, y asume que PTA solo se cumple bajo estas condiciones de covariables.
En el artículo, el autor estudia la robustez y validez del estimador ATT en el modelo DID cuando se satisface el supuesto PTA en función de la condición de la covariable. El autor consideró tanto el caso de datos de panel como el caso de solo datos transversales repetidos. El autor ha realizado aportes a la investigación del DID en diferentes aspectos. Primero, el autor introdujo la estimación de ATT por el método DR bajo la configuración del modelo DID, y demostró que cuando el puntaje de propensión y el modelo de resultado se establecen correctamente, los resultados estimados del método DR son consistentes. El autor propone dos estimaciones diferentes de ATT utilizando el método DR, están en el mismo grupo experimental, pero una se basa en la regresión de los resultados antes del tratamiento y la otra en la regresión de los resultados después del tratamiento. Sin embargo, los autores encontraron que el estimador del método DR no depende de tal elección.
En segundo lugar, el autor deriva los límites efectivos semiparamétricos de ATT bajo el diseño DID. Los límites efectivos semiparamétricos derivados por el autor no son paramétricos, porque el autor no asume que el investigador tendrá una cierta comprensión de la función de puntuación de propensión y la función de regresión de resultados. Por lo tanto, estos límites proporcionan un estándar basado en el cual los investigadores pueden comparar cualquier estimación DID semiparamétrica de ATT. También vale la pena enfatizar que estos límites efectivos semiparamétricos incluyen explícitamente todas las restricciones implícitas en la hipótesis de reconocimiento. Es importante que estos límites difieran dependiendo de si se trata de datos de panel o de datos transversales repetidos. En ambos casos, ambos involucran las restricciones implicadas por el PTA condicional. Sin embargo, cuando hay datos transversales repetidos, también incluyen las restricciones implícitas en la hipótesis de identificación, es decir, la distribución conjunta de la covariable y el estado de procesamiento. no se ve afectado por el período de muestreo. Se debe enfatizar que si no se consideran estas restricciones implícitas, se producirán diferencias en los límites de eficiencia derivados, lo que a su vez puede indicar que algunos estimadores son semiparamétricamente válidos, cuando en realidad no lo son.
Con los límites efectivos semiparamétricos, se pueden responder algunas preguntas. Por ejemplo, uno puede preguntarse si el uso de datos de panel en lugar de datos transversales repetidos mejorará la eficiencia. Al comparar directamente los límites efectivos en estas dos configuraciones, se puede ver que la respuesta a la pregunta anterior no solo es afirmativa, sino también que cuando el tamaño de la muestra de los datos transversales repetidos antes y después del experimento es más desequilibrado, la ganancia tiende a ser mayor.
Otro tema que analiza el autor es si el estimador propuesto en el artículo que utiliza el método DR para estimar el modelo DID puede alcanzar el límite efectivo semiparamétrico. El autor muestra que cuando el modelo de trabajo de puntuación de propensión y el modelo de regresión de resultados del grupo de control se configuran correctamente, el estimador DR DID es parcialmente válido en la configuración de datos de panel, pero no en la configuración de datos transversales. De hecho, cuando solo hay datos transversales repetidos, el autor encontró que siempre que el modelo de regresión se establezca correctamente según el modelo de puntaje de propensión y los resultados del grupo experimental y del grupo de control, el estimador DR DID puede alcanzar el límite efectivo semiparamétrico. El autor cuantificó la pérdida de eficiencia de usar el estimador DR DID ineficiente en lugar del estimador efectivo local, y mostró que la pérdida es realmente grande a través de la simulación de Monte Carlo.
El método propuesto en el artículo es adecuado para los modelos de trabajo lineales y no lineales de la función de interferencia. Cuando se utiliza el modelo de trabajo de parámetros generales para la función de interferencia, el autor establece la consistencia de la imagen y la normalidad asintótica del estimador DR DID. La forma correcta de la varianza asintótica del estimador propuesto por el autor depende de si el puntaje de propensión y / o el modelo de regresión de resultados están configurados correctamente. En vista del hecho de que en el proceso de aplicación real, no se sabe qué modelos están configurados correctamente, por lo que al estimar la varianza asintótica, el investigador debe considerar el efecto de estimación de todos los primeros estimadores. inferencias estadísticas.
La tercera contribución del artículo es que al observar los métodos de estimación utilizados para estimar los parámetros redundantes, a veces puede ser posible establecer un estimador ATT computable simple en el modelo DID. No solo es consistente la DR y semiparamétrica local efectiva, sino también doble robusto.
2.
El marco teórico de los artículos de literatura relacionados se basa principalmente en las dos ramas de la investigación de inferencia causal. Primero, la metodología del artículo está intrínsecamente relacionada con otra literatura DID, como la Sección 6.5 de Imbens y Wooldridge (2009) y sus referencias. Las dos principales aportaciones de esta rama relacionadas con el artículo son el estimador de regresión del modelo DID basado en la función kernel propuesta por Heckman et al. En 1997, y el estimador (paramétrico y no paramétrico) DID de ponderación de probabilidad inversa (IPW) propuesto por Abadie (2005). Los autores señalan que cuando la dimensionalidad de la covariable es muy alta o incluso moderada, los métodos completamente no paramétricos generalmente no dan inferencias útiles. En este caso, los investigadores suelen utilizar métodos paramétricos. El DR DID propuesto en el artículo pertenece a este último tipo.
En segundo lugar, el contenido del artículo también está estrechamente relacionado con la literatura clásica sobre estimación biestable, por ejemplo, Robins et al. (1994), Scharfstein et al. (1999), Bang y Robins (2005), Wooldridge (2007), Chen et al. (2008), Cattaneo (2010), Graham et al. (2012,2016), Vermeulen & Vansteelandt (2015), Lee et al. (2017), Sloczynski & Wooldridge (2018) y Seaman & Vansteelandt (2018). Recientemente, los métodos de estimación de DR también han jugado un papel importante en el uso de datos adaptativos y aprendizaje automático para estimar funciones de interferencia. Por ejemplo, Belloni et al. (2014), Farrell (2015), Chernozhukov et al. (2017), Belloni et al. . (2017)) Y Tan (2019). Por otro lado, el autor notó que los artículos antes mencionados se centraban en los supuestos del “modelo de selección de observaciones” o tipo “IV / LATE”, y el autor miró especialmente el diseño del modelo DID condicional, por lo que los resultados de el artículo era incompatible con el existente Una adición a la investigación.
Para derivar los límites efectivos semiparamétricos del estimador ATT bajo el marco DID, el artículo se basa en la investigación de Hahn (1998) y Chen et al. (2008). Aunque los autores siguen la estructura de los límites efectivos semiparamétricos derivados del artículo anterior, los límites efectivos semiparamétricos derivados por los autores complementan su investigación porque sus resultados dependen de la suposición del tipo de "modelo de selección" bajo el patrón cruzado. configuración de datos seccionales Centrarse en el diseño del modelo de DID.
La investigación sobre la mejora adicional del estimador DR DID se basa en la investigación de Vermeulen y Vansteelandt (2015), quienes propusieron el estimador DR para la inferencia estadística en la configuración de datos transversales bajo el supuesto de selección de tipo observable. El contenido del artículo también se basa en Graham et al. (2012), porque su estimador de puntaje de propensión es una parte importante del artículo.
Finalmente, relacionado con el artículo pero independiente del contenido del artículo está el trabajo de investigación de Zimmert (2019), quien propuso que en condiciones de alto nivel, los investigadores pueden utilizar el primer estimador de aprendizaje automático para estimar las estadísticas de ATT en el DID. modelo. Los resultados de su investigación complementan los resultados de la investigación del autor, pero el autor notó que su estimación de secciones transversales repetidas no alcanzó los límites efectivos semiparamétricos derivados por el autor, y la pérdida de eficiencia también es importante de primer orden. Al mismo tiempo, el autor también notó que Zimmert (2019) no proporcionó una comparación detallada entre los datos de panel y las aplicaciones repetidas de datos transversales, ni discutió el proceso de inferencia de DR, que es muy relevante cuando el modelo está incorrectamente colocar.
3. Modelo DID
1.
Los símbolos del modelo que se utilizarán en el artículo de fondo son los siguientes:
Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!
Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!

Frontier: DID doble robusto, ¡agregue un candado a su DID!
Frontier: DID doble robusto, ¡agregue un candado a su DID!
Para evaluar la sensibilidad de la conclusión y la representación del modelo, el autor consideró tres representaciones del modelo diferentes: (i) modelo lineal, en el que todas las covariables son lineales; (ii) basado en DW, sumando el cuadrado de la edad sobre la base del modelo lineal, el cubo de la edad dividido por 1000, el cuadrado de los años de educación, la variable ficticia del ingreso cero en 1974, la variable producto de los años de educación y el ingreso real en 1974; (iii) En la expresión de la Modelo DW, sumado casado y 1974 La variable producto del ingreso real, la variable producto del ingreso casado y cero en 1974.
La Tabla 3 resume los resultados. Como señaló ST, estas desviaciones relativas son útiles para comparar las estimaciones DID dentro de cada muestra, pero dado que el punto de referencia experimental de ATT es muy diferente entre las tres muestras experimentales, no debe usarse para comparar entre muestras. La tabla 3 también refleja algunos otros fenómenos. Primero, el estimador basado en el modelo de regresión de efectos fijos de dos vías es relativamente estable en diferentes representaciones del modelo, pero todos muestran un sesgo de evaluación positivo significativo; segundo, el estimador DID basado en el método de regresión conducirá a la estimación más precisa. Sin embargo, en la muestra de Lalonde, la estimación puntual está muy subestimada, lo que genera un sesgo de evaluación significativo. El estimador de IPW de Abadie tiene el error estándar más grande entre todos los estimadores, pero su sesgo de evaluación es relativamente pequeño. Al igual que los resultados de la simulación de Monte Carlo, el estimador de IPW estandarizado puede mejorar la estabilidad de la estimación. Finalmente, el autor encontró que el estimador DR DID no solo tiene la ventaja del pequeño error de evaluación del estimador IPW de Adadie, sino que también tiene una desviación estándar más pequeña. Al mismo tiempo, a través de la comparación, los autores encontraron que la estimación DR DID que propusieron es una alternativa valiosa al marco DID existente.
imagen

7. Resumen
Bajo el modelo DID, cuando se satisface el supuesto de tendencias paralelas basadas en las covariables pre-experimentales, el autor propone una estimación robusta dual de ATT. Cuando se especifica correctamente el modelo de puntuación de propensión o el modelo de regresión de resultados, el estimador propuesto por el autor es coherente. Cuando el modelo de interferencia del modelo de trabajo también se especifica correctamente, se puede obtener el límite efectivo semiparamétrico. Al mismo tiempo, el autor también confirma que este estimador se puede utilizar como una herramienta de inferencia causal a través de la simulación de Monte Carlo y la aplicación empírica.
Los siguientes artículos con enlaces cortos pertenecen a una colección, puede recopilarlos y leerlos, o no los encontrará en el futuro.

Supongo que te gusta

Origin blog.51cto.com/15057855/2674776
Recomendado
Clasificación