Contraste de Dickey-Fuller: guía completa y ejemplos prácticos

Última actualización: octubre 29, 2025
  • El contraste Dickey-Fuller detecta raíz unitaria contrastando H0: δ = 0 con valores críticos no estándar.
  • Existen tres versiones (sin constante, con deriva y con tendencia), cada una con críticos propios.
  • La versión ADF añade rezagos para controlar autocorrelación y mejorar la validez del test.
  • Elegir bien constante/tendencia y rezagos es clave para tamaño, potencia e interpretación.

Contraste de Dickey-Fuller en series temporales

Cuando trabajamos con datos que evolucionan en el tiempo, tarde o temprano aparece la gran duda: ¿esta serie es estacionaria o arrastra una tendencia aleatoria? El contraste de Dickey-Fuller es la herramienta clásica para responder a esa pregunta. Es una prueba de raíz unitaria pensada para detectar tendencias estocásticas en series temporales mediante un contraste estadístico bien definido.

Dicho en plata, con esta prueba podemos evaluar si el comportamiento de una serie se parece más a un paseo aleatorio o, por el contrario, tiende a volver a un nivel estable (con o sin tendencia determinista). La gracia del test está en su sencillez frente a métodos más complejos, y en que su interpretación, aunque requiere cierto cuidado, ofrece pistas claras sobre la estacionariedad.

Qué es el contraste de Dickey-Fuller y por qué importa

El contraste de Dickey-Fuller (DF) parte de un modelo autorregresivo simple de orden 1, AR(1), para detectar si una serie posee una raíz unitaria (no estacionariedad) o si, por el contrario, es estacionaria. En un AR(1) básico, el coeficiente de la variable rezagada desempeña un papel crucial: cuando está exactamente en 1, la serie es un paseo aleatorio; cuando es menor que 1 en valor absoluto, el proceso es estacionario.

De forma operativa, la prueba plantea una hipótesis nula según la cual la serie tiene raíz unitaria (no es estacionaria) y una alternativa que afirma lo contrario. Si rechazamos la nula, concluimos que la serie es estacionaria (posiblemente alrededor de una constante o una tendencia determinista, según la especificación).

Fundamentos matemáticos: de AR(1) a diferencias

Partimos del modelo autorregresivo de primer orden: y_t = ρ y_{t−1} + u_t, donde y_t es la variable de interés, ρ es el parámetro clave y u_t es el término de error. La raíz unitaria está presente si ρ = 1; en ese caso, el proceso no sería estacionario.

Reexpresando el modelo en primeras diferencias, se obtiene: Δy_t = (ρ − 1) y_{t−1} + u_t. Definiendo δ = ρ − 1, el contraste se reduce a testear δ = 0. En otras palabras, si δ es cero, la serie tiene raíz unitaria; si δ es negativa, la serie es estacionaria (en la especificación considerada).

Esquemáticamente

La lógica práctica del DF es sencilla: 1) formular la hipótesis nula de raíz unitaria; 2) estimar la regresión en diferencias con el término en niveles rezagado; 3) evaluar si el coeficiente asociado (δ) es cero o menor que cero mediante un estadístico tipo t con reglas de decisión no estándar (tablas específicas).

Matemáticamente

  • Modelo de partida AR(1): y_t = ρ y_{t-1} + u_t.
  • Restando y_{t-1} en ambos lados: y_t − y_{t-1} = (ρ − 1) y_{t-1} + u_t.
  • Usando Δy_t para la primera diferencia: Δy_t = δ y_{t-1} + u_t con δ = ρ − 1.

Este reparametrizado permite contrastar H0: δ = 0 frente a H1: δ < 0 con un estadístico tipo t pero, atención, su distribución bajo la nula no es la de Student estándar; por eso se usan valores críticos específicos (tablas de Dickey-Fuller). En software moderno, el contraste se calcula de forma automática con la cola correcta (una cola) para δ < 0.

Versiones de la prueba: sin constante, con deriva y con tendencia

El test Dickey-Fuller puede especificarse de tres formas según el comportamiento determinista que queramos permitir en la serie: sin intercepto (none), con constante o deriva (drift) y con constante más tendencia determinista (trend). Cada versión tiene su propio conjunto de valores críticos que dependen del tamaño muestral.

En notación compacta, las tres regresiones típicas son:
1) Δy_t = δ y_{t−1} + u_t (sin constante),
2) Δy_t = a_0 + δ y_{t−1} + u_t (con deriva),
3) Δy_t = a_0 + a_1 t + δ y_{t−1} + u_t (con tendencia determinista).

Versiones del test Dickey-Fuller

La hipótesis nula es siempre que la serie tiene raíz unitaria, es decir, H0: δ = 0. La alternativa plantea que la serie es estacionaria (H1: δ < 0). El estadístico del test suele ser negativo y, dado que la región de rechazo está en la cola izquierda, hablamos de un contraste a una cola.

Además del estadístico tipo t (a veces etiquetado como τ), en ciertas especificaciones aparecen estadísticos complementarios (por ejemplo, φ) para evaluar conjuntamente la significación de términos deterministas. El software reporta los críticos correctos para cada combinación de regresores deterministas, por lo que conviene leer con calma la salida.

Hipótesis, intuición e implicaciones

La intuición del test es clara: si una serie es estacionaria (o estacionaria en torno a una tendencia determinista), tiende a revertir hacia su nivel medio o su senda determinista. Por tanto, niveles altos tienden a ir seguidos de cambios negativos y niveles bajos de cambios positivos, lo que se traduce en un coeficiente en niveles con signo negativo.

Si, en cambio, la serie está integrada (tiene raíz unitaria), los cambios positivos y negativos aparecen con probabilidades independientes del nivel actual. En un paseo aleatorio, el lugar donde estás ahora no condiciona la dirección inmediata de los próximos pasos.

Un resultado interesante es que, si en diferencias tenemos Δy_t = a_0 + u_t, puede reescribirse como y_t = y_0 + Σ u_i + a_0 t, lo que combina una tendencia determinista por el término a_0 t con un componente estocástico acumulado (la suma de errores), dando lugar a una tendencia estocástica.

Un detalle práctico que suele aparecer en la literatura aplicada: en un AR(1), un coeficiente muy cercano a 1 sugiere no estacionariedad y retorno muy lento a la media. Si el proceso fuese realmente estable, ese coeficiente sería menor que 1 y, en contextos de reversión rápida, estaría incluso bastante alejado de 1.

Potencia y el problema de la «casi equivalencia»

El test Dickey-Fuller puede tener bajo poder estadístico cuando δ está muy cerca de cero, lo que hace difícil distinguir entre un verdadero proceso con raíz unitaria y otro casi con raíz unitaria. Esta es la conocida dificultad de «observación de cerca de equivalencia» que conviene tener presente al interpretar resultados marginales.

Para ganar potencia, suele recomendarse la versión aumentada (ADF) que añade rezagos de la diferencia para absorber autocorrelación en los errores. Además, la especificación adecuada (incluir o no constante y tendencia) es crucial para el tamaño y la potencia del contraste.

Versión aumentada (ADF), autocorrelación y elección de rezagos

La extensión clásica es el test de Dickey-Fuller aumentado (ADF). En él, la regresión en diferencias incorpora varios rezagos de Δy_t a fin de eliminar autocorrelación en los residuos y que el contraste sea válido. La selección del número de rezagos puede hacerse mediante criterios de información como el de Schwarz (BIC) o el AIC, entre otros.

La decisión sobre incluir intercepto y/o tendencia determinista no es un asunto menor. Excluir indebidamente una tendencia puede sesgar la estimación de δ y desajustar el tamaño real de la prueba respecto al reportado; por el contrario, incluir de más (constante o tendencia cuando no proceden) reduce la potencia. Conocimiento previo o pruebas secuenciales bien diseñadas ayudan a elegir.

En la literatura se proponen estrategias ordenadas para determinar la especificación correcta, como las de Dolado, Jenkinson y Sosvilla-Rivero (1990) o las recomendaciones de Enders (2004). Elder y Kennedy (2001) sugieren una estrategia sencilla que evita «dobles o triples pruebas» redundantes. Simulaciones como las de Hacker y Hatemi-J (2010) muestran que criterios como Schwarz pueden ser útiles para decidir tanto la inclusión de determinísticos como el número de rezagos.

¿Cómo se contrasta en la práctica? Software y automatización

En la práctica, la mayor parte del software estadístico implementa el contraste DF/ADF con las variantes adecuadas y valores críticos específicos. Un punto operativo importante: el contraste de δ < 0 se hace con estadístico t a una cola pero con distribución no estándar bajo H0, por lo que no se pueden usar tablas t de Student convencionales.

Ejemplos de comandos habituales incluyen en Stata el comando dfgls (una variante DF-GLS), y en EViews el comando uroot para raíces unitarias. También existen recursos para ejecutarlo en Excel mediante complementos o plantillas especializadas, además de implementaciones en R y Python.

Para quien quiera ampliar base conceptual, resultan especialmente útiles lecturas sobre autorregresión y procesos estocásticos, por su conexión directa con la estacionariedad y la presencia de raíces unitarias.

Ejemplo aplicado en R: relación entre DPI y PCE y contraste sobre residuos

Veamos ahora un ejemplo representativo orientado a cointegración por el método de Engle-Granger: se estima una regresión entre dos series potencialmente no estacionarias y se contrasta con ADF la estacionariedad de los residuos. Si los residuos son estacionarios, las series se consideran cointegradas.

El flujo seguido cargó un conjunto amplio de librerías de R para análisis de series temporales y econometría: lubridate, tseries, tidyverse, car, astsa, foreign, timsac, vars, MASS, strucchange, zoo, sandwich, urca, lmtest, mFilter, dynlm, nlme, broom, kableExtra, knitr, parallel, mlogit, dfidx, dplyr, tidyr, forecast, fpp2, xts, TTR y quantmod, además de readxl para importar datos.

Se importó un fichero con dos variables macro (DPI y PCE), se transformaron a logaritmos y se construyeron objetos de serie trimestral desde 1947. Después se trazó la tendencia y se estimó por MCO la regresión PCE ~ DPI en logaritmos (supuestos del teorema de Gauss-Markov), con un ajuste muy alto (R² cercano a 0,998), intercepto negativo y un coeficiente de DPI prácticamente unitario (en torno a 1,011).

Sobre los residuos de esa regresión, se realizó un contraste ADF con la función ur.df en distintas especificaciones. En la versión «none» (sin constante), el estadístico τ del test fue aproximadamente −2,5289, con valores críticos orientativos para τ1 de −2,58 (1%), −1,95 (5%) y −1,62 (10%). Dado que −2,5289 no supera en valor absoluto el umbral del 1% pero es más negativo que −1,95, la decisión depende del nivel elegido; con un 5% se rechazaría H0 en esa especificación, si bien la especificación sin constante no siempre es la adecuada.

En la versión con deriva («drift»), se obtuvo un estadístico en torno a −2,5266, con críticos para τ2 próximos a −3,46 (1%), −2,88 (5%) y −2,57 (10%), además de un estadístico φ1 para el término constante (con críticos como 6,52, 4,63, 3,81). En ese marco, el valor −2,5266 no rebasa el crítico del 10% (−2,57) por poco, lo que sugiere no rechazar H0 de raíz unitaria a niveles convencionales en la especificación con constante.

Finalmente, con la función adf.test (paquete tseries), usando un orden de rezagos 6 de forma automática, el estadístico de Dickey-Fuller fue aproximadamente −1,2524, con p-valor cercano a 0,8904 frente a la alternativa de estacionariedad, lo que claramente no respalda rechazo de la nula. Este contraste, recordemos, emplea su propia parametrización y selección de rezagos.

En conjunto, el ejemplo ilustra que la decisión práctica descansa en la especificación correcta (incluir o no constante/tendencia) y la adecuada selección de rezagos. La misma serie puede ofrecer señales distintas si el modelo determinista subyacente se especifica de manera incorrecta, de ahí la importancia de estrategias de testeo ordenadas y criterios de información.

¿Se puede «ahorrar» el contraste mirando la gráfica?

Hay situaciones donde la tendencia es tan evidente que una inspección visual sugiere lo que pasa. También, observar que el primer coeficiente de un AR(1) está en torno a 1 puede ser una pista potente de no estacionariedad. Sin embargo, por precisión y trazabilidad, conviene realizar el contraste DF/ADF, sobre todo cuando las conclusiones tienen implicaciones en modelización y predicción.

En ese sentido, muchos paquetes estadísticos implementan el test de forma predeterminada con la cola correcta (δ < 0) y reportan valores críticos apropiados. Aunque el resultado «parezca obvio» a ojo, el contraste aporta disciplina y comparabilidad.

Cómo elegir la especificación: constante, tendencia y tamaño de la muestra

Elegir si incluir intercepto y/o tendencia determinista es clave. Si se omite una tendencia que realmente existe, la estimación de δ puede estar sesgada y el tamaño efectivo del test diferirá del teórico, llevando a decisiones erróneas. En cambio, incluir una constante o tendencia de más cuando no toca reduce la potencia, dificultando el rechazo de H0 cuando debería rechazarse.

Cuando no hay conocimiento previo, se recomiendan estrategias con pruebas ordenadas. Algunas propuestas parten de la especificación más rica (con tendencia), y si no se rechaza, pasan a una más parsimoniosa, utilizando además criterios de información (como Schwarz) para apoyar la decisión. Las simulaciones publicadas muestran que esta combinación suele funcionar bien en práctica.

Condiciones para declarar estacionariedad en DF

Un matiz didáctico que conviene recordar. En el marco de DF: 1) debe rechazarse H0: δ = 0 a un nivel razonable de significación, y 2) el estimador del parámetro asociado a y_{t−1} en la regresión en diferencias debe ser negativo (δ < 0). Cuando ambas condiciones se cumplen, se concluye estacionariedad en la especificación adoptada.

Como señalan manuales clásicos de econometría, si δ fuera exactamente 0, tendríamos Δy_t = u_t, es decir, un paseo aleatorio puro en diferencias, lo cual es no estacionario en niveles. A partir de ahí, la incorporación de una deriva o de una tendencia determinista modifica el patrón determinista pero no la esencia del contraste sobre la raíz unitaria.

Consejos prácticos y pequeños trucos

Al usar DF/ADF, cuida estos puntos: 1) define con lógica económica si esperas constante o tendencia; 2) usa criterios de información para los rezagos; 3) revisa residuos para autocorrelación; 4) recuerda que los valores críticos no son los de t de Student; 5) considera el poder del test en muestras pequeñas o con raíces cercanas a 1.

En contextos de cointegración, la receta habitual por Engle-Granger implica estimar primero la relación en niveles y luego pasar el ADF a los residuos. Aquí las tablas críticas cambian (se ajustan a la naturaleza «residual» del contraste), y los comandos de software lo contemplan con rutinas especializadas.

También encontrarás variantes más eficientes, como los DF-GLS, y herramientas en diferentes programas (Stata, EViews, R, Excel). La disponibilidad de funciones facilita mucho el camino, pero no sustituyas criterio econométrico por pulsar un botón: valida supuestos, prueba distintas especificaciones y documenta tus decisiones.

Si necesitas ampliar, busca materiales sobre autorregresión y proceso estocástico, que te darán el contexto teórico para entender por qué el coeficiente cercano a 1 revela tan bien la no estacionariedad.

Mirando todo el conjunto, el contraste de Dickey-Fuller proporciona un marco claro para decidir sobre estacionariedad, siempre que se elija la especificación adecuada, se trate la autocorrelación vía ADF y se interpreten los resultados con cabeza, apoyándose en valores críticos correctos, estrategias de prueba ordenadas y, cuando toque, criterios de información.

teorema gauss markov
Artículo relacionado:
Teorema de Gauss-Markov: qué dice, supuestos y por qué importa