- La CCR fija el mínimo teórico de la varianza de cualquier estimador insesgado, en función de la información de Fisher.
- Es una desigualdad (≥): no siempre existe un estimador insesgado que alcance la cota, pero sí podemos medir cuán cerca estamos.
- La información de Fisher resume cuánta evidencia aportan los datos sobre el parámetro; a mayor información, menor 1/I(Θ).
- Eficiencia: si un estimador insesgado iguala la cota, es el más eficiente; si no, comparamos su proximidad al límite.
La cota de Cramér–Rao es uno de esos conceptos que marcan la diferencia cuando toca comparar estimadores: establece el límite inferior de varianza alcanzable por cualquier estimador insesgado de un parámetro, siempre que se cumplan ciertas condiciones de regularidad. Dicho sin rodeos, si buscas el mejor estimador posible en términos de precisión, la CCR te dice hasta dónde puedes aspirar a reducir la variabilidad.
En análisis econométrico y en infinidad de aplicaciones, elegir bien el estimador es decisivo: se exige que sea insesgado y que, dentro de esa familia de estimadores insesgados, tenga la menor varianza posible (lo que llamamos eficiencia). La CCR sirve de guía para decidir y, sobre todo, para saber si hemos llegado a ese listón o todavía estamos por encima.
Qué es la cota de Cramér–Rao y para qué sirve
En términos prácticos, la cota de Cramér–Rao (CCR) fija una barrera: la varianza mínima que puede tener un estimador insesgado de un parámetro dado, bajo unas condiciones técnicas habituales en inferencia. Si un candidato supera esa prueba y su varianza coincide con la cota, diremos que es un estimador eficiente; si no llega, cuanto más cerca esté de la cota, mejor considerado será frente a alternativas peores.
Conviene remarcar que la CCR es una desigualdad y no una igualdad universal. Hay situaciones en las que simplemente no existe un estimador insesgado que alcance exactamente ese mínimo. Aun así, disponer del límite inferior permite comparar y valorar la calidad relativa de estimadores de un modo riguroso.
Otra idea clave es que, a efectos de la CCR, sólo miramos el conjunto de estimadores insesgados. ¿Por qué? Porque un estimador sesgado podría exhibir una varianza menor que la cota y, sin embargo, estar desplazado sistemáticamente respecto al valor verdadero. Si la prioridad es evitar el sesgo, la CCR es la referencia natural para medir la mejor precisión posible.
Formulación, notación y papel de la información de Fisher
Para fijar ideas, presentemos la notación básica. Denotamos por f(X; Θ) a la función de densidad (o de probabilidad) de la variable aleatoria X bajo el parámetro Θ. Con E indicamos la esperanza matemática u operador de media. Y por I(Θ) nos referimos a la información de Fisher, que cuantifica cuánta información aporta una observación acerca del valor del parámetro.
La relación esencial que proporciona la cota de Cramér–Rao es una desigualdad del tipo Var(Θ̂) ≥ 1 / I(Θ). Aquí, la parte derecha, 1/I(Θ), marca el suelo teórico de la varianza para cualquier estimador insesgado, siempre bajo las condiciones de regularidad. En la práctica, calculamos o acotamos I(Θ) y así obtenemos el mínimo insuperable.
La información de Fisher se puede expresar a partir de derivadas de la función de densidad (o, de forma habitual, de la log-verosimilitud), y aparecerán naturalmente derivadas parciales respecto del parámetro. Esto cuadra con la idea de optimización: cuando buscamos mínimos o máximos (en economía, por ejemplo, para condiciones de primer y segundo orden), las derivadas son la herramienta canónica.
De la fórmula de la CCR conviene retener varios puntos prácticos:
- Es una desigualdad no estricta (≥): no siempre hay un estimador insesgado que alcance la cota.
- La varianza del estimador aparece comparada con un mínimo teórico, por lo que la CCR actúa como referencia para evaluar eficiencia.
- La información de Fisher, I(Θ), recoge cuánta evidencia sobre el parámetro proporciona la muestra; a mayor información, menor 1/I(Θ), y por tanto más bajo el límite de varianza.
- Las derivadas respecto de Θ son inevitables:
- En economía y estadística usamos derivadas para optimizar y caracterizar extremos.
- Al trabajar con densidades o con la log-verosimilitud, la CCR se obtiene vía la primera derivada (la función score) y, en ocasiones, también mediante la segunda derivada usando una forma alternativa de la información de Fisher.
Insesgadez, eficiencia y cómo interpretar la CCR
Si un estimador insesgado alcanza exactamente la CCR, entonces se le considera eficiente. Es el mejor dentro de su clase porque logra la varianza mínima posible impuesta por la teoría. No todos los problemas tienen un estimador con ese lujo, así que, cuando no lo hay, valoramos la proximidad del estimador a la cota.
La noción de insesgadez es central en esta historia: garantiza que la media del estimador coincide con el parámetro verdadero. Por eso, al hablar de CCR, restringimos la comparación a estimadores insesgados. Los sesgados pueden presumir de menor varianza, pero a costa de ese desplazamiento sistemático que puede resultar inaceptable según el objetivo del análisis.
En términos operativos, la CCR no sólo nos dice si hemos llegado al tope, también ayuda a diagnosticar por qué un estimador quizá no sea competitivo. Si la distancia a 1/I(Θ) es grande, tal vez exista un estimador insesgado mejor; si la distancia es pequeña, es razonable mantenerlo por su buena eficacia relativa.
Un mensaje práctico: incluso cuando la cota no se alcanza, conviene medir y comunicar cuán cerca está nuestro estimador de ese límite. Esa proximidad es un argumento de peso para justificar su uso, especialmente si además cumple otras propiedades deseables como consistencia y robustez.
Condiciones de regularidad: cuándo es aplicable la cota
La CCR se formula bajo ciertas condiciones técnicas sobre la densidad f(X; Θ) y el soporte de la variable, que permiten intercambiar derivadas e integrales y garantizan que la información de Fisher esté bien definida. Estas hipótesis, habituales en inferencia, alinean la teoría con la práctica y evitan contraejemplos patológicos.
En problemas bien comportados (densidades suaves, soporte que no depende del parámetro de forma problemática, integrabilidad de las derivadas, etc.) la CCR ofrece un límite claro y útil. En contextos más irregulares, o con modelos mal especificados, puede que la cota no aplique tal cual o requiera cautela adicional.
Por eso, antes de invocar la CCR, merece la pena verificar si las condiciones de regularidad se cumplen en el modelo que estamos analizando. Esa comprobación preliminar ahorra sorpresas y da respaldo teórico a las comparaciones de varianza que haremos después.
Lectura detallada de la desigualdad: lados, significado y derivadas
En la escritura más común, el lado izquierdo de la CCR incluye la cantidad 1/I(Θ), mientras que el derecho es la varianza del estimador insesgado de Θ. Esto cristaliza la idea de mínimo insuperable: ningún estimador insesgado puede tener varianza por debajo de 1/I(Θ).
Aparecen derivadas parciales respecto de Θ porque la información de Fisher condensa la sensibilidad de la densidad (o de la log-densidad) frente a cambios en el parámetro. Cuanto más sensible sea esa relación, más información aportan los datos y, por tanto, más baja puede ser la varianza mínima.
En muchos manuales se usa la forma de la información basada en la varianza del score (primera derivada de la log-verosimilitud), y en otros se aprovecha una formulación alternativa vía la esperanza de la segunda derivada. Ambas llevan al mismo concepto operativo: la CCR como referencia para la eficiencia.
Elección de estimadores en econometría: insesgadez y mínima varianza
En econometría, la CCR entra en juego cuando tenemos que escoger un estimador para un análisis que debe ser concluyente. A falta de otras consideraciones (como sesgo-variabilidad en escenarios finitos), el primer filtro suele ser exigir insesgadez y, dentro de ese conjunto, optar por la menor varianza posible.
Sucede a veces que, aunque comparemos estimadores insesgados, no hay uno que alcance la cota. Puede incluso aparecer otro estimador insesgado que tenga menor varianza que el candidato que teníamos en mente. La CCR, al fijar el mínimo, ayuda a que no se nos escape la alternativa más afinada.
En la práctica profesional, conviene reportar tanto el valor de la varianza estimada como la cota teórica 1/I(Θ). Si ambos números son cercanos, podemos defender que estamos trabajando con un estimador muy bien posicionado. Si están lejos, merece la pena considerar métodos alternativos o revisar el modelo.
Por qué nos centramos en estimadores insesgados
Un punto que suele generar dudas es por qué la CCR pone el foco en la familia de estimadores insesgados. La razón es conceptual: si autorizamos sesgo, podríamos construir estimadores con varianza muy pequeña que, sin embargo, se alejan sistemáticamente del parámetro verdadero, algo indeseable cuando priorizamos exactitud no sesgada.
De hecho, hay estimadores sesgados con varianzas inferiores a la cota, lo cual no contradice la teoría: simplemente no están en el conjunto que la CCR evalúa. Por eso, al usar la cota como baremo, comparamos manzanas con manzanas dentro de la clase insesgada.
Cómo se computa la información de Fisher en la práctica
Desde el punto de vista computacional, la información de Fisher I(Θ) suele obtenerse a partir de la densidad f(X; Θ) o de la log-verosimilitud. Utilizamos derivadas con respecto al parámetro: la primera derivada (el score) sirve para medir sensibilidad, y mediante su varianza se obtiene una representación clásica de I(Θ). Alternativamente, se puede recurrir a la esperanza de la segunda derivada bajo condiciones adecuadas.
Estas dos vías no son contradictorias, sino complementarias, y ayudan a simplificar cálculos según el modelo. La elección depende de la conveniencia algebraica y de la facilidad para verificar las condiciones de regularidad involucradas.
Cómo interpretar eficiencia relativa cuando la cota no se alcanza
Cuando ningún estimador insesgado toca la cota, comparamos qué tan cerca están sus varianzas de 1/I(Θ). Aquellos con menor distancia se consideran relativamente más eficientes que sus competidores. Esta métrica relativa guía decisiones prácticas sin exigir perfección teórica.
En informes técnicos, suele ser útil presentar tablas con las varianzas de los distintos estimadores y la CCR como referencia. Esa comparación visual deja claro qué opciones son más competitivas y bajo qué escenarios (por ejemplo, distintos tamaños muestrales o supuestos de modelo).
Un apunte sobre optimización: por qué aparecen derivadas
Si te resulta natural que al buscar mínimos y máximos aparezcan derivadas, entenderás la CCR más rápido: medir la sensibilidad de la densidad o de la log-verosimilitud respecto al parámetro nos informa sobre cuánta precisión podemos extraer de los datos. En economía, esta intuición se alinea con el uso de condiciones de primer y segundo orden para optimizar utilidad o beneficios.
La CCR se apoya exactamente en ese principio: si el modelo reacciona con fuerza a variaciones del parámetro (mucha información), podemos aspirar a una varianza más pequeña; si reacciona poco, el límite inferior se eleva y será más difícil afinar la estimación.
Recursos para profundizar
Para ampliar detalles teóricos y ver demostraciones formales, es muy útil revisar materiales docentes y apuntes. Un recurso de referencia que aborda estos puntos, incluyendo la presentación de la CCR y sus condiciones, está disponible en formato PDF: consultar documento. Encontrarás allí el desarrollo que conecta la información de Fisher con la desigualdad y ejemplos de aplicación.
La cota de Cramér–Rao te da una meta clara y alcanzable sólo en casos favorables: sirve para valorar si tu estimador insesgado es óptimo o si existe margen de mejora, para entender el papel de la información de Fisher y para fundamentar con rigor la elección de métodos en análisis econométrico y estadístico.