"Parecería que existe una ley de la
naturaleza tan universal en su acción como cualquiera de las leyes de la
física." Frank
Benford (EE.UU. 1883 – 1948)
La intuición nos dice que, dado que hay nueve dígitos posibles, cada uno
debería aparecer aproximadamente el 11.1% de las veces. Es lógico, ¿verdad?
Pues la lógica, en este caso, nos engaña profundamente. En el mundo de los
datos reales, el número 1 reina con una frecuencia aplastante, mientras que el 9
es casi un paria.
Sin que lo sepas, la naturaleza tiene una "huella dactilar"
numérica. Si analizas el primer dígito de los caudales de los ríos, las
cotizaciones de la bolsa o las poblaciones de estrellas, descubrirás un patrón
que desafía toda lógica: el número 1 no aparece una de cada nueve veces, como
dictaría el sentido común, sino que aparece en casi una de cada tres.
¿Por qué el universo tiene una obsesión con el dígito uno? ¿Y cómo es
posible que esta extraña anomalía matemática haya enviado a la cárcel a genios
del fraude financiero que creían haber borrado todas sus huellas?
Este fenómeno se conoce como la “Ley de Benford”, y es la herramienta
secreta que utilizan los auditores de Hacienda para cazar a quienes intentan
"maquillar" sus cuentas.
Lo más curioso de esta ley es que no fue descubierta por un
superordenador, sino por el desgaste de las páginas de un libro. En 1881, el
astrónomo canadiense Simon Newcomb (Canada 1835 – 1909) notó que los libros de
tablas de logaritmos estaban mucho más sucios y desgastados en las primeras
páginas, las que empezaban por 1, que en las últimas.
Décadas después, en 1938, el físico estadounidense Frank Benford analizó
más de 20,000 números de fuentes tan distintas como longitudes de ríos, pesos
atómicos y números de direcciones postales. Confirmó que la distribución seguía
un patrón matemático exacto.
La Ley de Benford establece que la probabilidad $P$ de que el primer
dígito sea $d$ se calcula con la fórmula:
$$P(d) = \log_{10} \left( 1 +
\frac{1}{d} \right)$$
Esto nos da las siguientes frecuencias aproximadas:
- El número 1: 30.1%
- El número 2: 17.6%
- El número 3: 12.5%
- ...
- El número 9: Solo 4.6%
Sin entrar en una demostración rigurosa de la ley, que no fue formalmente
demostrada hasta 1995 por el matemático estadounidense Theodore Hill (EE.UU.
1943), comentaremos algunas observaciones de por qué esta ley funciona.
La observación fundamental es que, en un conjunto de datos que abarca
varios órdenes de magnitud (como poblaciones o precios), los números no están
distribuidos uniformemente, pero sus logaritmos sí lo están, debido a lo que se
conoce como la invariancia de escala.
Si tenemos un conjunto de datos que sigue una ley física, esa ley no
debería cambiar si medimos en kilómetros o en millas. Matemáticamente, la única
distribución que mantiene la misma forma de sus dígitos cuando se multiplica
por una constante (el factor de conversión) es aquella cuyos logaritmos están
distribuidos uniformemente.
$$\log_{10}(x) = n + f$$
Donde:
- $n$ es la característica (un número entero que nos dice cuántos dígitos tiene el número).
- $f$ es la mantisa (la parte fraccionaria, que determina cuáles son esos dígitos).
Un número $x$ comienza con el dígito $d$ (por ejemplo, $d=1$) si se encuentra en el intervalo:
$$d \cdot 10^n \leq x < (d+1) \cdot 10^n$$
Si aplicamos el logaritmo base 10 a toda la desigualdad para trabajar con las mantisas, obtenemos:
$$\log_{10}(d \cdot 10^n) \leq \log_{10}(x) < \log_{10}((d+1) \cdot 10^n)$$
Usando las propiedades de los logaritmos ($\log(a \cdot b) = \log a + \log b$):
$$n + \log_{10}(d) \leq n + f < n + \log_{10}(d+1)$$
Restando $n$ en todos los lados, aislamos la mantisa $f$:
$$\log_{10}(d) \leq f < \log_{10}(d+1)$$
Si aceptamos que la mantisa $f$ está distribuida uniformemente entre 0 y 1 (es decir, cualquier valor de la mantisa es igual de probable), la probabilidad de que el primer dígito sea $d$ es simplemente la longitud del intervalo donde cae esa mantisa.
La probabilidad $P(d)$ es la diferencia entre el límite superior y el inferior:
$$P(d) = \log_{10}(d+1) - \log_{10}(d)$$
Usando la propiedad de la resta de logaritmos ($\log a - \log b = \log \frac{a}{b}$):
$$P(d) = \log_{10}\left(\frac{d+1}{d}\right)$$
Y simplificando la fracción dentro del paréntesis:
$$P(d) = \log_{10}\left(\frac{d}{d} + \frac{1}{d}\right)$$
$$P(d) = \log_{10}\left(1 + \frac{1}{d}\right)$$
De manera que, los números pasan mucho más tiempo en los rangos bajos
antes de saltar al siguiente nivel de magnitud. Esta es la esencia de la invariancia
de escala: no importa si mides en metros o en pies, la Ley de Benford se sigue
cumpliendo.
Aquí es donde las matemáticas se convierten en una serie de CSI.
Cuando un ser humano intenta inventar datos —ya sean devoluciones de impuestos,
gastos de empresa o cifras de ventas— tiende a distribuir los números de forma
"aleatoria" según su intuición.
Como vimos al principio, nuestra intuición cree que el 1, el 5 y el 9
tienen las mismas posibilidades. Por lo tanto, un estafador que inventa
facturas pondrá demasiados 7, 8 y 9, y muy pocos 1.
Casos reales famosos:
- Enron: Antes de su colapso en 2001, se analizó la contabilidad de la empresa y se descubrió que sus números se desviaban drásticamente de la Ley de Benford. Era la prueba matemática de que las cifras estaban siendo manipuladas.
- Elecciones Irán 2009: Varios estadísticos analizaron los resultados electorales. Encontraron que los dígitos en los conteos de votos no seguían la distribución de Benford, lo que sugería una manipulación manual de los datos.
- Grecia y el Euro: Un estudio de la Universidad de Mannheim sugirió que los datos económicos que Grecia presentó para entrar en la Eurozona mostraban señales de haber sido "ajustados", basándose en esta ley.
- El Caso de Bernie Madoff. Aunque su esquema Ponzi fue descubierto por otros medios (principalmente porque se quedó sin efectivo), análisis posteriores de los rendimientos mensuales que Madoff entregaba a sus clientes mostraron que eran "demasiado perfectos". Los rendimientos inventados por Madoff no seguían la variabilidad natural que impone Benford. Sus números eran sospechosamente estables, una característica típica de los datos fabricados por humanos que intentan proyectar seguridad y consistencia.
Un dato curioso, si miras una regla de cálculo antigua, el espacio entre el 1 y el 2 es mucho más grande que entre el 8 y el 9. Los ingenieros ya usaban la Ley de Benford visualmente antes de que se llamara así.
Es importante saber que esta ley no es una varita mágica; requiere que
los datos cumplan ciertas condiciones:
- Deben abarcar varios órdenes de magnitud: No funciona con la estatura de las personas (casi todos empezamos con 1 metro) ni con los números de lotería (que están limitados a un rango específico).
- No deben tener límites artificiales: No sirve para precios de productos que suelen terminar en ",99" o números de identificación (DNI).
- Deben ser datos "naturales": Resultados de procesos sociales, económicos o físicos reales.
Un resumen de las lecciones clave que nos deja este fenómeno:
- La naturaleza no es uniforme, es logarítmica: Nuestra intuición nos engaña al pensar que todos los dígitos son iguales. El universo crece por proporciones y escalas, lo que otorga al número 1 un papel protagonista en el escenario de los datos.
- Un espejo de la honestidad: La Ley de Benford se ha consolidado como el "polígrafo matemático" definitivo. Es el recordatorio de que, aunque un falsificador sea meticuloso, es casi imposible para la mente humana replicar la sutil complejidad de la aleatoriedad natural.
- Una herramienta de precisión, no una varita mágica: Como toda gran herramienta, tiene sus límites. Solo brilla cuando los datos son libres, abarcan varias magnitudes y no tienen topes artificiales. Intentar aplicarla a la lotería es tan inútil como intentar medir la temperatura con una regla.
La Ley de Benford es un recordatorio fascinante de que el universo,
incluso en su caos aparente, tiene reglas. Lo que parece una colección de
números aleatorios en un libro de contabilidad es, en realidad, una sinfonía
matemática.
Para los evasores de impuestos, es una pesadilla: sus propias mentiras
chocan contra una ley de la naturaleza que no pueden cambiar. Para nosotros, es
una herramienta brillante que demuestra que las matemáticas no solo están en
los libros, sino que son las guardianas de la verdad en nuestro mundo digital.
La próxima vez que veas una tabla de datos, una factura o incluso la
lista de los países más poblados del mundo, recuerda que el primer dígito te
está contando una historia. Las matemáticas no solo sirven para resolver
ecuaciones en un papel; están ahí afuera, actuando como guardianas silenciosas
de la verdad, esperando a que alguien con una lupa —y el conocimiento adecuado—
sepa mirar.
No hay comentarios:
Publicar un comentario