La ley de Benford

Publicado en por Emma Rodriguez

Antes de nada me gustaría aclarar dos conceptos.
La Probabilidad y la Estadística se encargan del estudio del azar desde el punto de vista de las matemáticas:

Probabilidad ->
el cálculo científico de probabilidades puede ayudarnos a comprender lo que en ocasiones la intuición nos indica de manera errónea. Un ejemplo típico es la denominada "paradoja de los cumpleaños". Supongamos que estamos en un grupo de 23 personas. Los cálculos nos dicen que la probabilidad de que dos personas celebren el mismo día su cumpleaños es del 50%, algo que a simple vista parece increíble (es la llamada Paradoja del Cumpleaños).
No es de extrañar por tanto que la Teoría de Probabilidad se utilice en campos tan diversos como la demografía, la medicina, las comunicaciones, la informática, la economía y las finanzas.


Por otro lado, La Estadística
ofrece métodos y técnicas que permiten entender los datos a partir de modelos. Se suele pensar en un conjunto de datos numéricos presentada de forma ordenada y sistemática.
Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio.

Todo esto viene a cuento para explicar lo siguiente: La Ley de Benford.

Un físico de General Electric se dio cuenta hace unos 70 años de que así, en general, los números suelen empezar por «1». Con el tiempo a aquello se llamó Ley de Benford (o Ley del Primer Dígito) en su honor, y es una de las cuestiones matemáticas más fascinantes.
¿Por qué en números aparentemente aleatorios como las longitudes de los ríos, las estadísticas de beisbol, o los números de los edificios suelen tener el «1» como primer dígito?

Benford trabajó con más de 20.000 conjuntos de números de todo tipo hasta poder tener datos suficientes para enunciar su teoría.

benford1.jpg
Como se ve en el gráfico, la frecuencia esperada para números que comienzan por 1 es casi del 30%, para el 2 es de un poco más del 17%, para el 3 algo más del 12% y para el resto disminuye.

Al parecer este fenómeno tiene que ver con cómo los seres humanos usamos los números en la práctica a partir de conjuntos procedentes de la la naturaleza.




Aplicaciones

Durante muchos años la ley de Benford no ha sido más que una curiosidad estadística sin fundamentación matemática ni aplicaciones reales.
Hoy la ley está firmemente basada en la teoría de la probabilidad, goza del interés del público general y presenta importantes aplicaciones:

Si alguien trata de falsificar, por ejemplo, su declaración de la renta, irremediablemente tendrá que inventar algún dato. Al intentarlo, la tendencia de la gente es utilizar demasiados números que comienzan por dígitos a mitad de la escala, 5, 6, 7, y pocos que empiezan por 1. Esta violación de la Ley de Benford no implica necesariamente fraude, pero sí constituye un buen indicio para justificar una inspección más detallada.

Por ejemplo, la Hacienda de EE.UU determinó que si una cifra empieza por tres y aparece el 40% de las veces, en vez del 12,5%, hay motivos para investigar el fraude fiscal.
Esta técnica ha sido probada con un gran éxito en la oficina del fiscal del distrito de Brooklyn de New York.

Cuando hablamos de una distribución aleatoria de números nos referimos a una lista cualquiera de números que haya sido generada al azar, por ejemplo, temperaturas o presión atmosférica, fallecidos en epidemias a lo largo de la historia o el número de cigarrillos que se han fumado todos los habitantes de una ciudad entre los 20 y los 40 años, por poner algunos ejemplos.

No se podrían considerar listas de este tipo a los números de las matrículas de los coches de un país o a los números asignados a los teléfonos por las diferentes operadoras, ya que estas listas de números se generan siguiendo unas reglas estrictas de aparición en escena (sí sería aleatorio, sin embargo, la lista de matrículas de coche que pasan por un peaje en un intervalo de tiempo dado).


Otras posibles aplicaciones: en computación científica y aritmética en punto flotante, en detectar errores en listas de fallos...

Lo importante del asunto es que realmente estos números se modelan según una distribución de probabilidad, lo cual los hace invariables según la escala de medida que se utilice. Si no fuera así, no podríamos hablar de la ley de Benford, ya que sería un caso particular, sin ningún interés matemático.
Además, hay que tener cuidado con el ámbito de aplicación de la ley, que sólo es válida para conjuntos de números que sigan una distribución, por ejemplo, de crecimiento exponencial. Datos “totalmente” aleatorios, como aquéllos conjuntos de números que sigan una distribución normal, no son válidos para la aplicación de la ley de Benford.


En esta web pueden verse donde se puede aplicar esta teoría. Como vemos, no es una teoría "mágica", aplicable para todos los casos de numeros (no vale para la Lotería, por ejemplo).

Fuentes:
Microsiervos
estadísticaparatodos.es

Etiquetado en Matemáticas

Comentar este post