lunes, 30 de diciembre de 2013




El último "Sabías que..." del año me ha sido proporcionado por Paula Navarro, doctorando en la Universidad de Cantabria..

Sabías que.... la estadística bayesiana se usa para interpretar las dataciones de Carbono-14?


En arqueología se puede determinar la edad de los materiales que contienen carbono a través de la datación por radiocarbono o Carbono-14. Para interpretar estas dataciones se requiere de métodos y herramientas estadísticas por diversos motivos. Primeramente, hay que aunar la información de un gran número de dataciones. Además como el Carbono-14 es el isótopo natural del Carbono más inestable, hay que tener en cuenta sus variaciones. Para ello se emplean las llamadas curvas de calibración. Por tanto, una vez calibradas, las dataciones tienen funciones de densidad que no están normalmente distribuidas, luego los métodos estadísticos clásicos no pueden ser aplicados. 

Además se puede mejorar la interpretación de las dataciones añadiendo información procedente de la estratigrafía, estudio de los materiales, agrupamiento de unidades estratigráficas en fases ordenadas o no, etc. Esto se logra introduciendo dicha información como distribuciones de probabilidad, es decir, como probabilidades a priori de los modelos estadísticos bayesianos.

Fuente: Steier P, Rom W. 2000. The use of Bayesian statistics for 14C dates of chronologically ordered samples: a critical analysis. Radiocarbon 42(2): 183-98
Ramsey C B. 2009. Bayesian analysis of radiocarbon dates. Radiocarbon 51(1): 337-360

lunes, 23 de diciembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?



Los censos de población, edificios y viviendas están entre las operaciones más importantes de la estadística oficial, tanto por la amplitud del trabajo requerido como por la larga tradición de la que proceden. En España por ejemplo, en los reinos de Taifas, entre los siglos XI y XII, ya se utilizaban para establecer los tributos que debían pagar cristianos, musulmanes y judíos. Sin embargo, se considera que el primer censo moderno fue llevado a cabo en 1768 por el Conde de Aranda, bajo el reinado de Carlos III, con fines fiscales y militares. Desde entonces se han organizado 20 censos: tres en el siglo XVIII, cinco en el siglo XIX, diez en siglo XX, y dos en el siglo XXI (2001 y 2011). El censo de 2011, cuyos resultados completos están disponibles desde hace unos días, presenta varias novedades importantes. Por una parte, es el primero en el que no se interroga a toda la población sino que combina el uso de registros administrativos (como el padrón municipal) con la información de una gran muestra formada por más de 1 600 000 hogares y más de 4 millones de personas. Por otra parte, en la recogida de datos, se potenció el cuestionario censal por internet como la primera opción ofrecida a los encuestados. En cuanto al censo de edificiones, también por primera vez, se recogieron los datos de localización geográfica (coordenadas GPS) de todos los edificios.
Los resultados del censo son públicos y de acceso gratuito. Pueden aprovechar sus datos administraciones públicas, empresas privadas pero también investigadores que necesitan conocer características de la población española, o particulares que sienten curiosidad por saber más del lugar donde viven.

Fuente: Pagína de Censos de Población y viviendas 2011 en el INE (http://www.ine.es/censos2011_datos/cen11_datos_inicio.htm), 
Ineexplica http://www.ine.es/explica/explica_historia_censos.htm 

jueves, 19 de diciembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?




Vera Pawlowsky-Glahn me mandó el siguiente "Sabías que..." sobre los llamados datos composicionales... Gracias, Vera!

Se tardó casi cien años en entender por qué se producía lo que Karl Pearson denominó, en 1897, correlación espúrea, y abrir una vía de solución a los casos que la presentan? La correlación espúrea es evidente en vectores de datos con suma constante, conocidos como datos composicionales. La solución vino de la mano de John Aitchison, quien en 1982 publicó un artículo titulado "The statistical analysis of compositional data". En dicho artículo sentó las bases de lo que hoy en día se conoce como geometría de Aitchison. La idea central era que los datos composicionales (a) representan partes de un todo; (b) sólo contienen información relativa, los cocientes entre las partes, y por tanto, la suma constante no es una característica esencial; (c) se pueden analizar tomando logcocientes, pues permiten tener en cuenta dicha información, pero quedan inalterados cuando se cambian las unidades.

Pearson, Karl (1897). Mathematical contributions to the theory of evolution. On a form of spurious correlation which may arise when indices are used in the measurement of organs, Proceedings of the Royal Society of London, LX, 489-502.

Aitchison, John (1982). The statistical analysis of compositional data (with discussion), Journal of the Royal Statistical Society, Series B (Statistical Methodology), 44 (2) 139-177.

Para interesados, una página con mucha información técnica: http://www.compositionaldata.com/

miércoles, 18 de diciembre de 2013

El INE en la UPCT

El Departamento de Matemática aplicada y Estadística de la UPCT ha clausurado 2013, el  Año Internacional de la Estadística con una conferencia  de un miembro de la estructura de dirección del Instituto Nacional de la Estadística. Miguel Angel Martínez Vidal, subdirector general de estadísticas de población.

Impartió el lunes 16 de diciembre una charla estupenda que nos ayudó a evaluar correctamente la importancia y las dificultades, para un país como el nuestro, de producir indicadores fiables. Muchas de las decisiones que afectan directamente nuestro día a día se basan en las números publicados por las oficinas de estadística de nuestros países por lo que no es de extrañar que se encuentran en ocasiones en medio de batallas ideológicas que poco tienen que ver con criterios científicos. A título de ejemplo, Andreas Georgiou, director de la Agencia Estadística Griega, llamada Elstat, está esperando un juicio con cargos de deslealtad, por sus cálculos del déficit del estado heleno en 2009. Se enfrenta a penas entre cinco y 10 años de cárcel, acusado de haber sobrestimado  los números de déficit, lo que llevó a un endurecimiento de las condiciones del rescate. 
Miguel Angel Martínez Vidal nos dio  algunas de las claves para entender el complejo sistema de producción de las estadísticas públicas españolas, y señaló los retos a los que se enfrenta la estadística oficial. Construyó su charla usando un curioso vídeo de opiniones recogidas en la calle sobre qué son las estadísticas, cómo se preparan y  parar qué sirven...

lunes, 16 de diciembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?



Los estadísticos ayudan a luchar contra el cáncer...

Algunas de las mentes más brillantes en la investigación médica trabajan para entender y algún día erradicar una de las mayores causas de muerte en nuestro mundo, el cáncer. Pero no todas son médicos, químicos o biólogos. El estadístico Terry Speed acaba de ganar en Australia el premio del Primer Ministro para la ciencia, dotado con cerca de 200000 euros, por  sus contribuciones al análisis de datos en biología y genética. 
Cuando los progresos tecnológicos en el análisis del ADN que tuvieron lugar a finales de los 80, permitieron evaluar la actividad de miles de genes de forma simultánea,  Terry Speed fue uno de los primeros en analizar esos datos e inventó métodos de extracción de información que siguen utilizándose en laboratorios por todo el  mundo. Como director del departamento de bioinformática en el Instituto de Investigación Médica Walter and Eliza Hall en Melbourne, forma parte de equipos multidisciplinares que buscan predecir, a partir del  perfil genético de células de tumores, si éstos serán benignos o malignos, lo que permite a los médicos evitar realizar cirugía en caso de que no sea necesario.  Afirma que el análisis de los datos de nuestro organismo (perfil genético, historial clínico y familiar, etc...) será clave en el tratamiento del cáncer, que será cada vez más personalizado, por la enorme variabilidad en la respuesta de los individuos ante esta enfermedad. Terry Speed augura por lo tanto un papel cada vez más importante de los estadísticos en los equipos de investigación contra el cáncer... 
Fuente: BBC News Magazine, 24 noviembre 2013. "Terry Speed: How statistics can help cure cancer" http://www.bbc.co.uk/news/magazine-25054938

lunes, 9 de diciembre de 2013

2013, Año Internacional de la Estadística. ¿Sabías que...?


En ocasiones, los estadísticos cuyo trabajo consiste en calcular determinados indicadores socio-económicos  han sido sometidos a presiones y acoso intolerables. Graciela Bevacqua era responsable en el INDEC (Instituto Nacional de Estadístíca y Censos, Argentina),   del equipo que elabora el índice de precios al consumo. En 2005, empezó a recibir presiones por parte de Guillero Moreno, el secretario de Comercio Interior para que manipulara a la baja los datos de inflación, estimados entonces a 12.3%, con el objetivo de reducir el malestar en la población y de cara a elecciones cercanas. Durante dos años Graciela Bevacqua resistió el acoso y las amenazas a la que fue sometida, cumpliendo con los protocolos internacionales de cálculo del IPC. A principios de  2007 fue despedida y al mes siguiente los datos oficiales de inflación publicados eran casi 40% inferiores a la estimación que había realizado con su equipo. Desde entonces, la confianza en la fiabilidad de los datos económicos aportados por Argentina ha desaparecido totalmente: en febrero 2012, la revista "The Economist" decidió incluso retirarlos de sus resumenes mensuales sobre economía mundial...
Más recientemente, Andreas Georgiou, director de la Agencia Estadística Griega, llamada Elstat, está esperando un juicio con cargos de deslealtad, por sus cálculos del déficit del estado heleno en 2009. Se enfrenta a penas entre cinco y 10 años de carcel, acusado de haber sobrestimado  los números de déficit, lo que llevó a un endurecimiento de las condiciones del rescate. En cambio, la Agencia Europea de Estadística Eurostat emitió un comunicado a principios de 2012, en el que asegura que los cálculos de Andreas Georgiou cumplen con la fiabilidad y la calidad exigidos por la normativa europea...
Fuente: "A life in statistics: Graciela Bevacqua", Significance, diciembre 2012 & http://www.bloomberg.com/news/2013-02-07/eurostat-concerned-about-greek-statistics-developments.html.


lunes, 2 de diciembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?



Estadística y hormigón...

La estadística está presente  en la construcción de nuestros edificios... La normativa española sobre el cálculo y seguridad en estructuras de hormigón se llama la  Instrucción de Hormigón Estructural, y es de obligado cumplimiento para todas las estructuras que utilicen hormigón en España.   Su  última redacción  fue aprobada en consejo de ministros en julio de 2008, y se conoce en el sector de la construcción como la EHE08. En ella, por primera vez, se describe de manera sistemática y muy detallada, el control que se ha de llevar a cabo del hormigón producido y entregado a la dirección de obras. Incluye por ejemplo el control de resistencia a la compresión de una muestra de  probetas preparadas con la amasada entregada. Los principios que rigen este control (número de probetas necesarias, condiciones de extracción de la muestra, criterios de aceptación o rechazo de la amasada, etc...) son basados en la estadística para asegurarse de que la probabilidad de error, sobre todo la de aceptar una amasada defectuosa, es muy pequeña...
Fuente: Instrucción de Hormigón Estructural EHE08, Ministerio de Fomento.

lunes, 25 de noviembre de 2013

2013: Año Internacional de la estadística. ¿Sabías que...?


El famoso método de Monte-Carlo

Cuando un fenómeno es demasiado complejo para poder ser descrito por ecuaciones matemáticas, en ocasiones  es posible  estudiarlo consiguiendo reproducir un gran número de veces su comportamiento en un ordenador. En este caso, decimos que "simulamos" el sistema. Si la simulación contiene algún componente de azar, lo llamamos el método de Monte-Carlo, un método muy utilizado en casi todos los campos de la física y la ingeniería. La historia de este método se remonta a la segunda guerra mundial, cuando un equipo de físicos, matemáticos e ingenieros trabajaban en el centro de Los Alamos, en EEUU para concebir la primera bomba nuclear. Uno de ellos, el matemático John von Neumann, estaba estudiando la difusión de los neutrones en material fisionable cuando pensó que podría aprovechar la primera computadora electrónica ENIAC, que se estaba construyendo en la Universidad de Pensylvannia con fondos del ejército. Von Neumann y un equipo de colaboradores simularon un gran número de historias individuales de neutrones, donde los posibles eventos de fisión, absorción, dispersión y escape ocurrían con una probabilidad determinada y observaron el resultado. Fue N. Metropolis, uno de los miembros del equipo, a quien se le ocurrió llamar al procedimiento el método de Monte-Carlo, en referencia al famoso casino de la ciudad del Principado de Mónaco...
Fuente:   N. Metropolis (1987), "The beginning of the Monte-Carlo method", Los Alamos Science, 15, p 125-130. (http://la-science.lanl.gov/lascience15.shtml)

miércoles, 20 de noviembre de 2013

La exposición "2013: Año internacional de la Estadística" en Lugo!




Antes de iniciar una gira por la región de Murcia, la exposición "2013: Año internacional de la Estadística"(ver este post) está de escapada en Lugo...
Gracias a la ilusión de Teresa Vázquez Cadavide, profesora de matemáticas del IES Xoán Montes de Lugo,  Víctor Pollán  del IES Poeta Díaz Castro de Guitiriz, y Begoña López Soto, del IES Fernando Esquío, los diez  carteles "2013: Año Internacional de la Estadística: ¿Sabías que...?" han llegado hasta allí, y sirven de soporte a actividades que han preparado estos profesores de Lugo.
En las fotos, podemos ver a alumnos del IES Poeta Díaz Castro de Guitiriz, trabajando duro para contestar a las preguntas que prepararon Teresa y Víctor...

 Aquí os dejo sus blogs con más información:
http://matematicasxoanmontes.blogspot.com.es/

http://www.blogfesquio.blogspot.com.es/2013/11/exposicion-ano-da-estatistica.html
http://www.blogfesquio.blogspot.com.es/
http://www.blogfesquio.blogspot.com.es/2013/05/dia-escolar-de-las-matematicas.html
http://www.blogfesquio.blogspot.com.es/2013/05/2013-ano-internacional-da-estatistica.html

lunes, 18 de noviembre de 2013

2013: Año internacional de la estadística. ¿Sabías que...?



Periodismo de investigación y de datos...

El periodismo de investigación está siendo potenciado por los avances en las tecnologías de datos y su análisis. Ya en la segunda mitad del siglo XX, algunos periodistas en Estados Unidos empezaron a usar métodos estadísticos para detectar patrones en variables socio-económicas y datos inexplicables, que puedan ser el germen de historias impactantes. Bill Dedman, por ejemplo, ganó el prestigioso premio Pulitzer en 1989 por una serie de artículos llamada "El color del dinero". En ellos demostró con datos la discriminación racial existente en la concesión de préstamos hipotecarios en la ciudad de Atlanta. En nuestros días, la tremenda acumulación de material digital, como son las notas de prensa, informes, actas de reuniones y de comisiones, audios, fotos y vídeos asociados, abre un campo inmenso de búsqueda para los periodistas de investigación pero requiere aún grandes progresos en su tratamiento y en los métodos automáticos de extracción de información. La estadística, en colaboración con la informática, está llamada a tener un papel importante en la exploración sistemática de estas montañas de datos, su clasificación automática, la indexación de audios y vídeos,  y finalmente, la visualización de la información extraída.
Fuente: Cohen S., Hamilton J. & Turner F. (2011) "Computational Journalism". Communications of the ACM, 54 (10), 66-71. (http://cacm.acm.org/magazines/2011/10/131400-computational-journalism/fulltext)
      

lunes, 11 de noviembre de 2013

2013: Año internacional de la estadística. ¿Sabías que...?


La estadística ayuda a desarrollar nuevos fármacos...

La estadística juega desde hace muchas décadas un papel clave en el proceso de investigación y  desarrollo de nuevos fármacos. Es fundamental en particular en los ensayos clínicos: los principios estadísticos de diseño y análisis de experimentos garantizan que los efectos observados se deban realmente al fármaco investigado y  no se confundan con la influencia de factores secundarios como el sexo, la edad del paciente o el efecto placebo...
Sin embargo, por la opacidad de muchas de las compañías farmacéuticas, sólo se hacen públicos los resultados de  una parte de todos los ensayos clínicos que se llevan a cabo, lo que supone una tremenda pérdida de información para pacientes, doctores e investigadores. Es obvio que la existencia de un registro sistemático de los ensayos clínicos realizados, así como la publicación de sus resultados, incluso cuando son negativos sería de gran valía  para evitar repeticiones innecesarias y pérdida de tiempo. La Comisión Europea está elaborando una normativa de regulación de ensayos clínicos que obligaría a incluir cada ensayo en un registro y a proporcionar un resumen de los resultados obtenidos en un plazo máximo de un año después del fin del experimento...
Fuente: "Will Europe help get clinical trial data out from behind closed doors?", Sile Lane, publicado en Statslife, octubre 2013 (http://www.statslife.org.uk/opinion/1011-will-europe-help-get-clinical-trial-data-out-from-behind-closed-doors)  

lunes, 4 de noviembre de 2013

2013: Año internacional de la estadística. ¿Sabías que...?

La estadística ayuda a detectar el fraude...

El astrónomo y matemático Simon Newcomb fue el primero en observar a finales del siglo XIX que no todos los dígitos del 1 al 9 aparecen con la misma frecuencia en el primer lugar de números en grandes conjuntos de "números naturales": según Newcomb, en estos conjuntos, es mucho más frecuente observar un "1" en la primera posición de los números que un "9" por ejemplo.  Unos cincuenta años más tarde, Benford llevó a cabo la comprobación del hecho observado por Newcomb en una gran variedad de conjuntos de datos (áreas de cuencas fluviales, números demográficos, direcciones postales, indicadores de la liga de baseball, peso atómicos de elementos químicos) y encontró una confirmación de las observaciones de Newcomb. Desde entonces, la "ley de Benford" que describe qué distribución de frecuencias podemos esperar para los primeros dígitos de números en grandes conjuntos, ha sido aplicada a la detección de fraude en distintos contextos...En efecto, el hecho de que, en enormes conjuntos de datos asociados a operaciones financieras, elecciones o impuestos por ejemplo, no se cumpla lo predicho por la ley de Benford, puede indicar que ha habido manipulación deliberada y fraudulenta de esos datos...
Fuente:  W K. Tam Cho & B J. Gaines (2007)"Breaking the (Benford) Law: Statistical Fraud Detection in Campaign Finance"  The American Statistician,  61 (3), 218-223. 

domingo, 27 de octubre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?

El padre de las matemáticas financieras fue ignorado y despreciado durante su vida...

Louis Bachelier (1870-1946) fue un matemático francés, considerado ahora como el padre de las matemáticas financieras: en su tesis doctoral titulada "La teoría de la especulación" (1900), logró avances espectaculares en la teoría de los procesos aleatorios y los aplicó de manera visionaria a la predicción de precios de acciones en la Bolsa de Paris. Sin embargo, en vida no tuvo el reconocimiento que mereció: su trabajo fue despreciado y considerado erróneamente como incorrecto por grandes matemáticos de su tiempo, malvivió en una situación precaria hasta conseguir su primer trabajo fijo en la Universidad a la edad de 57 años y se volvió famoso sólo 20 años después de su muerte. Se considera hoy en día que su tesis contiene la primera teoría matemática del movimiento Browniano, cinco años antes de Einstein, y que contiene el germen de la teoría de la valoración de opciones que valió a M. Scholes  y  R Merton, el premio Nobel de economía 70 años después!
Fuente: The Bachelier Finance Society (http://www.bachelierfinance.org/louis-bachelier.html)

domingo, 20 de octubre de 2013

2013: Año internacional de la estadística...


¿Pura coincidencia?

El profesor David Spiegelhalter de  la Universidad de Cambridge, gran divulgador de temas relacionados con la probabilidad y el azar,  mantiene una página web "Understanding uncertainty" donde podemos encontrar, entre otras cosas, una colección de curiosas "coincidencias". Los usuarios pueden mandar historias reales de eventos que suponen una gran coincidencia, es decir  que tienen una  baja probabilidad de ocurrir... Una de estas historias es la de una pareja con tres hijos, ¡que nacieron todos el mismo día del año pero en tres años distintos! Un cálculo sencillo estima la probabilidad de esa coincidencia a 1/365*1/365, es decir de una entre 133255 posibilidades... ¡Una probabilidad muy baja, sin duda! Sin embargo, sabiendo que en España, hay aproximadamente unas 600000 parejas con tres o más hijos (datos INE, 2007), podemos esperar encontrar entre 4 y 5 familias españolas donde se da esa curiosa coincidencia...
Más información: http://understandinguncertainty.org/ y http://understandinguncertainty.org/coincidences.

lunes, 14 de octubre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?



La estadística ayuda a la gestión y preservación de los caladeros.

La gestión de los caladeros presenta muchos desafíos, a menudo consecuencias del hecho de que, para regular correctamente las capturas, es necesario contestar a dos preguntas difíciles: "¿cuántos peces hay" y "¿cuántos peces había?". Incluso la respuesta a la primera pregunta es complicada puesto que no es posible contar los ejemplares directamente. La estadística proporciona modelos de población de peces que ayudan a decidir qué especies y en qué cantidad se pueden pescar. Los datos requeridos para desarrollar estos modelos incluyen las capturas que se consiguieron teniendo en cuenta la flota y la modalidad de pesca, el tamaño y la edad de los ejemplares pescados, e incluso su grado de homogeneidad genética. Pero estos datos, a pesar de los esfuerzos de la Comisión  Europea por recolectarlos, no son disponibles de manera general y desde hace mucho tiempo, por lo que nuestra comprensión de cómo hemos alterado la abundancia de peces en las últimas décadas es limitada.
Fuente: Thurstan, R. (2013), Fishing up the past: What historical records can tell us about marine populations today. Significance, 10: 30–33. 
Ver también el artículo de Eurostat sobre "Fisheries statistics" http://epp.eurostat.ec.europa.eu/statistics_explained/index.php/Fishery_statistics.

lunes, 7 de octubre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?


El movimiento "Open data" (datos abiertos) está cobrando fuerza en nuestras sociedades de la información. Consiste en que las administraciones públicas que acumulan, por su funcionamiento, cantidades masivas de información digital dejen sus datos accesibles en línea de manera gratuita. Por una parte, corresponde a una dinámica de transparencia: los ciudadanos tienen acceso a la información del sector público, y por otra parte,  puede verse como un acercamiento del funcionamiento de las administraciones a la ciudadanía. Pero estas montañas de datos necesitan ser procesadas, organizadas y visualizadas. Por ello, expertos ven en  los "Open data" una oportunidad de fomento de iniciativas emprendedoras: pequeñas empresas con base tecnológica crean aplicaciones para móviles que explotan y presentan los datos de las administraciones disponibles en internet. En Gijón por ejemplo, se celebraron en junio 2013 la segunda edición del "Festival de datos abiertos"  en la que equipos de programadores compiten por desarrollos innovadores de aplicaciones de estas características...
Fuente: "Gijón Open Data Lab" http://www.fundacionctic.org/odlabgijon/
&  Lakomaa, E.; Kallberg, J., "Open Data as a Foundation for Innovation: The Enabling Effect of Free Public Sector Information for Entrepreneurs," Access, IEEE , vol.1, 2013.

domingo, 29 de septiembre de 2013

2013: Año Internacional de la Estadística.



Sondeos de opinión...

El conocer la opinión pública ha sido un esquivo objeto de deseo para empresas, publicistas y políticos desde hace décadas. Los primeros sondeos de opinión que buscaban predecir el resultado de unas elecciones fueron realizados en Estados Unidos a mediados de siglo 19, impulsados por periódicos, que durante muchos años, preguntaban a sus lectores su intención de voto. Un hito en los sondeos de opinión está asociado, a principios del siglo 20, a George Gallup (1901-1984), que después de trabajar en investigaciones de mercados en una compañía de publicidad, ideó y aplicó técnicas estadísticas para conseguir predecir las intenciones de voto a partir de muestras relativamente pequeñas pero con una cierta representatividad demográfica.  En 1936 predijo correctamente que Franklin Roosevelt ganaría las elecciones, en clara contradicción con la predicción del periódico "Literary Digest", el referente en encuestas de opinión de la época, que basándose en un gran número de sus lectores, anticipó lo contrario. 
Más recientemente, en las últimas elecciones americanas, el joven estadístico y analista político  Nate Silver fue definitivamente propulsado a la fama al predecir correctamente el ganador en los 50 estados, usando, según describe, enfoques bayesianos para el modelado y procesado de la incertidumbre...
Fuente: The Gallup organization (www.gallup.com) y "The signal and the noise" (2012), Nate Silver, Penguin press.

lunes, 23 de septiembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...? con tus "Me gusta" en Facebook, se puede saber mucho sobre ti….



Un estudio publicado por investigadores británicos en la prestigiosa revista "Proceedings of the National Academy of Sciences of the United States of America", demuestra que el conocer los "Me gusta" de un usuario de Facebook permite predecir con precisión algunos de sus rasgos más personales: su orientación sexual, sus opiniones religiosas o políticas, sus preferencias políticas, su coeficiente intelectual, su nivel de felicidad, su sexo,  e incluso si sus padres se habían divorciado... El estudio involucró 58 000 voluntarios, y usó de manera intensiva modelos estadísticos que permiten predecir los perfiles psico-demográficos de los usuarios. Una de las conclusiones del estudio es la necesidad de un debate sobre la privacidad en línea y el hecho de que pocos usuarios son conscientes de la cantidad de datos personales que se recopilan sobre ellos. Crearon también una aplicación Facebook (ver http://www.youarewhatyoulike.com/) con los modelos obtenidos, que proporciona una evaluación de la personalidad de un usuario...
Fuente: "Private traits and attributes are predictable from digital records of human behavior" (2013) M. Kosinskia D. Stillwell & T. Graepel. PNAS (http://www.pnas.org/)

lunes, 16 de septiembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?

Las compañías de telefonía móvil analizan tus datos de movilidad....

Las compañias de telefonía móvil están buscando nuevas fuentes de ingreso, y para ello, proponen explotar los datos de localización geográfico-temporal de sus usuarios. Varias de las grandes empresas del sector han modificado en los últimos años sus políticas de privacidad de manera a poder analizar estos datos  de forma  anónima (sin relacionarlo con un usuario concreto)  y agregada (contando el número de clientes en un determinado desplazamiento). Han puesto en marcha departamentos de inteligencia que extraen información de estos conjuntos enormes llevando a cabo su análisis estadístico, elaborando un producto que proponen a grandes empresas, comercios, o administraciones públicas. Afirman por ejemplo que esta información puede ayudar a decidir las mejores ubicaciones para una tienda, mejorar la planificación de la movilidad urbana, determinar las vías de acceso  más usadas para acudir a un gran evento deportivo, etc... 
Fuente: MIT Technology Review: "How Wireless Carriers Are Monetizing Your Movements"  http://www.technologyreview.com/news/513016/how-wireless-carriers-are-monetizing-your-movements/.           

lunes, 9 de septiembre de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?






Eurostat es la oficina estadística de la Unión Europea situada en Luxemburgo. Fue creada en 1953, tres años antes de la creación de la Comunidad Europea, para la Comunidad europea del Carbón y del Acero.  
Su tarea consiste en proporcionar a la Unión Europa  estadísticas de calidad a nivel europeo que permitan comparaciones entre países y regiones, contribuyendo a la toma de decisión sobre planes de desarrollo, ayuda e inversión. Las sociedades democráticas y la Comunidad Europea en particular no podrían funcionar sin una base sólida de indicadores fiables y objetivos, y Eurostat ha ido consolidando su papel en la construcción de Europa. Trabaja en colaboración con los institutos estadísticos de los países miembros para la armonización de las estadísticas producidas, y asesora a los países candidatos a la incorporación a la UE, para que dispongan de sistemas estadísticos compatibles.
Fuente http://epp.eurostat.ec.europa.eu

lunes, 2 de septiembre de 2013

Fantásticos vídeos conmemorativos del año internacional de la estadística.


Con motivo de la celebración del Año Internacional de la Estadística, la SEIO en colaboración con SAS ha elaborado 6 vídeos divulgativos con el fin de acercar a la sociedad cómo influye la estadística en hechos cotidianos que aparentemente pasan desapercibidos y cómo ayuda la estadística a interpretarlos. Se han escogido temas heterogéneos de impacto que permitan comprender cómo interviene la estadística en el desarrollo de los hechos descritos. Los vídeos han sido promovidos por Juan Antonio Cuesta de la Universidad de Cantabria...









lunes, 29 de julio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?




La probabilidad de acertar la combinación ganadora en el juego Euromillones es de una entre 116 millones 531 mil 800. Para calcularla, se multiplica el número de combinaciones posibles al escoger 5 números entre 50 posibilidades por el número de combinaciones posibles al escoger 2 estrellas entre 11. Para ilustrar cómo se realizan estos cálculos, nos centramos en evaluar el número de combinaciones posibles para escoger 2 estrellas entre 11: para escoger la primera estrella tenemos 11 posibilidades, y para cada una de estas posibilidades, me quedan 10 posibilidades para escoger la segunda estrella. Tenemos por lo tanto un total de 11 x 10 = 110 posibilidades de escoger dos estrellas. Pero el orden en el que he escogido las estrellas no importa: el par (3,7) por ejemplo es equivalente al par (7,3). Tengo por lo tanto 110/2= 55 maneras distintas de escoger 2 estrellas entre 11 si el orden no importa. Siguiendo un razonamiento parecido obtenemos que el número de combinaciones para escoger 5 números entre 50 sin que el orden importe es 50 x 49 x 48 x 47 x 46 / (5 x 4 x 3 x 2)= 2118760. El producto de los dos números obtenidos nos da el número total de posibilidades de rellenar un boletín de Euromillones…

Más información sobre el juego Euromillones en http://www.loteriasyapuestas.es/euromillones/

lunes, 22 de julio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?




 El número de Avogadro fue estimado por primera vez con técnicas estadísticas.


En 1827 el botánico Robert Brown observó con su microscopio el movimiento irregular e impredecible de partículas de polen en suspensión en agua. Este fenómeno fue posteriormente relacionado con el movimiento molecular por grandes físicos del siglo XIX, pero fue Einstein a principios del siglo XX quien propuso un modelo matemático de un proceso aleatorio para explicar el desplazamiento observado de las partículas. El físico francés Jean Perrin realizó experimentos para comprobar la teoría de Einstein y gracias a técnicas estadísticas sencillas, consiguió estimar el número de Avogadro, es decir el número de atómos contenidos en un mol. Fue galardonado con el premio Nobel de Física en 1926 por este descubrimiento.  
Fuente: P. Guttorp "Stochastic Modelling of Scientific Data" Chapman & Hall (1995).

lunes, 15 de julio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?


El sector de estudios "Matemáticas y Estadística" presenta la segunda mayor tasa de empleo en España...



El Instituto Nacional de España (INE) realiza desde 1964 la Encuesta de Población Activa (EPA), de periodicidad trimestral cuya finalidad principal es obtener datos sobre ocupación, paro y actividad de la población española. En su última entrega, los resultados demuestran que  la especialidad de sector de estudios "Matemáticas y Estadística" es la segunda especialidad con mayor tasa de empleo, después de "Veterinaria". Más del 75% de los 101400 personas adultas en España con esa especialidad de estudios tiene empleo. Un dato que contrasta con la baja tasa de empleo de las personas de más de 16 años que sólo tienen Programas de Formación Básica (Educación Secundaria Obligatoria o Bachillerato): sólo el 35% de los casi 25 millones de adultos en España con ese nivel de educación tiene empleo...
Fuente: Encuesta de Población Activa (Variables de submuestra) 2012, Instituto Nacional de Estadística (www.ine.es, ver http://www.ine.es/prensa/np779.pdf)

lunes, 8 de julio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?




¡Los primeros mapas de criminalidad se remontan al siglo XIX!

A mitad del siglo XIX, Joseph Fletcher (1813–1852), un joven abogado interesado por la estadística, publicó un artículo lleno de mapas coropléticos, es decir con colores que reflejan el valor de una determinada variable de interés, en el que describía las variaciones entre condados ingleses en cuanto a varias "estadísticas morales". Fletcher superpuso por ejemplo un mapa del crimen en Inglaterra y Gales con otro que reflejaba el nivel de educación. Demostró así que las zonas con mayor índice de criminalidad coincidían con las de mayor tasa de analfabetismo y peor nivel de educación. Fletcher concluyó que mejorando al acceso al sistema educativo, se reduciría a la vez el analfabetismo y la criminalidad. Un análisis de los mismos datos un siglo después demostró que las políticas defendidas por Fletcher tuvieron el efecto que él anticipó. Fuente: "Plotting Evidence to Affect Social Policy: Guns, Murders, Life, Death, and Ignorance in Contemporary America", R. Cook and H. Wainer, Chance (2013). http://chance.amstat.org/2013/04/plotting-evidence/

lunes, 1 de julio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?

Suecia es la cuna de la Estadística Oficial...


Suecia fue pionera en la elaboración de informes sobre su población. En 1749, de manera única en el mundo,  se impulsó en aquel país el llamado "Tabellverket", un plan sistemático de recopilación de datos demográficos: tamaño y composición de la población así como mortalidad. Se distribuyeron a todas las parroquias del país dos formularios con tres tablas, que tenían que devolver rellenas al acabar el año. Gracias a la colaboración de cerca de 2000 pastores, se consiguieron de esta forma datos fiables y de formato homogéneo, que una comisión de la Academia de Ciencias de Suecia estaba encargada de procesar. La primera conclusión evidente fue que la población del país era demasiada escasa respecto a su superficie y sus recursos, y otro dato relevante fue la alta mortalidad de la madre en el parto.
Fuente: Demographic Data Base, Umea University http://www.ddb.umu.se/english/database/the-database-tabverk/

lunes, 24 de junio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?


A la estadística le encanta los "Big Data"...

Entramos de lleno en la era de los "Big Data", un término muy de moda,  que engloba varios conceptos, y que traduce la recogida generalizada de los datos generados por  nuestras maneras de vivir y de trabajar actuales: información climatológica y de media ambiente medidos de manera continua,  entradas en redes sociales, registros de compra y transacciones, vídeos y fotos digitales, señales de localización de móviles.... Casi todo está digitalizado, lo que crea auténticas montañas de datos, y plantea desafíos para extraer de manera rápida y eficiente la información más relevante posible. Las técnicas usadas para ello están en la intersección  de la informática y la estadística, y han dado lugar al campo llamado "Minería de datos". Con ello, se abre para las compañías un mundo nuevo de oportunidades para obtener información sobre las preferencias y las pautas de sus clientes y así diseñar sus estrategias comerciales, pero también para instituciones públicas a la hora de determinar sus prioridades de actuación y desarrollo.

lunes, 17 de junio de 2013

2013. Año Internacional de la Estadística. ¿Sabías que?


Un curioso "Sabías que..." proporcionado por Juan Antonio Cuesta, de la Universidad de Cantabria...

Sabías que durante la Segunda Guerra Mundial se aplicaron técnicas estadísticas para estimar la capacidad de fabricación de la industria militar alemana?

Estas técnicas se basan en el análisis de los números de serie del material capturado al enemigo. Al finalizar la guerra, los aliados accedieron a los datos reales de producción, y descubrieron que las estimaciones estadísticas eran bastante más fiables que las basados en los métodos habituales de espionaje. Por ejemplo:

  • El espionaje estimó la producción de tanques de junio de 1941 en 1.550. El método estadístico fijó este número en 244 y la producción real fue de 271. 
  • La producción alemana de camiones durante el año 1.942 fue de 79.287 unidades. El método estadístico la estimó en 97.300. El espionaje la situó en 200.000.

Fuente:  Ruggles, R, y  Brodie, H. AN EMPIRICAL APPROACH TO ECONOMIC INTELLIGENCE IN WORLD WAR II, J.A.S.A. 1947, 72-91.

domingo, 9 de junio de 2013

2013: Año Internacional de la estadística. ¿Sabías que...?

No hay manera de predecir los terremotos...


 A lo largo del siglo pasado, los sismólogos han observado y localizado millones de terremotos en nuestro planeta. Sin embargo, no existen en la actualidad,  modelos que permitan predecir el momento y el lugar de un terremoto. Sigue siendo un desafío inalcanzable para la sismología, y los expertos son cautos a la hora de siquiera afirmar si se logrará alguna vez... A pesar de todas las observaciones disponibles, la estadística tampoco es capaz de proporcionar modelos útiles para la predicción de estos fenémonos aunque sí proporciona resultados sobre la distribución de los terremotos que han ocurrido. Es destacable por ejemplo la fórmula de Gutenberg-Richter que describe, para una determinada región geográca y un determinado periodo,  el número de sismos de una determinada magnitud. Permite en particular afirmar que la probabilidad anual de un terremoto de magnitud superior a 6 en Suiza es aproximadamente 0.8%....
Fuente: "Earthquake statistics and prediction", S. Wiemer, Institute of Geophysics, Zürich.  (www.earthquake.ethz.ch/education/NDK/NDK)

lunes, 3 de junio de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?



Un  "Sabías que.." muy interesante que me fue proporcionado por Paula Navarro, doctorando en la Universidad de Cantabria.

Ya en el siglo XIX, la estadística ayudó a neutralizar un brote  de cólera en Londres.

En 1854, el médico inglés John Snow, considerado el padre de la epidemiología moderna, resolvió un misterio para la medicina gracias a la estadística.
Ese año, se detectó un brote de cólera en el conocido barrio Soho de Londres. Para encontrar las causas de la enfermedad, Snow representó en un mapa los lugares donde habían aparecido casos de cólera. El análisis estadístico del patrón obtenido sugería que el brote podía haber sido provocado por el agua de una de las fuentes del distrito. La epidemia desapareció cuando el suministro de agua de dicha fuente fue cortado.  
Actualmente, los epidemiólogos siguen estudiando este tipo de mapas, a los que se les aplica modernas técnicas estadísticas para formular hipótesis sobre la etiología de las enfermedades o asesorar sobre la distribución de fondos destinados a la salud. 
Fuente: Ocaña-Riola  R., Cantalejo Garrido C. Sánchez. Epidemiología y análisis espacial. Tendencias en geoestadística. 2012. Pag. 146.

domingo, 26 de mayo de 2013

2013: Año Internacional de la Estadística. ¿Sabías que…?


Los datos de esperanza de vida calculados por el INE un determinado año usan las tablas de mortalidad que recogen las defunciones durante aquel año. Cuando hablamos de esperanza de vida, nos solemos referir a la esperanza de vida al nacer, que refleja el tiempo medio de vida que se puede esperar para un recién nacido en un determinado año, si se mantuvieran los patrones de mortalidad de aquel año. El último dato publicado en España se refiere al año 2011, y es de 82,1 años. Pero no quiere decir que para una persona que cumple 80 años en 2011, le queden en promedio un poco más de dos años de vida. Según el INE, la esperanza de vida a las 80 años es de 9.4 años, es decir, si Ud ha cumplido 80 años en 2011, ¡puede esperar vivir hasta los 90 años!
Fuente: Instituto Nacional de Estadística, (http://www.ine.es)

lunes, 20 de mayo de 2013

2013: Año Internacional de la Estadística. ¿Sabías que..?



El sorteo de la lotería nacional del 25 de mayo de 2013 conmemorará el año internacional de la estadística..

  En las loterías y juegos interviene de manera esencial el azar, un concepto que fascina desde tiempos remotos... La estadística utiliza la teoría matemática de las probabilidades para incorporar en  sus modelos la incertidumbre asociada al azar. Es destacable que, aunque civilizaciones antiguas como los egipcios, los griegos o babilonios pusieron los fundamentos del álgebra, geometría o teoría de números, no es hasta mucho más tarde que se dan los primeros intentos de formalizar el azar en fórmulas... Fue Cardano, médico, filósofo y matemático italiano del siglo XVI, jugador compulsivo, que escribió el tratado "Libro sobre los juegos de azar", en el que calculaba la probabilidad de ganar en distintos juegos de azar y ¡daba incluso algunas técnicas para hacer trampas! El sorteo de la  lotería nacional en España existe desde hace 200 años,  y es muy fácil calcular la probabilidad de acertar el gordo: es de una entre 100000 posibilidades... Este sábado 25 de mayo, el boleto del sorteo de la lotería nacional hará un guiño a la estadística en su año internacional... ¿Aumentarán por ello las probabilidades de que te toque...?

lunes, 13 de mayo de 2013

2013: Año Internacional de la Estadística. ¿Sabías que?



 La estadística y Bush versus Al Gore...

Las elecciones presidenciales USA del año 2.000 fueron ganadas por Bush por un margen  muy estrecho de votos. De hecho, si Al Gore hubiera obtenido 537 votos más en Florida, el ganador hubiera sido Al Gore. Técnicas estadísticas elementales permiten comprobar que el uso de cierto tipo de papeleta de votación (las "papeletas mariposa") confundió a unos 2.500 votantes de Florida que creían que estaban votando a Al Gore, cuando en realidad estaban otorgando su voto a un tercer candidato (Pat Buchanan).
Fuente: Greg ADAMS, “Voting Irregularities in Palm Beach, Florida”, Chance 14, No. 1 (2001), págs. 22-24.

jueves, 9 de mayo de 2013

Una exposición sobre el año internacional de la estadística.



Hemos preparado una exposición de carteles para el año internacional de la estadística. Estará visible en la Casa del Estudiante de la UPCT, del 7 al 20 de mayo de 2013. Se podrá visitar en particular durante la noche de los Museos, el 18 de mayo...
Si alguien está interesado en obtener copias de los archivos, se puede poner en contacto conmigo.












martes, 7 de mayo de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?


 La estadística ayuda a vigilar las epidemias.



La estadística interviene de manera importante en la epidemiología, la disciplina científica que estudia la distribución, la frecuencia y las predicciones del impacto de las enfermedades en las poblaciones humanas. Pero en este campo también, la era digital está cambiando las maneras de trabajar. Un estudio reciente demostró que se pueden utilizar las estadísticas de búsquedas que los usuarios de Google realizan cada día acerca de consejos y ayudas sobre la gripe, para monitorizar y anticipar día a día la actividad de esta enfermad en nuestros países.. (ver http://www.google.org/flutrends/).
Fuente: J. Ginsberg, M. H. Mohebbi, R. S. Patel, L. Brammer, M. S. Smolinski & L. Brilliant ``Detecting influenza epidemics using search engine query data'', Nature (2009), 457, 1012-1014.

lunes, 29 de abril de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?



Florence Nightingale  (1820-1910) fue la primera mujer miembro de la Real Sociedad de Estadística inglesa. Enfermera durante la guerra de Crimea (1853 –1856), organizó un sistema de registro de fallecimiento de soldados por causa de la muerte, llegando a la conclusión de que la causa predominante eran las enfermedades infecciosas y no las heridas de batalla. Para apoyar sus conclusiones, presentó los datos de manera gráfica, contribuyendo a la popularización de estas herramientas. Al acabar la guerra fundó en Londres la primera escuela laíca de enfermería y luchó de manera incansable para conseguir mejoras sociales en la sociedad británica de su tiempo.
Fuente: Instituto Nacional de Estadística, (http://www.ine.es), Un poco de historia

domingo, 21 de abril de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?


Estadística y Spam...

Entre los algoritmos anti-spam más eficientes que usan los proveedores de correo como Gmail o Hotmail, están los basados en estadística Bayesiana, que estiman la probabilidad de que un determinado mensaje sea spam, al comparar sus contenidos con una gran base de datos de mensajes indeseados....
Fuente: J. A. Zdiarski "Ending Spam: Bayesian Content Filtering and the Art of Statistical Language Classification", (2005), No Starch Press.

martes, 16 de abril de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?

El "Sabías que..?" de esta semana me ha sido proporcionado por Juan Antonio Cuesta de la Universidad de Cantabria...

El drama del transbordador Challenger.

El lanzamiento del Challenger del 28 de enero de 1.986 que acabó con la muerte de sus 7 tripulantes no habría tenido lugar si en la NASA hubieran aplicado la técnica estadística correcta para analizar los datos disponibles de lanzamientos previos. De hecho, como resultado de las conclusiones de la comisión de que analizó el accidente, la NASA decidió crear un equipo con conocimientos estadísticos para, entre otras cosas, llevar a cabo la evaluación de los riesgos probabilísticos de los subsistemas más importantes. Fuente: R. D. Siddharta, E. B. Fowles y B. Hoadley "Risk Analysis of the Space Shuttle: Pre-Challenger Prediction of Failure", Journal of the American Statistical Association, 

miércoles, 10 de abril de 2013

2013: Año Internacional de la Estadística. ¿Sabías que...?




La estilometría es el análisis estadístico del estilo de obras literarias, y busca por ejemplo, determinar la autoría de un texto, basándose en características cuantificables propias del autor y no del género o época. Una de estas características  es la longitud de palabra y fue usada para discriminar entre obras de Shakespeare y Bacon por ejemplo.
Fuente: Girón, F.J, Ginebra, J. Riba, A. "Literatura y estadística: el problema de la autoría de Tirant lo Blanc", BEIO (2005) 22, 6-10.

lunes, 1 de abril de 2013

2013: Año Internacional de la Estadística. ¿Sabías que…? Mortalidad infantil y esperanza de vida.


En España, hace 100 años, 1 de cada 4 niños moría antes de llegar a los 5 años de edad. En la actualidad, esta cifra se ha reducido a 4 niños de cada mil. Sin embargo en Sierra Leone, sigue siendo de casi 200 de cada mil. Como consecuencia, la esperanza de vida al nacer en España es de 81 años, mientras que es solo de 48 años en Sierra Leone…
Fuente: Fundación Gapminder, http://www.gapminder.org y http://www.childmortality.org.