Seminario El-ghazali Talbi: How machine learning can help optimization

Seminario El-ghazali Talbi: How machine learning can help optimization

IMG_2965El-ghazali Talbi en el CIO el pasado 29 de noviembre. | Foto: Inma López

El pasado viernes 29 de noviembre, estudiantes y profesores de la Universidad Miguel Hernández de Elche pudieron disfrutar del seminario «How machine learning can help optimization» impartido por el profesor e investigador de  Polytech’Lille – University of Lille, El-ghazali Talbi.

¿Cuál es el principal objetivo de esta contribución, artículo, ponencia?

La idea de esta conferencia es investigar cómo podemos usar diferentes técnicas de aprendizaje automático para mejorar el diseño de algoritmos de optimización. Me centro en algoritmos de optimización basados ​​en metaheurística. Y luego, en esta charla, he resumido las diferentes ideas en el diseño de diferentes optimizaciones basadas en datos metaheurísticos utilizando técnicas de aprendizaje automático para tener algoritmos de optimización eficientes.

What is the main objective of this conference?

The idea of this conference is to investigate how we can use different machine learning technics to improve the design of optimization algorithms. I focus on metaheuristics based optimization algorithms. And then, in this talk I have summarised the different ideas in designing different metaheuristics data driven optimization using machine learning technics to have for efficient optimization algorithms.

¿Podría, por favor, resumir en un minuto los principales resultados y conclusiones del proyecto?

El resultado principal de esta presentación, que dará un artículo que estoy finalizando, es hacer una encuesta o clasificación de las diferentes formas en que podemos usar el aprendizaje automático en la optimización. Por lo tanto, el resultado más importante en esta presentación es tener, no solo una encuesta de los diferentes trabajos relacionados, sino unificar la forma de utilizar el aprendizaje automático en la optimización. Forma unificada en qué componente de optimización podemos agregar algunas técnicas de aprendizaje automático. Así que este es el resultado principal de esta presentación.

Could you briefly summarise the results and conclusions of this investigation?

The main output of this presentation, that will give a paper that I am finalising, is to give survey or classification of the different ways we can use machine learning in optimization. So the most important output in this presentation is to have, not only survey of the different related work, but unify the way of how using machine learning into optimization. Unified way in which component of optimization we can add some machine learning technics. So this is the main output of this presentation.

¡No te pierdas el seminario que  El-ghazali Talbi impartió en el CIO!

 

 

Seminario José Manuel Cordero:  Los valores plausibles y su tratamiento en los análisis de eficiencia con datos educativos internacionales.

Seminario José Manuel Cordero: Los valores plausibles y su tratamiento en los análisis de eficiencia con datos educativos internacionales.

IMG_2962José Manuel Cordero en el CIO el pasado 15 de noviembre. | Foto: Inma López

El Instituto Universitario de Investigación «Centro de Investigación Operativa (CIO) de la Universidad Miguel Hernández de Elche, acogió el pasado 15 de noviembre esta conferencia del investigador José Manuel Cordero, profesor de la Universidad de Extremadura.

Título de la ponencia: Los valores plausibles y su tratamiento en los análisis de eficiencia con datos educativos internacionales.

 

¿Cuál es el principal objetivo de esta ponencia?

El objetivo fundamental de la ponencia es dar información a los usuarios de bases de datos educativas internacionales sobre el cómo deben tratar los valores plausibles, que son unos valores que aparecen en esas bases datos cuando hacemos análisis de eficiencia. Es decir, hay diferentes maneras de tratarlo, tomando un valor o la media, y queremos saber si utilizando un criterio u otro vamos a alcanzar resultados similares o no.

¿Podría resumirnos los resultados de esta investigación?

En la investigación hemos comparado los resultados que obtenemos aplicando una de las técnicas, que es una de las más habituales en el mundo de la eficiencia como es DEA, tomando los valores medios de los valores plausibles o los valores plausibles por separado, y lo hemos comparado con una estimación alternativa utilizando modelos DEA fuzzy donde podemos tener en cuenta que, esos valores plausibles en realidad representan un rango de habilidades y, por tanto, no pueden ser representadas a través de un solo valor sino a través de un intervalo. Y lo que nos dicen los resultados es que se parecen bastante los resultados tomando valores medios o valores individuales de cada valor plausibles con el rango de resultados. Por tanto, en principio, optar por la opción sencilla de utilizar valores medios o de un solo valor, en principio está bien, pero hay que tener cuidado porque podría ser que la estimación obtenida del índice de eficiencia esté un poco sobreestimada. Es decir, que en algún caso estemos identificando unidades eficientes cuando en realidad no lo son porque, considerando las distribuciones, algunas estimaciones nos quedan con valores superiores a los índices de eficiencia con valores medios. Entonces, en principio puedo utilizar esos índices, pero con cuidado a la hora de identificar las unidades eficientes.

¡No te pierdas el seminario que José Manuel Cordero impartió en el CIO!

 

 

 

Seminario Francisco Morillas Jurado: Estadística, Longevidad y Límites del ser Humano

Seminario Francisco Morillas Jurado: Estadística, Longevidad y Límites del ser Humano

FRAN 2Francisco Morillas en el CIO el pasado 12 de noviembre. | Foto: Inma López

El pasado martes 12 de noviembre, estudiantes y profesores de la Universidad Miguel Hernández de Elche pudieron disfrutar del seminario «Estadística, Longevidad y Límites del ser Humano» impartido por el profesor e investigador de la Universidad de València,  Francisco Morillas Jurado.

¿Cuál es el principal objetivo de esta contribución, artículo, ponencia?

El principal objetivo de mi comunicación, de esta investigación, ha sido, más que dar respuesta a una pregunta, establecer un paralelismo entre las capacidades del ser humano, en términos de longevidad: ¿cuántos años somos capaces de vivir el ser humano? Y los límites fisiológicos del ser humano, pero en este caso en las pruebas de atletismo, en diferentes pruebas de disciplinas deportivas como son las de atletismo, la natación, el Tour de Francia o la vuelta ciclista a España.

¿Podría, por favor, resumir en un minuto los principales resultados y conclusiones del proyecto?

Básicamente, lo que he tratado de establecer es que no podemos vivir indefinidamente como algunos estudios apuntan. Está claro que existe un gran margen de mejora todavía, en cuanto a que el ser humano es capaz de vivir. Es una cuestión difícil de establecer, si ese límite está más próximo o más lejos o, incluso si no está, debido a que médicamente no sabemos hasta donde somos capaces de llegar. Pero lo que sí que podemos con la foto actual, con las técnicas actuales, como médicas, tipos de hábitos, las estrategias que se utilizan en general en la sociedad, podríamos pensar que la espereza de vida del ser humano tiene cierto límite, puede ir mejorando poco a poco, pero va a pasar como está sucediendo también en las pruebas de atletismo: un récord en una disciplina atlética se ha ido batiendo pero cada vez el número de mejoras y el margen de mejora de un registro en atletismo cada vez es más difícil de batir y la mejora es mucho más pequeña. Entonces, pensamos que en la longevidad esté pasando algo parecido y se produzca una mejora cada vez más pequeña.

FRAN 3Francisco Morillas en el CIO el pasado 12 de noviembre. | Foto: Inma López

¡No te pierdas el seminario que Francisco Morillas impartió en el CIO!

 

 

Seminario José Luis Zofío: » El principal objetivo  es intentar caracterizar y ayudar a los empresarios a identificar los factores que les permiten reducir los costes de un período de tiempo de un año a otro»

Seminario José Luis Zofío: » El principal objetivo es intentar caracterizar y ayudar a los empresarios a identificar los factores que les permiten reducir los costes de un período de tiempo de un año a otro»

The Decompositions of Cost Variation

unnamedJosé L .Zofío en el CIO el pasado 7 de noviembre. | Foto: Inma López

El Instituto Universitario de Investigación «Centro de Investigación Operativa (CIO) de la Universidad Miguel Hernández de Elche, acogió el pasado 7 de noviembre esta conferencia del investigador José Luis Zofío, profesor de la Universidad Autónoma de Madrid.

¿Cuál es el principal objetivo de esta contribución, artículo, ponencia?

El principal objetivo del seminario de hoy es intentar caracterizar y ayudar a los empresarios a identificar los factores que les permiten reducir los costes de un período de tiempo de un año a otro. Entonces, lo que nosotros planteamos es un modelo teórico que estudia de una forma sistemática cómo son estas variaciones en los costes que, a veces para los empresarios pueden ser positivas o negativas. Si los costes se reducen de un año para otro, son positivas, y si aumentan son negativas. Si eso se debe al hecho de que están cambiando los precios en el mercado o que ello, desde el punto de vista de la demanda, de las cantidades factores productivos que emplean pues se están equivocando, pues podrían no estar minimizando los costes de producción y, por tanto, hay un margen de mejora desde el punto de vista de la realización empresarial, del departamento de compras, del departamento de producción etc. Esta variación somos capaces de atribuirla de una forma sistemática a distintos factores como pueden ser la eficiencia técnica de la empresa, la eficiencia asignativa, el cambio tecnológico que haya en la industria, una serie de efectos del tamaño de las empresas, si se benefician porque crecen, etc.

¿Podría, por favor, resumir en un minuto los principales resultados y conclusiones del proyecto?

El nuevo modelo mejora unos que existían previamente propuestos en la literatura al caracterizar estos términos en los que se descompone esta variación de los costes de una forma sistemática y con una mejor interpretación. Realmente, lo que hacemos es una aplicación empírica sobre bancos taiwaneses, que nos sirven para ilustrar las distintas descomposiciones que proponemos, unas aditivas y otras multiplicativas. Lo que venimos a decir es que los resultados teóricos, a parte de la mejora en las descomposiciones frente a lo que había en la literatura es la idea de que podemos relacionar dos tipos de descomposiciones como el cambio de los costes de una forma aditiva o de una forma multiplicativa, cosa que no había existido. Que mejoramos la interpretación y que de esa forma podemos consolidar en la literatura dos líneas que habían evolucionado de forma distinta. Y luego, respecto a los resultados mostramos como el modelo se puede aplicar en la realidad para identificar cuáles son las fuentes de la mejora en los costes en la industria financiera, en este caso de Taiwán. Vemos que la mayor parte de las reducciones es gracias a la reducción de los precios de los imputs, de los factores productivos, trabajo capital, que esta industria ha crecido a lo largo del tiempo, ha sido capaz de producir más, pero incurriendo en unos costes unitarios menores y que esto se debe fundamentalmente al cambio tecnológico. Es decir, al hecho de que es posible incurrir en menores costes, produciendo lo mismo, como consecuencia del hecho de que la tecnología permite producir más con menos, desde un aspecto técnico. Una vez hemos controlado por la reducción de los precios me refiero.

¡No te pierdas el seminario que José L. Zofío impartió en el CIO!

 

 

 

Justo Puerto: “El analista de datos está de moda porque tiene una rentabilidad inmediata que es perceptible por la empresa”

Justo Puerto: “El analista de datos está de moda porque tiene una rentabilidad inmediata que es perceptible por la empresa”

IMG_2578Justo Puerto en el CIO el pasado 3 de julio. | Foto: Carla Serrano

Justo Puerto es catedrático en la Universidad de Sevilla y también ejerce como investigador en el Instituto de Matemáticas de la Universidad de Sevilla (IMUS), aunque anteriormente trabajó como estadístico en el Hospital Universitario Virgen de Valme de Sevilla. Ha sido profesor visitante en universidades de Alemania, Puerto Rico, Estados Unidos o Japón, entre otras. Además, es miembro de los grupos españoles de Teoría de Juegos y Localización desde 1994. Ha publicado cinco libros relacionados con la Teoría de Juegos y la Optimización y ha colaborado en una veintena más. Asimismo, acumula 200 publicaciones en revistas de gran prestigio.

Pregunta. El diario The New York Times considera al científico de datos como «la profesión más sexy del siglo XXI”. Y vaticinó que un 40% de las empresas que demandasen este perfil en EEUU en 2018 se quedarían sin cubrir ese puesto. ¿Cuáles son los sectores y los tipos de empresa que más demandan la figura del analista de datos en España?

Respuesta. Este artículo que mencionas hacía referencia a una profesión que se llama Analytics. La traducción es correcta, pero lo que hay detrás de este término es algo más amplio que el análisis de datos en sí. El término Analytics se refiere a todo profesional que es capaz de hacer análisis de operaciones, tanto de datos como de máquinas, como de personal. Es una apreciación un poco más amplia. Por eso, quizá sea mucho más ambicioso de lo que podríamos pensar de un análisis de datos en España. ¿Por qué no hay suficientes profesionales para esto? Es como todo: cuando una profesión se vuelve viral, se convierte en sexy. Todo el mundo quiere tener un experto cerca y no hay expertos para todo el mundo. Entonces, solo la gente que tiene una formación en Investigación Operativa y en Ciencia de Datos son verdaderos expertos en Analytics. En Estados Unidos creo que hay unos 5.000 y muchos de ellos ya tienen puestos en universidades o en empresas. Y los que se gradúan cada año pueden ser 100 o 200 personas que entran en el mercado. Si cada empresa del ámbito del transporte, de análisis de datos, de gestión de personal o de finanzas quiere tener un profesional en este ámbito, no hay suficientes.

P. ¿Y cuáles son los sectores que más demandan este puesto en España?

R. En España las grandes empresas tienen un gabinete de Analytics, que aquí se llama Ciencia de Datos. Algunos ejemplos son Repsol o Iberia. Hay otras que, aunque no tengan un gabinete como tal, sí cuentan con expertos como por ejemplo los bancos, las compañías de seguros, Renfe, El Corte Inglés. Y todos los que se dedican a analizar datos. También hay muchas pequeñas empresas que se dedican a esto en Madrid y en Barcelona. Además, el Ministerio de Defensa tiene tres gabinetes, uno para el ejército del aire, otro para la marina y otro de tierra

P. El salario de un analista de datos en España se sitúa entre los 40.000 y los 75.000 euros al año, y ahora mismo faltan profesionales cualificados para el puesto. ¿Por qué el analista de datos se ha convertido en uno de los perfiles más buscados y mejor pagados en nuestro país?

R. Está de moda porque tiene una rentabilidad inmediata que es perceptible por la empresa. El analizar mercados, el determinar perfiles de clientes o el determinar precios de productos que salen al mercado son cosas que se hacen diariamente y se han dado cuenta de que, con un poco de inversión, obtienen una rentabilidad inmediata. No tienen que hacer una gran inversión, ni un departamento de I+D, sino tan solo analizar un conjunto de datos que se puede hacer con un ordenador personal y un experto que sea capaz de manejar unos programas tipo Python o R. Y creo que la respuesta está en que tienen una repercusión inmediata en la cuenta de resultados.

“Hay cuadros directivos de empresas que tienen deficiencias en formación de Análisis de Datos y ese desconocimiento los lleva a no usar esta herramienta”

P. ¿Las universidades españolas están formando a sus estudiantes, con titulaciones puestas al día, para ser auténticos analistas de datos? ¿O son las empresas las que se tienen que encargar de formar a sus trabajadores?

R. En el mundo ideal esa formación se debería adquirir en la universidad. Sin embargo, el mundo ideal es algo que está lejos del mundo real. En el mundo real las universidades españolas tienen unos planes de estudio que necesitan pasar unos procesos de acreditación y necesitan un tiempo de asentamiento que ha hecho que en estos momentos la formación de Analista de Datos como tal no se esté ofertando en muchas universidades. Hay algunos centros donde sí que tienen algún máster orientado a Análisis de Datos, pero es verdad que no es una tendencia global.

P. Quizás deberían actualizarse un poco…

R. Claro. Las cosas deberían actualizarse, pero que una titulación se pueda ofertar a nivel oficial requiere una trayectoria de acreditación, la discusión de un plan de estudios y unos trámites que no son rápidos y no se pueden improvisar. Para eso todo el sistema universitario español tiene mucha inercia. No se puede crear una titulación oficial de la noche a la mañana. Lo que pasa es que están surgiendo alternativas de formación más o menos fiables que están basadas en títulos propios; títulos que ofertan empresas, algunas de mucha calidad y otras de muy poca calidad. Cuando no hay un proceso de acreditación y control de calidad encuentras un rango desde lo bueno a lo malo.

P. No es más productiva la empresa que más recursos posea, sino aquella que mejores resultados obtenga. Y la optimización de recursos va de la mano del ahorro, un concepto muy importante para las empresas. Sin embargo, ¿por qué algunas grandes empresas todavía no hacen uso de esta herramienta?

R. Eso tiene que ver con la formación de los cuadros directivos de la empresa. Para que esta herramienta se aprecie es necesario que el equipo de dirección de la empresa comprenda que al utilizar herramientas analíticas van a obtener mejores resultados. Si eso no está en la formación del cuadro directivo, es algo que ni siquiera se plantea. Tenemos consejos de administración y cuadros directivos que tienen deficiencias en formación y el desconocimiento los lleva a no usarlo. Creo que esa es la explicación.

“Las Matemáticas en España están bien posicionadas a nivel global por número y nivel de publicaciones, pero faltaría que hubiera una estrella, una especie de referente del que todos nos sintamos orgullosos porque nos representa”

P. Y según su criterio, ¿cree que sería recomendable que una startup contase con un analista de datos desde el primer minuto?

R. Depende de la empresa. Quizá para el lanzamiento de la empresa sí que tendría que hacer un primer estudio de mercado, de posicionamiento, y para eso sí haría falta un analista. Pero depende de cuál sea el perfil de la empresa. Alguien que vaya a hacer microchips o que vaya a desarrollar una pieza de ingeniería es posible que no lo necesite. Quizás en el primer momento necesiten hacer un estudio de posicionamiento de mercado. Realmente ahí sí tiene cabida, pero en los inicios es posible que no fuera necesario en todos los casos.

P. Usted ha investigado también en localización de servicios y sus aplicaciones. ¿Cómo puede facilitarnos la adecuada localización de infraestructuras en la vida cotidiana?

R. Bueno, eso es fundamental. Nuestra vida cotidiana depende de los servicios, y los servicios se ubican siguiendo unos criterios de localización. Tener un hospital a una distancia razonable es fundamental en caso de un accidente. Tener un colegio en el entorno de un barrio es fundamental para que los estudiantes no tengan que desplazarse. Construir en zonas donde no se produzcan averías de agua ni inundaciones es obligatorio, porque luego se producen desastres, como estamos viendo. La vida cotidiana depende de muchas cosas, una de ellas es que las infraestructuras estén bien ubicadas, porque eso simplifica la vida de todos los usuarios.

P. Carmen Herrero, a quién entrevistamos recientemente, dijo que “un país que no investiga, que no innova, que no crea producto tiene las puertas cerradas al porvenir”. Usted ha sido coordinador de la Agencia Nacional de Evaluación y Prospectiva (ANEP). ¿Se reciben muchas propuestas de proyectos hoy en día en España?

R. Participé en la Agencia Estatal de Investigación durante unos años, en el área de Matemáticas. En esta área se presentan anualmente en torno a 200 proyectos de investigación. De los cuáles, hay una parte que son de investigación básica y otra que son de retos de la sociedad y de la ciencia. Para el colectivo de matemáticos que hay en España, 200 proyectos anuales es un número adecuado, de los cuáles se financian alrededor del 60%. Unos tienen toda la financiación que solicitan y otros menos, pero en el área de Matemáticas la investigación es adecuada y está razonablemente financiada.

“En los últimos años nos hemos dedicado a pagar con dinero público estudiantes de doctorado brillantes que han terminado fuera, revirtiendo el valor que tendría que revertirse en la sociedad española en otras sociedades”

P. ¿Cree que estos proyectos están bien enfocados o deberían ser más específicas en cuanto a la temática o la aplicación?

R. Yo creo que el 60% de los proyectos estaban bien enfocados y por eso recibieron financiación, mientras que el resto no y por eso no recibieron financiación. Los grupos de investigación en Matemáticas en España, tanto los que hacen Matemática básica y pura, como los que hacen Matemática Aplicada, como el resto de las áreas de los campus, se clasifican entre los que hacen bien su trabajo y los que hacen menos bien su trabajo. Y los que lo hacen bien, lo hacen muy bien. Los otros están mejorando.

P. Según su experiencia, ¿qué aspectos se podría mejorar a la hora de proponer un proyecto?

R. Tendría que haber una apuesta por conseguir un mejor posicionamiento internacional en Matemáticas, en el sentido de que las Matemáticas en España están bien posicionadas a nivel global por número y nivel de publicaciones, pero faltaría que hubiera una estrella, una especie de referente del que todos nos sintamos orgullosos porque nos representa como Rafa Nadal o Fernando Alonso. Personas que crean una atención mediática que hace que la sociedad se fije en algo, porque como te he dicho antes, la investigación Matemática en España se hace bien y desde hace años los índices que se consiguen a nivel internacional son muy buenos y tenemos en la universidad grupos de investigación matemática que se encuentran entre los 50 mejores del mundo, pero falta que nuestra sociedad se sienta orgullosa del trabajo que se hace en la Matemática española y es difícil. Eso solo se consigue con campañas mediáticas o con alguien que se convierta en una estrella notable en el ámbito internacional.

P. ¿Cómo ve el futuro de las Matemáticas en España?

R. Tengo una visión un poco pesimista. Durante años se ha ido produciendo un relevo generacional: formas a gente que llega a formar parte de los grupos de investigación, aprenden todo lo que tú has tardado 30 años en entender a nivel del máximo conocimiento internacional, y eso funciona como una especie de gremio donde uno va formando a otro y se produce un relevo generacional. Esto es un movimiento continuo dónde el conocimiento no se pierde. Lo que se ha conseguido con el esfuerzo de mucha gente y la inversión pública a lo largo de 30 años se va manteniendo. En los últimos años esta tendencia se ha roto, y las universidades y los centros de investigación no están propiciando el relevo generacional. Entonces, en unos cuántos años toda la generación que empezamos prácticamente a finales de los años 80 vamos a llegar a nuestra edad de jubilación y se va a producir una fractura en la gente que nos reemplace. Y si se produce esa fractura, volver a recuperar esos años perdidos y ese conocimiento no amortizado va a dar lugar a un retroceso en lo que es el posicionamiento de las Matemáticas españolas a nivel internacional. Esto todavía no es inminente y se puede revertir, pero hay que dar la voz de alerta ahora.

“Hay que buscar cómo rescatar talento y cómo buscar el reemplazamiento de las generaciones porque ya estamos en la segunda parte de nuestra carrera profesional”

P. Según su criterio, ¿qué podemos hacer para revertirlo?

R. Lo que podemos hacer es que las universidades puedan volver a contratar a gente excelente. Que los centros de investigación puedan contratar a gente realmente valiosa y que no estemos formando a gente con dinero público español para que reviertan su plusvalía en centros de investigación alemanes, americanos, ingleses, canadienses… Porque en los últimos años nos hemos dedicado a pagar con dinero público español estudiantes de doctorado brillantes que han terminado fuera, revirtiendo el valor que tendría que revertirse en la sociedad española en otras sociedades. A nivel individual es un éxito para cada uno de ellos, porque reconocen su valía y su prestigio, pero a nivel de nación es un desastre porque estamos formando a la mejor generación que nunca ha habido en la historia de España y un alto porcentaje de ellos terminan trabajando fuera. Hay que buscar cómo rescatar talento y cómo buscar el reemplazamiento de las generaciones porque ya estamos en la segunda parte de nuestra carrera profesional.

 

 

¡No te pierdas el seminario que Justo Puerto impartió en el CIO!

Emilio Carrizosa (II): “Hay un abuso por parte de los sectores de las nuevas tecnologías en cuanto a la cantidad de información que adquieren sobre nosotros”

Emilio Carrizosa (II): “Hay un abuso por parte de los sectores de las nuevas tecnologías en cuanto a la cantidad de información que adquieren sobre nosotros”

IMG_2468

Emilio Carrizosa impartiendo un seminario en el CIO el pasado 27 de mayo. | Foto: Irene Moreno

Puedes leer la primera parte de la entrevista a Emilio Carrizosa aquí.

Pregunta. La mayoría de técnicas estadísticas llevan décadas desarrolladas, pero no se han podido utilizar hasta que no se ha desarrollado la tecnología computacional necesaria. ¿Cómo compensa, en este sentido, la inversión necesaria en tecnología?

Respuesta. No hace falta una gran inversión. La tecnología está ahí y los datos están ahí. La Estadística, el Análisis de Datos del siglo XX y el previo al siglo XX era un Análisis de Datos que respondía a una realidad: que había pocos datos porque era muy costoso acceder a esos datos. Ahora mismo los datos están ahí porque estamos todos monitorizados. Y no hablemos ya si tenemos un reloj de estos modernos, o a través de nuestro teléfono móvil. Si hacemos uso de las redes sociales con más motivo todavía. Los datos están ya ahí. Si tenemos una base de datos con una cantidad ingente, sobre todo cuando estás movilizando imágenes o vídeo, el tamaño de los conjuntos de datos crece enormemente, pero ahí no está el problema. Para poder hacer un análisis sofisticado con las nuevas técnicas de ciencia de los datos, uno no necesita grandes máquinas. Ese no es el problema. Lo que necesita es conocimiento. Lo que necesita es que cada persona haya pensado y ahí es donde hay que poner una gran parte de la inversión. Las máquinas son baratas, la capacidad de cálculo se puede comprar, se pueden alquilar horas de procesamiento en máquinas que estén en la nube, o en EEUU, o dónde estén. Y ahí no está el problema, porque las máquinas ya están. Solo hace falta una pequeña inversión para adquirirlas y traerlas aquí o para alquilar espacio y tiempo de cómputo. Lo que hace falta es gente que sea capaz de transformar los datos que también están ahí en conocimiento. Y para eso, a parte de las máquinas, lo que hace falta son personas. Las estadísticas y la ciencia de los datos que tenemos hoy en día difieren fundamentalmente de la de tiempos anteriores en que antes había pocos datos. Entonces todo estaba optimizado para sacarle el máximo jugo a esos pocos datos que existían. Ahora el reto es que tenemos una cantidad ingente de datos y tengo que ver cuál es la manera de sacarle el conocimiento para que sea comprensible. Es una información útil para el que tenga que tomar las decisiones en cada momento.

P. El Big Data analiza cantidades ingentes de datos. ¿Son todos esos datos igualmente útiles? ¿Cómo podemos discriminar correctamente?

R. El reto no está en el Big Data. Este término tan sexy ha tenido mucho éxito mediático, pero más que big el adjetivo que hay que usar es complex. El problema no es que haya muchos datos, sino que hay datos complejos. Y son datos complejos cuando, de una misma persona, si estamos hablando de ciudadanos para saber a quién votarían o dónde comprarían, vamos a tener una información que pueden ser características propias del individuo relativa a su sexo, a su edad, a su trabajo o a su nivel de estudios. Luego vamos a tener otras variables que son la evolución de su cuenta corriente en el banco: si tiene o no tiene un crédito o si tiene dos. Si tiene coche o no; si alquila un coche y cada cuánto lo alquila. Eso hace que los datos, aparte de ser muchos, sean datos complejos. El que sean muchos datos es un problema menor, siempre que haya personas con una formación estadística suficiente, porque si el Big Data se reduce a meter muchos números en una máquina muy gorda y sumarlo o hacer una operación aritmética más sencilla, podremos estar orgullosos de que hemos hecho una operación aritmética sencilla con muchos números, pero es difícil que de ahí podamos extraer un conocimiento útil. Para obtener un conocimiento útil tenemos que ser capaces de discernir lo que es la paja del grano y para eso hace falta un conocimiento de formalización matemática y estadística profundo. Con el conocimiento de todos los datos que hay, posiblemente sea razonable quedarse con un conjunto mucho más pequeño. El problema no está en el tamaño, lo crítico es la complejidad que tiene, la cantidad de información que se recibe de diversas fuentes que pueden venir afectadas de ruido, que hay muchas dependencias entre ellas y que son modelos que no han estado validados previamente, lo cual supone un desafío nuevo, ya que no puedo utilizar los modelos de siempre porque las circunstancias que se dan no son las de siempre. Y tenemos un ejemplo bien sencillo cuando estamos hablando en estos días de elecciones y de predicción de resultados electorales. ¿Por qué las empresas demoscópicas unas veces aciertan y otras veces fallan estrepitosamente? ¿Por qué unas veces son capaces de detectar que un determinado partido político se va a hundir y otras no? Pues sencillamente porque estamos en una situación de inestabilidad política tremenda en la que nada se parece a lo que ha ocurrido antes. Entonces, los modelos previos no sirven. Hay que construir un modelo nuevo. No se trata de entrevistar a muchas personas. No es un problema del big, de tener una muestra de mucha gente. Se trata de coger una muestra de gente suficiente para hacer el análisis. Tampoco puedes entrevistar a poca gente, pero al mismo tiempo hacer un análisis profundo donde intervengan muchas variables y se puedan sacar variables de distintas fuentes. También hay que estudiar la evolución temporal de los análisis que se están realizando para poder hacer predicciones fiables. Entonces, hay que estar creando modelos continuamente y como son modelos no validados pues ocurre que alguna vez aciertas y otras veces te estrellas.

“El término Big Data ha tenido mucho éxito mediático, pero más que big el adjetivo que hay que usar es complex”

P. ¿Crees que los líderes políticos han aprovechado este auge del Big Data para movilizar a la población?

R. Bueno, lo intentan cuando están dándonos mensajes personalizados. Yo he jugado con mi hijo, que es universitario, a contrastar la información que él recibía y que yo recibía del mismo partido político. A él le hablaban de becas Erasmus y a mí me hablaban de pensiones. Entonces, evidentemente están sacándole un partido bastante importante a la hora de mandar los mensajes adecuados o que ellos consideran adecuados a los potenciales votantes. Ahora bien, se les está olvidando otra vez el hecho de que hay que invertir y formar a la ciudadanía en Ciencia, en Análisis de Datos… que no tienen que convertirse en unos expertos o estadísticos que compitan con los colegas del CIO o del Instituto de Matemáticas de la Universidad de Sevilla, pero sí que sepan lo suficiente para que entiendan, cuando les hablan de un valor medio o cuando están agregando cifras, qué consecuencias tiene esa manera de presentar la información que les están dando.

P. Hoy en día, existen algoritmos que parece que saben más de nosotros que nosotros mismos. Incluso también se han creado chatbots con los que puedes mantener una conversación. ¿Cómo va a afectar esto en nuestra relación con las máquinas?

R. Todo lo estamos haciendo de una manera aparentemente muy natural. Ya no nos sorprende intentar hacer una reserva de un restaurante a través del móvil. Y no solo eso, sino estar hablando con un operador virtual que cada vez es más inteligente y cada vez es más difícil que no nos responda de forma adecuada. Evidentemente hay un proceso imparable porque entre otras cosas el sistema de libre mercado en el que nos encontramos es una oportunidad de negocio enorme para las grandes compañías. De todas formas, yo no sé hasta qué punto la ciudadanía es consciente de lo que ese cambio está suponiendo en particular para un país como España, con un sistema productivo como el que tenemos. Sin entrar personalmente en la valoración del conflicto que hay en el gremio del taxi y las WTC, no debemos perder de vista que el valor añadido en uno de los casos se lo están llevando, en parte, empresas que están ubicadas en California o fuera de aquí. Empresas que están tributando fuera y que aquí están simplemente haciendo un servicio, pero que los ingenieros, los científicos y la gente que está trabajando no están aquí, sino que están trabajando fuera de aquí. Entonces, de nuevo, la relación con las máquinas cada vez va a ser mucho más amigable porque hay un interés por parte de los que venden en que así sea. Por otro lado, las autoridades públicas deberían reflexionar si podemos permitirnos un sistema en el que todo esté automatizado y la relación con el sistema productivo se base en un sistema automatizado cuyo cordón umbilical pasa por Estados Unidos o por China y cuyo valor añadido de esa producción no se queda aquí, sino que está en otro sitio. Luego, cuando a mi hijo le tengan que pagar la Erasmus o a mí me tengan que pagar la pensión, se va a hacer con las cotizaciones y con la plusvalía que haya quedado aquí, no con la que se haya ido a China o a EEUU. Y no sé hasta qué punto los ciudadanos tienen conciencia de ese problema que, a mi modo de ver, es un problema muy preocupante y sobre el que no estoy escuchando a nuestras autoridades públicas ni a nuestros gobernantes hablar de inversión en ciencia.

“Para poder hacer un análisis sofisticado con las nuevas técnicas de ciencia de los datos uno no necesita grandes máquinas, lo que necesita es conocimiento y ahí es donde hay que poner una gran parte de la inversión”

P. ¿Cómo cree que cambiará el acceso a la tecnología del Big Data en los próximos años?

R. Creo que tiene que haber un punto de ruptura en algún momento, y este punto de ruptura tiene que estar relacionado con que, de alguna manera, tiene que haber una regulación por parte de las autoridades públicas. Y ahí confío en que la Unión Europea, que en algunas ocasiones se ha preocupado por proteger los derechos individuales de los ciudadanos, necesariamente tome medidas de esta manera. No es razonable que estemos monitorizados por empresas que no tienen su sede en la Unión Europea y que no acatan las leyes de la UE. Podemos decir que nosotros hemos dado el clic y hemos aceptado las condiciones por las que mi teléfono móvil puede estar grabando ahora mismo esta conversación, pero también acepta uno el timo del tocomocho cuando le dan billetes falsos y eso se llama estafa. Y al que cae en la estafa seguramente se queda sin indemnización, sin ningún resarcimiento, pero el estafador puede acabar en la cárcel. Yo no estoy hablando ahora mismo de estafa, pero sí estoy hablando de que hay un abuso por parte de los sectores de las nuevas tecnologías en cuanto a la cantidad de información que adquieren sobre nosotros. Es verdad que nosotros hemos dado el clic en aceptar y cuando encendemos el móvil o cuando entramos en determinadas páginas web estamos aceptando el uso de cookies que van a estar haciendo la traza y que, si yo intento buscar un hotel de Elche, durante el próximo mes me van a estar saliendo en mi ordenador publicidad de hoteles de Elche, de apartamentos en Elche y de restaurantes en Elche sin pedirlo. Ahí hay un abuso que del mismo modo está ocurriendo en todo lo relacionado con la protección de datos personales, y yo creo que eso debe tener una regulación normativa. Si entramos en sectores que se están automatizando de una manera brutal, como puede ser los coches sin conductor, vamos a tener pronto coches circulando sin conductor y voy a poder pagar a la compañía para que mi coche se salte los atascos y que, en caso de una posible colisión, si hay que sacrificar a alguien, no me sacrifiquen a mí y sacrifiquen al de enfrente porque pagó menos. Eso necesita una regulación. Necesariamente tiene que haber una regulación. Esa regulación simplemente hará que este horizonte, que vemos ahora trepidante, en el que cada vez más estamos más vinculados con la tecnología, tenga que adquirir necesariamente un matiz distinto. Quizás más rígido; quizás no tan espectacular como podría ser, pero bueno es recordar que en la investigación no vale todo. Si estamos hablando de investigación con animales, no vale todo. Hacen falta unos protocolos éticos. La medicina iría mucho más rápida si pudiéramos hacer pruebas con humanos, pero eso es éticamente inaceptable. Entonces, del mismo modo, la tecnología y nuestra relación con la tecnología podría ser mucho más potente. Hay cosas éticamente reprobables y estoy convencido de que tiene que haber un cambio que nos proteja de los múltiples inconvenientes que tiene el Big Data sin mermarnos en demasía de los muchos beneficios que tiene también.

P. Antes de finalizar, ¿le gustaría añadir algo más?

R. Pues simplemente recalcar cuál es el futuro que le espera a la Estadística y a la Investigación Operativa en España. Como he dicho antes, necesitamos que nuestras autoridades públicas se vean en la necesidad de que, igual que se invierte y es absolutamente necesario que se invierta en promover, por ejemplo, la incorporación de la mujer al mundo de las STEM, de la Ciencia y la Tecnología, la Ingeniería y las Matemáticas, igualmente es necesario que toda la ciudadanía tenga una relación más amable con las STEM. En particular, con las Matemáticas y con el Análisis de Datos porque de ello depende nuestra libertad.

 

 

¡No te pierdas el seminario que Emilio Carrizosa impartió en el CIO!