BIG DATA: PREPROCESAMIENTO DE DATOS

Contacto

Lugar: CAMPUS DE ELCHE: LABORATORIO DE COMPUTACIÓN DEL INSTITUTO UNIVERSITARIO DE INVESTIGACIÓN CIO.

Teléfono de contacto: +34 966658572

E-mail: mttormo@umh.es

Web: http://cio.umh.es

Precio de matrícula

  • ORDINARIA: 100 euros

Administrativo/a

Plan de Estudios

Justificación académica

En el tratamiento de datos masivos, antes de intentar sacar cualquier tipo de información de ellos, es absolutamente imprescindible, realizar un buen preprocesamiento. Esta fase es absolutamente crítica.

Objetivos del curso

Adquirir conocimientos y habilidades operativas sobre: formatos de archivos, csv. detección de outiliers; completado de nulos y discretización.

Estructura de los estudios

Se abordarán los siguientes temas:
   1. Software libre para el tratamiento de datos. Descarga e instalación.
   2. Introducción al software R, RStudio y WEKA como herramientas multipropósito.
   3. R como lenguaje de programación para el manejo de datos.
   4. Lectura de diversas fuentes de datos.
   5. Detección de outliers.
   6. Detección y tratamiento de nulos/vacios.
   7. Discretización de datos.
   8. Graficado como herramienta de previsualización.

Uso de instalaciones y programación temporal

El curso se compone de 20 horas, 8 horas presenciales y 12 horas no presenciales. 
Las 8 horas presenciales corresponden a 2 sesiones de 4 horas, se impartirán en el Laboratorio de Computación del CIO. En las sesiones on-line la metodología a seguir consistirá en colgar videos y materiales además de ejercicios de evaluación. Las dudas y cuestiones del alumnado se resolverán por correo electrónico o mediante un foro en un blog.
Sesión 1 (on-line): Introducción a analítica en Redes Sociales. Agustín Pérez Martín (4h).
Sesión 2 (presencial): 03/07/2019, de 16 a 20 horas. Laboratorio de Computación del CIO. R y RStudio, dos herramientas con un lenguaje y entorno de programación para el manejo de datos. Agustín Pérez Martín(4h).
Sesión 3 (on-line): Leyendo diversas fuentes de datos detectando disparates. Agustín Pérez Martín (4h).
Sesión 4 (on-line): Weka y el preprocesado. Alejandro Rabasa Dolado (4h).
Sesión 5 (presencial): 17/07/2019, de 16 a 20 horas. Laboratorio de Computación del CIO. Un proceso completo con ayuda del graficado. Evaluación de trabajos. Agustín Pérez Martín (4h).

Requisitos de acceso

Conocimientos básicos de informática y estadística.

Procedimiento de Evaluación

Evaluación continua mediante la entrega de trabajos prácticos.

Profesorado

  • RABASA DOLADO, ALEJANDRO
  • PÉREZ MARTÍN, AGUSTÍN

Enlaces de interés general

Información del curso

Centro docente: Instituto Centro de Investigación Operativa

Rama de enseñanza: INGENIERÍA Y ARQUITECTURA

Preinscripción: 01/09/18 a 24/06/19

Matriculación: 17/06/19 a 24/06/19

Duración: 1/07/19 a 17/07/19

Horas: 20

Máximo alumnos: 25

Mínimo alumnos: 20