PROCESAMIENTO Y VISUALIZACIÓN DE DATOS

CURSOSTRIPTICOI_pages-to-jpg-0001

CURSOSTRIPTICOI_pages-to-jpg-0002

Descripción de la Actividad de Formación Continua:

  • Nombre del curso: Ciencia de datos: Procesamiento y visualización de datos
  • Tipo: Perfeccionamiento
  • Duración en horas: 40
  • Área de conocimiento: Estadística e Investigación Operativa
  • Rama de conocimiento: Ciencias
  • Nombre de la directora: Lidia Ortiz Henarejos
  • Nombre de la administrativa: María Teresa Tormo Muñoz
  • Teléfono de contacto: 966 658 572
  • Correo electrónico de contacto: mttormo@umh.es
  • Modalidad: A distancia
  • Porcentaje sobre el total de horas de la Actividad de Formación Continua: 50% Tutorización virtual – 50% Elaboración material docente virtual – 0% Presencialidad
  • Lugar de impartición: Instituto Centro de Investigación Operativa
  • Plataforma educativa: Adobe Connect y http://cio.umh.es
  • Fechas de inicio y fin de impartición: Del 04/11/2019 al 13/12/2019
  • Número mínimo de estudiantes: 20

Información general:

Vivimos en un universo de datos, donde la sociedad y las empresas demandan perfiles analíticos que sean capaces de optimizar los recursos de los que disponen.

En el tratamiento de datos masivos, antes de intentar sacar cualquier tipo de información de ellos, es absolutamente imprescindible, realizar un buen preprocesamiento. Esta fase es absolutamente crítica.

Por otra parte, la visualización de los datos implica un entendimiento y análisis de las diversas fuentes de datos de donde provienen y se hace indispensable en la toma de decisiones.

El programa analítico Tableau nos ayuda a recopilar diferentes bases de datos y realizar un estudio descriptivo de los mismos a través de gráficos interactivos.

R es un asentado software estadístico utilizado en el mundo académico y profesional, con el cual profundizaremos en el análisis descriptivo de los datos mediante programación y haremos uso de la librería R Shiny, que nos permitirá desarrollar dashboards y apps web.

Por último, introduciremos el software de visualización de datos de Microsoft, Powerbi.

Objetivos generales:

El curso cuenta con dos módulos:

Módulo 1: Preprocesamiento

  • Duración: 20 horas
  • Fecha de impartición: Del 04/11/2019 al 22/11/2019
  • Información: Mediante el Módulo de Preprocesamiento se adquirirán conocimientos y habilidades operativas sobre formatos de archivos, csv. detección de outiliers; completado de nulos y discretización.

Módulo 2: Visualización

  • Duración: 20 horas
  • Fecha de impartición: Del 29/11/2019 al 13/12/2019
  • Información: En el segundo módulo, dedicado a Visualización, se proporcionarán conocimientos básicos sobre cómo crear y compartir visualizaciones en Tableau, Powerbi y R.

Programación temporal:

El curso se compone de 40 horas de carácter no presencial: las primeras 20 horas corresponden a los contenidos del Módulo 1. Preprocesamiento, y otras 20 horas correspondientes a la materia del Módulo 2. Visualización. A lo largo del curso se realizarán diversas sesiones a través de la plataforma Adobe Connect para impartir los contenidos del curso así como para interactuar con los alumnos. El profesorado responderá a las cuestiones o preguntas de los alumnos a través de la plataforma Adobe Connect y mediante el correo electrónico, también se podrá hacer uso de la herramienta Hangouts para tener tutorías más personalizadas o mediante un foro en un blog. 

MÓDULO 1:  PREPROCESAMIENTO

En este primer módulo, se abordarán los siguientes temas:

  1. Software libre para el tratamiento de datos. Descarga e instalación.
  2. Introducción al software R, RStudio y WEKA como herramientas multipropósito.
  3. R como lenguaje de programación para el manejo de datos.
  4. Lectura de diversas fuentes de datos.
  5. Detección de outliers.
  6. Detección y tratamiento de nulos/vacíos.
  7. Discretización de datos.
  8. Graficado como herramienta de previsualización.

Sesión 1 (Adobe Connect): 4/11/2019. (4h) Prof. Agustín Pérez Martín.

R y RStudio, dos herramientas con un lenguaje y entorno de programación para el manejo de datos.

Sesión 2 (Adobe Connect): 7/11/2019. (4h) Prof. Agustín Pérez Martín.

Leyendo diversas fuentes de datos detectando disparates.

Sesión 3 (Adobe Connect): 11/11/2019. (4h) Prof. Alejandro Rabasa Dolado.

Weka y el preprocesado.

Sesión 4 (Adobe Connect): 14/11/2019. (4h) Prof. Agustín Pérez Martín y Profa. Miriam Esteve.

Introducción a la analítica en Redes.

Sesión 5 (Adobe Connect): 22/11/2019. (4h) Prof. Agustín Pérez Martín.

Un proceso completo con ayuda del graficado. Evaluación de trabajos.

 

MÓDULO 2: VISUALIZACIÓN DE DATOS (20 horas). Del 29/11/2019 al 13/12/2019.

Sesión 1 (Adobe Connect): 29/11/2019. (4h) Prof. Juan José García Milla.

Presentación del módulo 2 mediante la plataforma Adobe Connect. En esta sesión se concretarán las sesiones que se van a realizar durante este módulo, también se especificarán los materiales a utilizar y la forma de entrega de los ejercicios propuestos. En concreto, en esta primera sesión se impartirán los siguientes contenidos:

  1. La importancia de una buena visualización de datos
  2. ¿Qué es Tableau?
  3. Instalación del software
  4. Entendimiento del interfaz de Tableau: componentes, elementos de los datos, terminología
  5. Conexiones a bancos de datos en Tableau
  6. Construcción de vistas básicas tablas y visualizaciones en Tableau
  7. ¿Qué es Powerbi?
  8. Instalación del software
  9. Entendimiento del interfaz de Powerbi
  10. Comandos básicos de análisis descriptivo
  11. Ejercicio práctico 1

Sesión 2 (Adobe Connect): (4h) Prof. Juan José García Milla.

  1. Tableau 1:
  2. Filtros, ordenación y agrupación de los datos
  3. Formato de las hojas
  4. Trabajar con horas y fechas
  5. Construcción de mapas
  6. Creación de campos calculados básicos incluyendo manipulación de strings, cálculos aritméticos y table calculations
  7. Combinación de diferentes hojas para la creación de dashboards
  8. Ejercicio práctico 2

Sesión 3 (Adobe Connect): (4h)Prof. Juan José García Milla.

  1. Tableau 2:
  2. Formatación de dashboards
  3. Introducción a LOD
  4. Pestaña Analytics: bandas de distribución Líneas de tendencia, cluster, pronóstico
  5. Powerbi 1:
  6. Cómo leer datos en Powerbi
  7. Gráficos y descriptivos
  8. Tipos de variables
  9. Campos calculados
  10. Ejercicio práctico 3

Sesión 4 (Adobe Connect): (4h) Prof. Juan José García Milla.

  1. Paquetes específicos de analítica descriptiva
  2. Introducción a Rshiny
  3. Definición de funciones
  4. Desarrollo de reports y Dashboards con RShiny
  5. Compartir la aplicación con shinyapps.io

Sesión 5 (Adobe Connect): (4h) Prof. Juan José García Milla.

  1. Desarrollo trabajo final del Módulo 2. Visualización de Datos

Inscríbete

Acceso y admisión:

Es aconsejable tener conocimientos de informática, así como haber realizado el curso básico de introducción a RStudio propuesto en el blog del Instituto CIO (http://cio.umh.es).

Sistema de evaluación y fecha de evaluación:

Evaluación continua mediante la entrega de trabajos prácticos.

Precio matrícula:

  • Ordinaria: 204,80€
  • PAS UMH: 154,80€
  • PDI UMH: 154,80€
  • Alumni UMH: 154,80€
  • Estudiantes UMH: 154,80€


Envíanos tu consulta y nos podremos en contacto contigo:

NOMBRE*

EMAIL*

TIPO DE CONSULTA*

CURSO*

CUÉNTANOS MÁS DETALLES DE TU CONSULTA*

* He leído y acepto la política de privacidad y protección de datos.

 Deseo recibir por correo electrónico novedades y futuras comunicaciones relacionadas con el CIO.

La finalidad de los datos facilitados en este formulario es contactar con el usuario dándole respuesta a la información solicitada. Puede acceder a más información sobre política de privacidad y protección de datos en el siguiente enlace.