Duración
5 semanas
Acerca de este curso
El aprendizaje automático es una habilidad que toma cada vez más relevancia debido al gran número de datos (big data), los cuales deben de ser analizados para tomar decisiones.
En este curso en línea aprenderás los conceptos básicos del aprendizaje automático (machine learning) y la ciencia de datos. En particular, aprenderás las técnicas necesarias para evaluar el rendimiento de los algoritmos y de los modelos obtenidos. También aprenderás como preprocesar los datos para obtener así modelos de mayor calidad (simples, comprensibles, eficientes, etc.). Por último, en este curso de análisis de datos aprenderás a poner en funcionamiento las técnicas estudiadas mediante un ejemplo práctico programando tus propios scripts y algoritmos en R.
Que aprenderé
Reconocer el valor de los datos en las organizaciones y las posibilidades de negocio que plantea su explotación para el desarrollo de productos basados en datos (inteligencia de negocios)
Utilizar técnicas de aprendizaje automático, entre otras, para extraer modelos descriptivos y predictivos a partir de los datos, así como saber evaluarlos correctamente
Conocer y utilizar las herramientas básicas de integración y preparación de datos, incluyendo visualización de datos, para facilitar la comprensión y el análisis de los datos
Aprender a utilizar un lenguaje de programación de análisis de datos (lenguaje R) y las librerías básicas de visualización y algunas de las que permiten generar modelos de aprendizaje automático.
Prerrequisitos
El alumno ha de tener unos conocimientos básicos de programación, sin ningún lenguaje de programación en particular. Debe conocer lo que son vectores y matrices, a nivel muy básico. Es conveniente que conozca los indicadores estadísticos básicos (media, desviación típica, mediana, cuantiles, etc.), concepto de muestreo y nociones muy básicas (ofimáticas) con hojas de cálculo y tablas de datos.
Unidades
- Presentación
- Módulo 1: Introducción a la minería de datos y ciencia de datos
- R: Introducción
- Módulo 2: Técnicas de validación y evaluación
- R: Evaluación
- Módulo 3: Algoritmos básicos de aprendizaje automático
- Módulo 4: Preprocesamiento de datos
- R: Preparación y Visualización
- Weka - herramienta de minería de datos
- TRABAJO: Kaggle
Profesores del curso
José Hernández-Orallo
José Hernández Orallo es catedrático de universidad en la Universitat Politècnica de València (UPV). Cursó estudios de Informática por la UPV, parcialmente en la École Nationale Supérieure de l'Électronique et de ses Applications (France) y es doctor en lógica por la Universidad de Valencia con premio extraordinario de doctorado, incorporándose al Departamento de Sistemas Informáticos y Computación de la UPV en 1996. Desde el año 2000 es miembro del equipo DMIP (Data Mining, Machine Intelligence and Inductive Programming), con líneas de investigación en aprendizaje automático, inteligencia artificial, minería de datos, programación lógica (y funcional) inductiva y evaluación del aprendizaje.
María José Ramírez Quintana
María José Ramírez Quintana es profesora Titular de Universidad del Área de Lenguajes y Sistemas Informáticos. Cursó los estudios de Licenciatura en Ciencias Físicas en la Universidad de Valencia (1985) y es Doctora en Informática por la Universidad Politécnica de Valencia (1993). Es miembro del grupo de investigación "Extensions of Logic Programming" (ELP) en la UPV desde su creación en 1989. Desde el año 2000 desarrolla su actividad investigadora en el equipo de "Data Mining, Machine Intelligence and Inductive Programming (DMIP)" perteneciente al grupo ELP. Su investigación se centra en la programación lógica y funcional inductiva, la evaluación de modelos como soporte para la toma de decisiones, la clasificación multiclase y jerárquica, la cuantificación para problemas de regresión y clasificación, los métodos basados en distancia, la calibración de modelos, la adaptación de modelos a cambios de contexto y el análisis de propiedades de los modelos (confidencialidad, confianza y comprensibilidad).
Fernando Martínez Plumed
Fernando Martínez Plumed es investigador postdoctoral en el Departamento de Sistemas Informáticos y Computación (DSIC) de la Universidad Politécnica de Valencia (UPV). Posee los títulos de Ingeniero Informático (2009), Máster en Ingeniería de Software, Métodos Formales y Sistemas de Información (2010) y Diploma de postgrado en Dirección de Empresas para Ingenieros (2011) por la UPV. Es Doctor en Informática por la UPV (2016) y su tesis aborda la creación de sistemas de IA de propósito general, así como el análisis y evaluación tanto de su desarrollo como de sus capacidades cognitivas, obteniendo ésta la calificación de sobresaliente Cum Laude.