Saltar al contenido principal
- -

Métodos no supervisados y detección de anomalías
Course is full

Un objetivo primordial en Ciencia de Datos es el análisis de conjuntos de datos y la extracción de patrones de interés. Dependiendo de las técnicas utilizadas se pueden extraer distintos tipos de información. Por ejemplo, aplicando procesos de clustering se agrupan registros de datos, las reglas de asociación buscan dependencias entre distintas características de los datos, mientras que las técnicas de detección de anomalías permiten detectar registros poco usuales. En este curso se analizarán las técnicas más relevantes en cada una de estas áreas.

About This Course

Un objetivo primordial en Ciencia de Datos es el análisis de conjuntos de datos y la extracción de patrones de interés. Dependiendo de las técnicas utilizadas se pueden extraer distintos tipos de información. Por ejemplo, aplicando procesos de clustering se agrupan registros de datos, las reglas de asociación buscan dependencias entre distintas características de los datos, mientras que las técnicas de detección de anomalías permiten detectar registros poco usuales. En este curso se analizarán las técnicas más relevantes en cada una de estas áreas.

En el apartado de Anomalías se verán técnicas de detección de valores anómalos no supervisadas, semi supervisadas y no supervisadas. Se usará R para ilustrar de forma práctica los métodos introducidos en el curso.

Unidades

  • Clustering
  • Reglas de asociación

  • Detección de anomalías

    • Métodos supervisados
    • Métodos semi supervisados
    • Métodos no supervisados

Bibliografía

Varun Chandola, Arindam Banerjee, and Vipin Kumar. 2009. Anomaly detection: A survey. ACM Comput. Surv. 41, 3, Article 15 (July 2009)

Pang-Ning Tan, Michael Steinbach, and Vipin Kumar. 2005. Introduction to Data Mining, (First Edition). Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.

Charu C. Aggarwal. 2013. Outlier Analysis. Springer Publishing Company, Incorporated. http://charuaggarwal.net/outlierbook.pdf

Jiawei Han. 2012. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA; Third edition.

Vic Barnett , Toby Lewis , 1994. Outliers in Statistical Data. Wiley; Third edition.

Requirements

Haber cursado A3 Ciencia de Datos y aprendizaje automáticos. Conocimientos de R

Course Staff

Course Staff Image #1

Juan Carlos Cubero

Juan-Carlos Cubero es catedrático de Ciencias de la Computación e Inteligencia Artificial en la Universidad de Granada, institución en la que se doctoró en Matemáticas en 1994. Actualmente imparte docencia en los ámbitos de la programación de ordenadores y la ciencia de datos. Su labor investigadora se ha desarrollado en los campos de las bases de datos y la minería de datos.

Course Staff Image #2

Sebastián Ventura

Sebastián Ventura es Catedrático de Ciencia de la Computación e Inteligencia Artificial de la Universidad de Córdoba. Su labor docente se centra en las titulaciones de graduado en ingeniería informática y ciencias físicas impartiendo materias tales como programación, inteligencia artificial y metaheurísticas. También imparte distintas materias en los másteres de informática y física aplicada de la Universidad de Córdoba. Su labor investigadora se desarrolla en el grupo de investigación "Knowledge Discovery and Intelligent Systems" (KDIS), y está centrada en aprendizaje automático, minería de datos, ciencia de datos, inteligencia computacional y sus aplicaciones.

Frequently Asked Questions

What web browser should I use?

The Open edX platform works best with current versions of Chrome, Firefox or Safari, or with Internet Explorer version 9 and above.

See our list of supported browsers for the most up-to-date information.

MOOC es el acrónimo en inglés de Massive Online Open Course (que puede traducirse como Curso masivo abierto online).

Las siglas MOOC se utilizan para referirse a una iniciativa que comenzó en 2011 con un curso de Introducción a la Inteligencia artificial de la Universidad de Stanford en el que se inscribieron 160.000 estudiantes de 190 países, y que se ha convertido ya en un movimiento global al que se han incorporado las mejores universidades del mundo con la creación de diversas plataformas MOOC y miles de cursos que comparten un objetivo: proporcionar acceso gratuito a una formación superior de calidad a cualquiera que tenga una conexión a internet.

Los MOOCs están basados en la integración de tecnologías que existen desde hace tiempo en Internet: el vídeo en red, la evaluación automática a distancia y los foros de preguntas y respuestas en la web. Pero es ahora cuando los usuarios se han acostumbrado a usar el vídeo en red y las redes sociales en su día a día en Internet, lo que facilita que se creen comunidades de alumnos situados en cualquier parte del mundo que comparten conocimientos y experiencias y se ayudan en el proceso de aprendizaje, dándole a la formación online un nuevo enfoque colaborativo. Esto, unido a la disponibilidad de acceso a los cursos MOOC en cualquier momento y desde cualquier lugar en donde se tenga acceso a Internet, ha permitido crear una nueva comunidad global de estudiantes.

Los MOOCs de UPV[X] están diseñados para ayudarte a aprender trabajando a tu ritmo de forma independiente y proporcionarte el apoyo de la comunidad de aprendizaje si te hace falta.

Para ello los MOOCs están estructurados en módulos que suelen corresponder a una semana de trabajo (aunque no siempre es así). Los módulos se estructuran en lecciones con un vídeo, que dura normalmente entre 3 y 10 minutos, y una pregunta de refuerzo al final para ayudarte a fijar su contenido. Las lecciones están orientadas a tratar un concepto (o un número reducido de ellos) de forma que sean lo más atómicas que sea posible.

Los cursos MOOC de UPV[X] pueden tener distintos esquemas de evaluación, pero lo habitual es que al terminar cada módulo haya un examen (normalmente tipo test) que te permitirá comprobar tu evolución y fijar los conocimientos, y que cuenta en cierto porcentaje para la evaluación final. Con ello tendrás una realimentación frecuente de tu progreso que te permitirá ir mejorar tu proceso de aprendizaje.

Al acabar el MOOC habrá a un examen final para evaluar si has alcanzado los objetivos de aprendizaje que contará en un porcentaje mayor para la evaluación final.

En los MOOC también hay un foro de debate moderado por el equipo del curso donde los alumnos pueden consultar sus dudas sobre el contenido del curso y comentar aquellas cosas que les parezcan interesantes. El acceso a una comunidad online de internautas con tus mismos intereses y que están aprendiendo a la vez enriquece la experiencia del curso.

Esperamos sinceramente que disfrutes de nuestros MOOCs y aprendas con nosotros