Saltar al contenido principal
- -

Recuperación y extracción de información, grafos y redes sociales
Course is full

En este curso estudiaremos las técnicas y métodos que se emplean para el procesamiento de información no estructurada (textos) y de datos enlazados (grafos, linked data), haciendo un énfasis especial en el análisis de redes y medios sociales.

Descripción del curso

En la actualidad disponemos de cantidades ingentes de información disponible online generada por cientos de millones de personas, en la mayoría de los casos usuarios no especializados, que disponen de una gran diversidad de medios para producirla de forma sencilla. Como consecuencia, la web y los medios sociales se han convertido en un terreno habitual para el procesamiento de información (textual, enlazada y multimedia), que proporciona grandes oportunidades de investigación y desarrollo gracias a la Ciencia de Datos.

En esta asignatura se persigue el procesamiento y fusión eficiente de este tipo de información no estructurada, abordando las técnicas de extracción y representación de información a partir de ella, para poder aplicar posteriormente procesos de Ciencia de Datos relacionados con el análisis de textos, la recuperación de información y las redes sociales. En el caso de los textos se abordará el uso de técnicas y métodos de procesamiento de información textual y minería de información web en distintas aplicaciones como recuperación de información textual, minería de textos, análisis de sentimientos, clasificación y agrupamiento de documentos, etc. En el caso de las redes sociales, se estudiarán métodos de análisis de su estructura para poder determinar aspectos como la importancia/influencia de cada usuario a nivel individual y el descubrimiento de grupos cohesivos (comunidades) o patrones representativos, así como técnicas de modelado y control de los procesos de difusión de información sobre ellas.

Prerrequisitos

No se necesitan requisitos especiales para cursar la asignatura. Se recomiendan conocimientos básicos de informática y de matemáticas.

Temario

  1. Análisis de Redes Sociales
    • Introducción a la Web 2.0 y al Análisis de Medios Sociales. Introducción a las Redes Complejas. Aplicaciones. Aspectos Básicos y Propiedades Estructurales de las Redes Complejas. Aspectos Básicos del Análisis de Redes Sociales. Medidas de Centralidad. Ejemplos de Aplicación.
  2. Detección de Comunidades
    • Estructura de Comunidades. Justificación de la Necesidad de Detección. Métodos de Detección de Comunidades. Ejemplos de Aplicación.
  3. Difusión de Información en Redes Sociales
    • Procesos Epidémicos y de Difusión. Modelos Clásicos de Propagación de Epidemias. Modelos de Difusión de Información en Redes. Ejemplos de Aplicación.
  4. Recuperación de Información
    • Introducción. Procesado e indexación de documentos. Modelos de Recuperación de Información. Evaluación de la recuperación. Recuperación de información en la Web. Motores de búsqueda de código abierto. Técnicas avanzadas de RI.
  5. Minería de Texto y Análisis de Sentimientos
    • Introducción. Minería de textos. Minería de datos en la Web (Minería de contenidos. Minería de opiniones y análisis de sentimientos. Minería de la estructura de la Web. Minería de uso de la Web).
  6. Clustering de Documentos
    • Introducción al agrupamiento documental. Aplicaciones del agrupamiento. La base: "The cluster hypothesis". Componentes del proceso de agrupamiento.

Bibliografía

Zafarani, R., Ali Abbasi, M., Liu, H., Social Media Mining. An Introduction. Cambridge University Press 2014. ISBN 978-1107018853.

Wasserman, S., Faust, K. Social Network Analysis. Methods and Applications. Cambridge University Press 1994. ISBN 978-0521387071.

Cacheda, F., Fernández-Luna, J.M. y Huete, J. Recuperación de Información: Un enfoque práctico y multidisciplinar. Ed. Rama 2011. ISBN: 849-9641121.

Bing Liu, Sentiment Analysis: mining opinions, sentiments, and emotions. Cambridge University Press, 2015. ISBN 978-1107017894.

Profesorado

Foto Oscar Cordón

Oscar Cordón

Es Licenciado (1994) y Doctor (1997) en Informática por la Universidad de Granada, donde es Catedrático en el Dpto. de Ciencias de la Computación e Inteligencia Artificial. Participó en la creación de su Centro de Enseñanzas Virtuales y en la actualidad es Delegado de la Rectora (Vicerrector) para la Universidad Digital. Fue investigador principal del European Centre for Soft Computing entre 2006 y 2011, y luego Investigador Afiliado Distinguido hasta 2015. Es Premio IEEE Computational Intelligence Society Outstanding Early Career Award en 2011, en su primera edición, y Premio Nacional de Informática ARITMEL de la Sociedad Científica Española en 2014. Ha realizado más de 330 publicaciones científicas (incluyendo 90 artículos indizados en el JCR-SCI, 47 en Q1), dirigido 16 tesis doctorales, coordinado 26 proyectos y contratos de investigación (con un presupuesto global de 6.7M€), y es o ha sido Editor Asociado de 15 revistas internacionales. También está incluido en el 1% de los investigadores más citados en el mundo (fuente: Thomson Reuters's WoK, h index=28).

Foto Juan Manuel Fernández

Juan Manuel Fernández Luna

Es profesor titular de universidad del Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada. Ha investigado en temas relacionados con la Recuperación de Información (recuperación basada en modelos gráficos probabilísticos, recuperación XML y personalización) y los Sistemas de Recomendación (recomendadores basados en filtrado colaborativos y de contenido, explicación, recomendación a grupos). Actualmente centra su investigación en recomendación de diputados y filtrado de documentos a los mismos.

MOOC es el acrónimo en inglés de Massive Online Open Course (que puede traducirse como Curso masivo abierto online).

Las siglas MOOC se utilizan para referirse a una iniciativa que comenzó en 2011 con un curso de Introducción a la Inteligencia artificial de la Universidad de Stanford en el que se inscribieron 160.000 estudiantes de 190 países, y que se ha convertido ya en un movimiento global al que se han incorporado las mejores universidades del mundo con la creación de diversas plataformas MOOC y miles de cursos que comparten un objetivo: proporcionar acceso gratuito a una formación superior de calidad a cualquiera que tenga una conexión a internet.

Los MOOCs están basados en la integración de tecnologías que existen desde hace tiempo en Internet: el vídeo en red, la evaluación automática a distancia y los foros de preguntas y respuestas en la web. Pero es ahora cuando los usuarios se han acostumbrado a usar el vídeo en red y las redes sociales en su día a día en Internet, lo que facilita que se creen comunidades de alumnos situados en cualquier parte del mundo que comparten conocimientos y experiencias y se ayudan en el proceso de aprendizaje, dándole a la formación online un nuevo enfoque colaborativo. Esto, unido a la disponibilidad de acceso a los cursos MOOC en cualquier momento y desde cualquier lugar en donde se tenga acceso a Internet, ha permitido crear una nueva comunidad global de estudiantes.

Los MOOCs de UPV[X] están diseñados para ayudarte a aprender trabajando a tu ritmo de forma independiente y proporcionarte el apoyo de la comunidad de aprendizaje si te hace falta.

Para ello los MOOCs están estructurados en módulos que suelen corresponder a una semana de trabajo (aunque no siempre es así). Los módulos se estructuran en lecciones con un vídeo, que dura normalmente entre 3 y 10 minutos, y una pregunta de refuerzo al final para ayudarte a fijar su contenido. Las lecciones están orientadas a tratar un concepto (o un número reducido de ellos) de forma que sean lo más atómicas que sea posible.

Los cursos MOOC de UPV[X] pueden tener distintos esquemas de evaluación, pero lo habitual es que al terminar cada módulo haya un examen (normalmente tipo test) que te permitirá comprobar tu evolución y fijar los conocimientos, y que cuenta en cierto porcentaje para la evaluación final. Con ello tendrás una realimentación frecuente de tu progreso que te permitirá ir mejorar tu proceso de aprendizaje.

Al acabar el MOOC habrá a un examen final para evaluar si has alcanzado los objetivos de aprendizaje que contará en un porcentaje mayor para la evaluación final.

En los MOOC también hay un foro de debate moderado por el equipo del curso donde los alumnos pueden consultar sus dudas sobre el contenido del curso y comentar aquellas cosas que les parezcan interesantes. El acceso a una comunidad online de internautas con tus mismos intereses y que están aprendiendo a la vez enriquece la experiencia del curso.

Esperamos sinceramente que disfrutes de nuestros MOOCs y aprendas con nosotros