Número de créditos: 3,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 10/10/2019 - 15/03/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde
Contenido:
Introducción a la Ciencia del Dato y Big Data
Experimentación e Investigación. Reproducibilidad y documentación
Proyectos básicos de aplicación de técnicas de Ciencia del Dato y Big Data
Etapas de un proyecto
Prospectiva Tecnológica
Cuestiones éticas y legales asociadas a cada etapa de un proyecto
Legislación de protección de datos que afectan al proyecto en Data Science
Asignaturas del módulo:
Número de créditos: 6,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 28/03/2020 - 14/07/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Técnicas de anonimización. Aplicaciones a datos médicos
Calidad del dato
Metodologías para incrementar la calidad de la información
Enriquecimiento: Open Data, Linked Data, Semantic Linked Data, etc.
Aprendizaje relacional
Ciencia del Dato y empresa
Problemas empresariales y soluciones basadas en Data Science
Modelos de negocio basados en datos
Casos de estudio
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 11/10/2019 - 12/12/2019
Horario: Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Fundamentos de Python
Tipos de datos: números, cadenas, tuplas, listas, diccionarios, conjuntos
Definiciones por comprensión, estructuras de control, etc.
Definición de funciones
Gestión de errores
Arquitecturas y paradigmas para los datos (Introducción)
Tipos de datos: Estructurados y desestructurados
Obtención de datos
Almacenamiento y consulta (BDR)
Biblioteca estándar Python y Otras bibliotecas
Asignaturas del módulo:
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 11/10/2019 - 23/11/2019
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Fundamentos de Estadística
* Probabilidad e inferencia estadística
* Análisis Exploratorio de Datos
* Modelo de Regresión Lineal Múltiple
Entorno de programación estadística R
* Tipos de objetos.
* Elementos de Programación
* Gestión de datos
* Análisis exploratorio de datos: visualización.
Asignaturas del módulo:
Número de créditos: 6,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 28/11/2019 - 30/01/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Concepto básicos en Aprendizaje estadístico
* Modelo lineal generalizado.
* Modelos de Regresión no lineales
* Modelos de Regresión no paramétricos
* Regresión y clasificación mediante KNN
Asignaturas del módulo:
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 14/12/2019 - 11/01/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Introducción a los datos (estructurados y desestructurados)
* Introducción y repaso sobre obtención de datos (APIs, RDF, logs, transacciones, textos, etc.)
* Tratamiento y limpieza de datos: Expresiones regulares, Herramientas ETL
* Almacenamiento: BD relacionales versus BD NoSQL.
* Bases de datos NoSQL
* Procesamiento en paralelo y escalabilidad
* Introducción a los ecosistemas Big Data
Asignaturas del módulo:
Número de créditos: 5,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 25/04/2020 - 31/05/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Introducción a los ecosistemas Big Data
* Almacenamiento y procesamiento distribuido
* El ecosistema Hadoop
* Spark
* Integración con R y Python.
Asignaturas del módulo:
Número de créditos: 5,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 01/02/2020 - 14/03/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Técnicas de Reducción de la dimensionalidad
* Análisis de Conglomerados
* Técnicas de clasificación probabilística
* Support Vector Machines (SVM)
* Árboles de clasificación y regresión
Asignaturas del módulo:
Número de créditos: 5,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 15/03/2020 - 03/05/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Redes neuronales
* Sistemas de ranking
* Técnicas de combinación de modelos.
* Herramientas estadísticas para la Bioinformática
* Selección de atributos
Asignaturas del módulo:
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 06/06/2020 - 13/07/2020
Horario: Martes en horario de tarde, Miércoles en horario de tarde
Contenido:
Métodos de soluciones individuales
Métodos basados en poblaciones
Redes convolucionales
Redes recurrentes
Asignaturas del módulo:
Número de créditos: 3,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 18/01/2020 - 06/02/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Inteligencia Colectiva y flujos de datos
** Web Social
** Social Media
** Metodologías ''crowd''
* Redes: Conceptos, topología y comportamiento extremal
** Propagación
** Resiliencia en redes
** Computación bajo reputación y confianza
* Análisis de la semántica emergente: Análisis de opinión y sentimientos
* Sistemas de recomendación (Item based, User Based)
* Aplicaciones
Asignaturas del módulo:
Número de créditos: 3,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 16/05/2020 - 05/06/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
* Técnicas básicas
* Modelos ARIMA
* Modelos de series temporales no lineales: ARCH-GARCH
* Análisis espectral
* Georeferenciación estadística
* Técnicas de predicción espacial
Asignaturas del módulo:
Número de créditos: 3,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 18/06/2020 - 12/07/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Introducción a la inteligencia de negocio
Aplicaciones
Data Smart y Data warehouse
Bases de datos OLAP, OLTP
Plataformas de inteligencia de negocio
Herramientas de minería de datos integradas en las plataformas
Uso de herramientas de BI
Diseño de cuadro de mandos
Asignaturas del módulo:
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 07/02/2020 - 03/04/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Módulo I: Fundamentos del Procesamiento del Lenguaje Natural
Introducción: de la Lingüística Computacional a la Ingeniería del Lenguaje Natural
Niveles y técnicas para el estudio y tratamiento automático de los lenguajes naturales
Nociones y técnicas básicas: Expresiones regulares, Autómatas y Gramáticas
Recursos lingüísticos
Módulo II: Lenguaje natural, datos y conocimiento
Reconocimiento automático de la voz: Redes neuronales y otras tecnologías aplicadas al nivel acústico. Análisis del entrenamiento, adaptación y evaluación.
Análisis léxico-morfológico: corpus lingüísticos y técnicas relacionadas con la ciencia del dato. Corrección ortográfica, lematización, tokenización.
Análisis gramatical: sintaxis y semántica. Modelos basados en conocimiento y modelos estadísticos.
Gestión del diálogo: Autómatas. Sistemas basados en agentes. El enfoque basado en el estado de información. Las técnicas POMDP (procesos de decisión de Markov parcialmente observables) como soporte al aprendizaje automático en gestión del diálogo.
Traducción automática: Técnicas y enfoques. Paradigmas basados en reglas, basados en corpus y enfoques híbridos.
Aplicaciones comerciales e industriales: Speech Analytics, Content Analytics, Text Mining, Information Retrieval and Extraction, Question Answering, Sentiment Analysis, Entity Names Recognition, etc.
NLTK: Librería Python para lenguaje natural
Manipulación de corpus
Normalización de textos: segmentación, tokenización, lematización.
Tagging
Clasificación de textos
Parsing
Análisis semántico: gramáticas de estructuras de rasgos
Representación del conocimiento
StanfordCore NLP
Sistema de reconocimiento de entidades
Tagging
Classifier
Information Extraction
Estudio de aplicaciones comerciales e industriales
Ejemplos como Watson Analytics y otras plataformas que integran Big Data y sistemas basados en lenguaje natural en distintas áreas
Asignaturas del módulo:
Número de créditos: 2,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 22/02/2020 - 13/03/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Herramientas, librerías y metodologías para la visualización de datos
Asignaturas del módulo:
Número de créditos: 2,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 03/06/2020 - 14/06/2020
Horario: Miércoles en horario de tarde, Jueves en horario de tarde, Viernes en horario de tarde
Contenido:
Arquitectura de la visualización de la Información
Estructura visual: diseño e implementación
Infografías y economía visual
Presentación de informes y Reports
Asignaturas del módulo:
Número de créditos: 6,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 01/03/2020 - 14/10/2020
Contenido:
Desarrollo del Trabajo fin de Máster, orientado a la aplicación de los conocimientos y competencias adquiridas en los restantes módulos. Los tutores serán tanto académicos como empresariales.
Asignaturas del módulo: