Módulos/Asignaturas del Curso

Módulo/Asignatura 1. Diseño y Gestión de Proyectos en Data Science

Número de créditos: 6,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 17/10/2023 - 07/06/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

*Experimentación e Investigación. Reproducibilidad y documentación
*Proyectos básicos de aplicación de técnicas de Ciencia del Dato y Big Data
*Etapas de un proyecto Prospectiva Tecnológica
*Cuestiones éticas y legales asociadas a cada etapa de un proyecto *Legislación de protección de datos que afectan al proyecto en Data Science
*Técnicas de anonimización. Aplicaciones a datos médicos
*Calidad del dato
*Metodologías para incrementar la calidad de la información Enriquecimiento: **Open Data, Linked Data, Semantic Linked Data, etc. Aprendizaje relacional
*Ciencia del Dato y empresa
*Problemas empresariales y soluciones basadas en Data Science Modelos de negocio basados en datos
*Casos de estudio

Módulo/Asignatura 2. Introducción a la Programación en Python y a los Paradigmas para Datos

Número de créditos: 4,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 18/10/2023 - 29/11/2023

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Fundamentos de Python
Tipos de datos: números, cadenas, tuplas, listas, diccionarios, conjuntos Definiciones por comprensión, estructuras de control, etc.
Definición de funciones
Gestión de errores
Arquitecturas y paradigmas para los datos (Introducción)
Tipos de datos: Estructurados y desestructurados
Obtención de datos
Almacenamiento y consulta (BDR)
Biblioteca estándar Python y Otras bibliotecas

Módulo/Asignatura 3. Fundamentos de Estadística y Programación en R

Número de créditos: 4,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 19/10/2023 - 24/11/2023

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Fundamentos de Estadística
* Probabilidad e inferencia estadística
* Análisis Exploratorio de Datos
* Modelo de Regresión Lineal Múltiple Entorno de programación estadística R
* Tipos de objetos.
* Elementos de Programación
* Gestión de datos
* Análisis exploratorio de datos: visualización

Módulo/Asignatura 4. Aprendizaje Estadístico y Modelización

Número de créditos: 5,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 29/11/2023 - 18/01/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Concepto básicos en Aprendizaje estadístico * Modelo lineal generalizado.
* Modelos de Regresión no lineales
* Modelos de Regresión no paramétricos
* Regresión y clasificación mediante KNN

Módulo/Asignatura 5. Arquitecturas y Paradigmas para Ciencia del Dato

Número de créditos: 4,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 01/12/2023 - 17/01/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Introducción a los datos (estructurados y desestructurados)
* Introducción y repaso sobre obtención de datos (APIs, RDF, logs, transacciones, textos, etc.)
* Tratamiento y limpieza de datos: Expresiones regulares, Herramientas ETL * Almacenamiento: BD relacionales versus BD NoSQL.
* Bases de datos NoSQL
* Procesamiento en paralelo y escalabilidad
* Introducción a los ecosistemas Big Data

Módulo/Asignatura 6. Arquitecturas y Paradigmas para Big Data

Número de créditos: 4,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 20/03/2024 - 12/04/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Introducción a los ecosistemas Big Data
* Almacenamiento y procesamiento distribuido * El ecosistema Hadoop
* Spark
* Integración con R y Python.

Módulo/Asignatura 7. Machine Learning I

Número de créditos: 5,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 24/01/2024 - 20/02/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Técnicas de Reducción de la dimensionalidad * Análisis de Conglomerados
* Técnicas de clasificación probabilística
* Support Vector Machines (SVM)
* Árboles de clasificación y regresión

Módulo/Asignatura 8. Machine Learning II

Número de créditos: 4,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 21/02/2024 - 15/03/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Redes neuronales
* Sistemas de ranking
* Técnicas de combinación de modelos.
* Herramientas estadísticas para la Bioinformática * Selección de atributos

Módulo/Asignatura 9. Deep Learning

Número de créditos: 3,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 08/05/2024 - 28/06/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Métodos de soluciones individuales
Métodos basados en poblaciones
Redes convolucionales
Redes recurrentes

Módulo/Asignatura 10. Inteligencia Colectiva y Sistemas de Recomendación

Número de créditos: 3,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 24/01/2024 - 08/02/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Inteligencia Colectiva y flujos de datos
** Web Social
** Social Media
** Metodologías ''crowd''
* Redes: Conceptos, topología y comportamiento extremal
** Propagación
** Resiliencia en redes
** Computación bajo reputación y confianza
* Análisis de la semántica emergente: Análisis de opinión y sentimientos * Sistemas de recomendación (Item based, User Based)
* Aplicaciones

Módulo/Asignatura 11. Modelos para Datos Temporales y Espaciales

Número de créditos: 2,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 24/04/2024 - 04/05/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

* Técnicas básicas
* Modelos ARIMA
* Modelos de series temporales no lineales: ARCH-GARCH * Análisis espectral
* Georeferenciación estadística
* Técnicas de predicción espacial

Módulo/Asignatura 12. Data Science & Business Intelligence

Número de créditos: 3,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 04/04/2024 - 26/04/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Introducción a la inteligencia de negocio
Aplicaciones
Data Smart y Data warehouse
Bases de datos OLAP, OLTP
Plataformas de inteligencia de negocio
Herramientas de minería de datos integradas en las plataformas Uso de herramientas de BI
Diseño de cuadro de mandos

Módulo/Asignatura 13. Procesamiento del Lenguaje Natural para la Ciencia del Dato

Número de créditos: 3,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 19/05/2024 - 05/06/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Módulo I: Fundamentos del Procesamiento del Lenguaje Natural
Introducción: de la Lingüística Computacional a la Ingeniería del Lenguaje Natural Niveles y técnicas para el estudio y tratamiento automático de los lenguajes naturales
Nociones y técnicas básicas: Expresiones regulares, Autómatas y Gramáticas Recursos lingüísticos
Módulo II: Lenguaje natural, datos y conocimiento
Reconocimiento automático de la voz: Redes neuronales y otras tecnologías aplicadas al nivel acústico. Análisis del entrenamiento, adaptación y evaluación.
Análisis léxico-morfológico: corpus lingüísticos y técnicas relacionadas con la ciencia del dato. Corrección ortográfica, lematización, tokenización.
Análisis gramatical: sintaxis y semántica. Modelos basados en conocimiento y modelos estadísticos.
Gestión del diálogo: Autómatas. Sistemas basados en agentes. El enfoque basado en el estado de información. Las técnicas POMDP (procesos de decisión de Markov parcialmente observables) como soporte al aprendizaje automático en gestión del diálogo.
Traducción automática: Técnicas y enfoques. Paradigmas basados en reglas, basados en corpus y enfoques híbridos.
Aplicaciones comerciales e industriales: Speech Analytics, Content Analytics, Text Mining, Information Retrieval and Extraction, Question Answering, Sentiment Analysis, Entity Names Recognition, etc.
NLTK: Librería Python para lenguaje natural
Manipulación de corpus
Normalización de textos: segmentación, tokenización, lematización. Tagging
Clasificación de textos
Parsing
Análisis semántico: gramáticas de estructuras de rasgos Representación del conocimiento
StanfordCore NLP
Sistema de reconocimiento de entidades
Tagging
Classifier
Information Extraction
Estudio de aplicaciones comerciales e industriales
Ejemplos como Watson Analytics y otras plataformas que integran Big Data y sistemas basados en lenguaje natural en distintas áreas

Módulo/Asignatura 14. Visualización de Datos

Número de créditos: 2,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 22/02/2024 - 13/03/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Herramientas, librerías y metodologías para la visualización de datos

Módulo/Asignatura 15. Visualización de la Información

Número de créditos: 2,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 14/03/2024 - 03/04/2024

Horario: Estudios a distancia, Módulo/Asignatura sin horario

Contenido:

Arquitectura de la visualización de la Información Estructura visual: diseño e implementación Infografías y economía visual
Presentación de informes y Reports

Módulo/Asignatura 16. Trabajo Fin de Máster

Número de créditos: 6,00 ECTS

Modalidad de impartición: A distancia

Fechas de inicio-fin: 01/11/2023 - 24/06/2024

Contenido:

Desarrollo del Trabajo fin de Máster, orientado a la aplicación de los conocimientos y competencias adquiridas en los restantes módulos. Los tutores serán tanto académicos como empresariales