Número de créditos: 3,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 24/04/2016 - 25/05/2016
Horario: Miércoles. En horario de tarde
Contenido:
Introducción a la Ciencia del Dato
Experimentación e Investigación: Reproducibilidad y documentación
Proyectos básicos de aplicación de técnicas de Ciencia del Dato
Big data
Etapas de un proyecto
Exploración de datos
Técnicas de educción
Modelización: tipos de datos
Computación
Aplicación
Gestión de versiones
Elaboración y redacción de informes finales
Cuestiones éticas y legales asociadas a cada etapa de un proyecto
Legislación de protección de datos que afectan al proyecto en Data Science
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 28/01/2016 - 18/03/2016
Horario: Jueves, Viernes. En horario de tarde
Contenido:
Fundamentos de Python
Tipos de datos: números, cadenas, tuplas, listas, diccionarios, conjuntos
Definiciones por comprensión, estructuras de control, etc.
Definición de funciones
Gestión de errores
Arquitecturas y paradigmas para los datos (Introducción)
Tipos de datos: Estructurados y esestructurados
Optención de datos
Almacenamiento y consulta
Biblioteca estándar Python:
Otras bibliotecas:
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 28/01/2016 - 18/03/2016
Horario: Jueves, Viernes. En horario de tarde
Contenido:
Fundamentos de Estadística
* Probabilidad e inferencia estadística
* Análisis Exploratorio de Datos
* Modelo de Regresión Lineal Múltiple
Entorno de programación estadística R
* Tipos de objetos.
* Elementos de Programación
* Gestión de datos
* Análisis exploratorio de datos: visualización.
Número de créditos: 6,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 31/03/2016 - 03/06/2016
Horario: Jueves, Viernes. En horario de tarde
Contenido:
* Concepto básicos en Aprendizaje estadístico
* Modelo lineal generalizado.
* Modelos de Regresión no lineales
* Modelos de Regresión no paramétricos
* Regresión y clasificación mediante KNN
Número de créditos: 4,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 31/03/2016 - 03/06/2016
Horario: Jueves, Viernes. En horario de tarde
Contenido:
* Introducción a los datos (estructurados y desestructurados)
* Introducción y repaso sobre obtención de datos (APIs, RDF, logs, transacciones, textos, etc.)
* Tratamiento y limpieza de datos: Expresiones regulares, Herramientas ETL
* Almacenamiento BD relacionales versus BD Nosql: Column Stores, BD Documentos, Clave-Valor, BD en grafo, etc.
* Procesamiento en paralelo y escalabilidad (multiprocesamiento a nivel de datos VS a nivel funcional)
* Casos de uso y diseño de soluciones
* Entornos integrados. Ejemplo: RapidMiner
Número de créditos: 5,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 08/06/2016 - 15/07/2016
Horario: Miércoles, Jueves, Viernes. En horario de tarde
Contenido:
* Técnicas de Reducción de la dimensionalidad
* Análisis de Conglomerados
* Técnicas de clasificación probabilística
* Support Vector Machines (SVM)
* Árboles de clasificación y regresión
Número de créditos: 3,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 19/05/2016 - 17/06/2016
Horario: Jueves, Viernes. En horario de tarde
Contenido:
* Inteligencia Colectiva y flujos de datos
** Web Social
** Social Media
** Metodologías ''crowd''
* Redes: Conceptos, topología y comportamiento extremal
** Propagación
** Resiliencia en redes
** Computación bajo reputación y confianza
* Análisis de la semántica emergente: Análisis de opinión y sentimientos
* Sistemas de recomendación (Item based, User Based)
* Aplicaciones
Número de créditos: 2,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 23/06/2016 - 08/07/2016
Horario: Jueves, Viernes. En horario de tarde
Contenido:
Módulo I: Fundamentos del Procesamiento del Lenguaje Natural
Introducción: de la Lingüística Computacional a la Ingeniería del Lenguaje Natural
Niveles y técnicas para el estudio y tratamiento automático de los lenguajes naturales
Nociones y técnicas básicas: Expresiones regulares, Autómatas y Gramáticas
Recursos lingüísticos
Módulo II: Lenguaje natural, datos y conocimiento
Reconocimiento automático de la voz: Redes neuronales y otras tecnologías aplicadas al nivel acústico. Análisis del entrenamiento, adaptación y evaluación.
Análisis léxico-morfológico: corpus lingüísticos y técnicas relacionadas con la ciencia del dato. Corrección ortográfica, lematización, tokenización.
Análisis gramatical: sintaxis y semántica. Modelos basados en conocimiento y modelos estadísticos.
Gestión del diálogo: Autómatas. Sistemas basados en agentes. El enfoque basado en el estado de información. Las técnicas POMDP (procesos de decisión de Markov parcialmente observables) como soporte al aprendizaje automático en gestión del diálogo.
Traducción automática: Técnicas y enfoques. Paradigmas basados en reglas, basados en corpus y enfoques híbridos.
Aplicaciones comerciales e industriales: Speech Analytics, Content Analytics, Text Mining, Information Retrieval and Extraction, Question Answering, Sentiment Analysis, Entity Names Recognition, etc.
Número de créditos: 2,00 ECTS
Modalidad de impartición: Presencial
Fechas de inicio-fin: 08/06/2016 - 15/07/2016
Horario: Miércoles, Jueves, Viernes. En horario de tarde
Contenido:
Arquitectura de la visualización de la Información
Estructura visual: diseño e implementación
Infografías y economía visual
Presentación de informes y Reports