Prácticas y tareas de la materia Almacenes y Minería de datos.
Desarrollo de un sistema de minería de datos, utilizando la metodología CRISP. El problema a resolver consiste en determinar, apartir de los atributos en el dataset proporcionado, los factores que contribuyen a que una persona padezca enfermedades cardiacas. Más información.
- Consultas con PostgreSQL.
- Extracción, Limpieza y Transformación con los procesos ETL. Además de procesamiento y limpieza de datos con DataCleaner y Spoon. Más información.
- Integración de datos desde diferentes fuentes.
- ...
- Diseño de un almacen de datos usando la metodología de Kimball. Más información.
- Consultas OLAP del Almacén de Datos creado en la práctica anterior. Más información.
- Uso de la sintaxis de MDX de SQLServer. Más información.
- Creación de reportes usando la herramienta de SQL Server Reporting Services. Más información.
- Panorama general - nominal, numérico, binomial, media, mediana, desviación estandar, moda -de un conjunto de datos usando RapidMiner Studio. Además de la creación de gráficas de barras, histogramas, de burbujas, desviación y pastel. Más información.
- Procesamiento de datos - limpieza, integración, reducción, transformación y discretización - usando RStudio. Más información.
- Busqueda de patrones frecuentes dentro de un conjunto de datos e interpretación de los resultados; usando reglas de asociación y RStudio. Más información..
- Busqueda de patrones frecuentes dentro de un conjunto de datos e interpretación de los resultados; usando reglas de asociación y RStudio. Más información..
- Cración de agrupamientos (clustering) de datos utilizando el algoritmo de k-medoids en R Studio. Más información.
- Conceptos sobre bases de datos, almacenes de datos y mineria de datos.
- Uso del proceso ETL, y uso de Open Refine. Más información.
- Diseño de un almacén de datos usando la metodología de Kimball.
- Creación de un cubo MOLAP y un cubo ROLAP.
- Consultas MDX.