Skip to content

Desarrollo de un sistema de minería de datos utilizando la metodología CRISP. Procesos ETL, creación de cubos MOLAP y ROLAP, consultas MDX, reportes, etc.

Notifications You must be signed in to change notification settings

luisfloresxyz/Almacenes-y-Mineria-de-datos

Repository files navigation

Almacenes-y-Mineria-de-datos

Prácticas y tareas de la materia Almacenes y Minería de datos.

Proyecto

Desarrollo de un sistema de minería de datos, utilizando la metodología CRISP. El problema a resolver consiste en determinar, apartir de los atributos en el dataset proporcionado, los factores que contribuyen a que una persona padezca enfermedades cardiacas. Más información.

Prácticas

  1. Consultas con PostgreSQL.
  2. Extracción, Limpieza y Transformación con los procesos ETL. Además de procesamiento y limpieza de datos con DataCleaner y Spoon. Más información.
  3. Integración de datos desde diferentes fuentes.
  4. ...
  5. Diseño de un almacen de datos usando la metodología de Kimball. Más información.
  6. Consultas OLAP del Almacén de Datos creado en la práctica anterior. Más información.
  7. Uso de la sintaxis de MDX de SQLServer. Más información.
  8. Creación de reportes usando la herramienta de SQL Server Reporting Services. Más información.
  9. Panorama general - nominal, numérico, binomial, media, mediana, desviación estandar, moda -de un conjunto de datos usando RapidMiner Studio. Además de la creación de gráficas de barras, histogramas, de burbujas, desviación y pastel. Más información.
  10. Procesamiento de datos - limpieza, integración, reducción, transformación y discretización - usando RStudio. Más información.
  11. Busqueda de patrones frecuentes dentro de un conjunto de datos e interpretación de los resultados; usando reglas de asociación y RStudio. Más información..
  12. Busqueda de patrones frecuentes dentro de un conjunto de datos e interpretación de los resultados; usando reglas de asociación y RStudio. Más información..
  13. Cración de agrupamientos (clustering) de datos utilizando el algoritmo de k-medoids en R Studio. Más información.

Tareas

  1. Conceptos sobre bases de datos, almacenes de datos y mineria de datos.
  2. Uso del proceso ETL, y uso de Open Refine. Más información.
  3. Diseño de un almacén de datos usando la metodología de Kimball.
  4. Creación de un cubo MOLAP y un cubo ROLAP.
  5. Consultas MDX.

About

Desarrollo de un sistema de minería de datos utilizando la metodología CRISP. Procesos ETL, creación de cubos MOLAP y ROLAP, consultas MDX, reportes, etc.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published