Trabajo Práctico para la materia Aprendizaje Automático de UNSAM
A partir del dataset a trabajar (extraído de Kaggle aquí) realizaremos las primeras prácticas de prueba para conocer el dataset en una Jupyter Notebook. Luego de explorar los datos, seguiremos con la predicción y elección de un modelo.
Para poder trabajar localmente, se debe hacer lo siguiente (líneas que empiezan con #, son el alternativo de la línea anterior para usuarios en Linux):
- Clonar el repositorio
cd ./carpeta/en/donde/clonar/repo
git clone https://github.com/JaviCeRodriguez/Heart-Failure-ML.git
- Crear un entorno virtual y activarlo
cd ./Heart-Failure-ML
python -m venv myvenv
# python3 -m venv my-project-env
myvenv/Scripts/activate
# source myvenv/bin/activate
- Instalar librerías
pip install -r requirements.txt
Opcionalmente, pueden utilizar el entorno virtual creado por Anaconda!
- Para desactivar el entorno (si necesario)
deactivate
Estaremos trabajando en la notebook main.ipynb
, pero daremos su versión en formato *.py
. Podemos ejecutar la notebook
en Jupyter Notebook, Google Colab o desde Visual Studio Code. Recomendamos utilizar PyCharm, ya que facilita la instalación
de las librerías en el entorno virtual y de la extensión Jupyter Notebook.
Como mencionamos anteriormente, el dataset utilizado trata sobre datos recolectados (299 muestras) a partir de pacientes con falla cardíaca. Contiene las siguientes features: age
, anaemia
, creatinine_phosphokinase
, diabetes
, ejection_fraction
, high_blood_pressure
, platelets
, serum_creatinine
, serum_sodium
, sex
, smoking
, time
y DEATH_EVENT
.
Javier Rodriguez | Martin Pierangeli | Marcelo Raponi | Maria Luz Perez Saura |
---|---|---|---|