QuieroProgramar por Rodri Gonzalez
Data Analysis · Lección 18 de 19

Portfolio y Proyecto Final

Llegó el momento de integrar todo. En esta lección vas a construir un proyecto completo de Data Analysis de principio a fin, siguiendo la metodología profesional que usarías en un trabajo real. Este proyecto es tu carta de presentación — tu portfolio — para demostrar a reclutadores y empleadores lo que sabés hacer.

180–240 min Prerrequisitos: Todas las lecciones anteriores
01

El portfolio de un Data Analyst

¿Por qué necesitás un portfolio?

Los certificados dicen que estudiaste. El portfolio demuestra que sabés hacer. Un buen portfolio te diferencia del 90% de los candidatos que solo tienen cursos en su CV.

Un portfolio de Data Analyst profesional contiene:
1. 2-3 proyectos completos con datos reales o realistas
2. Notebooks o scripts bien documentados y organizados
3. Visualizaciones que comunican hallazgos con claridad
4. GitHub con código limpio, README profesional, y commits descriptivos
5. (Opcional) Dashboard en Power BI / Tableau publicado online

¿Dónde publicar tu portfolio?

Plataforma Ventaja Para qué
GitHub Estándar de la industria Código, notebooks, README
Kaggle Comunidad de Data Science Notebooks interactivos, datasets
LinkedIn Red profesional #1 Posts con hallazgos, links al código
Tableau Public Dashboards interactivos gratis Visualizaciones publicadas
Blog personal Control total del contenido Artículos explicando tu proceso

Estructura de un proyecto de portfolio

  1. Título claro: "Análisis de Churn Bancario: predicción de cancelación de clientes"
  2. Pregunta de negocio: "¿Qué características tienen los clientes que cancelan?"
  3. Dataset: de dónde vienen los datos, qué contienen (puede ser Kaggle o datos simulados)
  4. EDA: exploración completa con gráficos e insights
  5. Análisis / Modelo: estadísticas, correlaciones, ML si aplica
  6. Conclusiones: hallazgos accionables para el negocio
  7. README profesional en GitHub
Lo que buscan los reclutadores: no buscan el modelo con más accuracy. Buscan: (1) que puedas formular una pregunta de negocio, (2) que tu código sea limpio y reproducible, (3) que tus visualizaciones comuniquen con claridad, y (4) que puedas extraer insights accionables. El proceso importa más que el resultado.
02

Proyecto Final: Análisis de Churn Bancario

Vamos a construir un proyecto completo paso a paso. Cada bloque de código es un paso del proceso.

Paso 1: Definir el problema y crear el dataset

proyecto_paso01.pyPython

        
Hacé clic en ▶ Ejecutar

Paso 2: EDA — Calidad de datos

proyecto_paso02.pyPython

        
Hacé clic en ▶ Ejecutar

Paso 3: EDA — Análisis visual

proyecto_paso03.pyPython

        
Hacé clic en ▶ Ejecutar

Paso 4: Modelo predictivo

proyecto_paso04.pyPython

        
Hacé clic en ▶ Ejecutar

Paso 5: Conclusiones y recomendaciones

proyecto_paso05.pyPython

        
Hacé clic en ▶ Ejecutar
03

Cómo armar tu GitHub profesional

Estructura de un repositorio de portfolio

estructura_github.pyPython

        
Hacé clic en ▶ Ejecutar
04

Ejercicios del Proyecto Final

Nivel 1 · Básico

Ejercicio 1: Diagnóstico rápido del dataset

Imprimí las dimensiones, tipos de datos y nulos del dataset. Debe incluir shape.

ejercicio_01.pyDebe incluir "shape"

          
Hacé clic en ▶ Ejecutar
Nivel 1 · Básico

Ejercicio 2: Tasa de churn

Calculá la tasa de churn (% de clientes que cancelaron). Debe incluir %.

ejercicio_02.pyDebe incluir "%"

          
Hacé clic en ▶ Ejecutar
Nivel 1 · Básico

Ejercicio 3: Estadísticas por grupo

Calculá la media de Productos y Saldo agrupando por Churn (0 vs 1). Debe incluir mean.

ejercicio_03.pyDebe incluir "mean"

          
Hacé clic en ▶ Ejecutar
Nivel 2 · Intermedio

Ejercicio 4: Gráfico de churn por segmento

Graficá la tasa de churn por segmento con un barplot. Imprimí Gráfico churn OK.

ejercicio_04.pyDebe imprimir "Gráfico churn OK"

          
Hacé clic en ▶ Ejecutar
Nivel 2 · Intermedio

Ejercicio 5: Imputar nulos con mediana por grupo

Rellenálos nulos de Saldo con la mediana de cada Segmento. Debe incluir 0 (nulos restantes).

ejercicio_05.pyDebe incluir "0"

          
Hacé clic en ▶ Ejecutar
Nivel 2 · Intermedio

Ejercicio 6: Train/Test + modelo simple

Entrenáun modelo de churn y mostrá el accuracy. Debe incluir %.

ejercicio_06.pyDebe incluir "%"

          
Hacé clic en ▶ Ejecutar
Nivel 3 · Avanzado

Ejercicio 7: Dashboard EDA de 4 gráficos

Creá un dashboard con 4 gráficos del proyecto: boxplot, histograma, countplot y heatmap. Imprimí EDA completo.

ejercicio_07.pyDebe imprimir "EDA completo"

          
Hacé clic en ▶ Ejecutar
Nivel 3 · Avanzado

Ejercicio 8: Comparar 2 modelos con métricas completas

Compará Árbol y Logística. Imprimí accuracy, precision y recall de ambos. Debe incluir Recall.

ejercicio_08.pyDebe incluir "Recall"

          
Hacé clic en ▶ Ejecutar
Nivel 3 · Avanzado

Ejercicio 9: Generar tabla de recomendaciones

Basándote en los datos, imprimí 3 recomendaciones accionables para el negocio. Debe incluir Recomendación.

ejercicio_09.pyDebe incluir "Recomendación"

          
Hacé clic en ▶ Ejecutar
Nivel 4 · Desafío

Ejercicio 10: Pipeline completo mini-proyecto

Pipeline end-to-end: crear datos → limpiar → EDA → modelo → insight. Debe incluir Proyecto finalizado.

ejercicio_10_desafio.pyDebe imprimir "Proyecto finalizado"

          
Hacé clic en ▶ Ejecutar
05

Resumen y conexión

En la lección final (19 · Preparación para entrevistas) vas a aprender qué te van a preguntar en entrevistas de Data Analyst, cómo prepararte y cómo presentar tu portfolio profesionalmente.