Portfolio y Proyecto Final
Llegó el momento de integrar todo. En esta lección vas a construir un proyecto completo de Data Analysis de principio a fin, siguiendo la metodología profesional que usarías en un trabajo real. Este proyecto es tu carta de presentación — tu portfolio — para demostrar a reclutadores y empleadores lo que sabés hacer.
El portfolio de un Data Analyst
¿Por qué necesitás un portfolio?
Los certificados dicen que estudiaste. El portfolio demuestra que sabés hacer. Un buen portfolio te diferencia del 90% de los candidatos que solo tienen cursos en su CV.
1. 2-3 proyectos completos con datos reales o realistas
2. Notebooks o scripts bien documentados y organizados
3. Visualizaciones que comunican hallazgos con claridad
4. GitHub con código limpio, README profesional, y commits descriptivos
5. (Opcional) Dashboard en Power BI / Tableau publicado online
¿Dónde publicar tu portfolio?
| Plataforma | Ventaja | Para qué |
|---|---|---|
| GitHub | Estándar de la industria | Código, notebooks, README |
| Kaggle | Comunidad de Data Science | Notebooks interactivos, datasets |
| Red profesional #1 | Posts con hallazgos, links al código | |
| Tableau Public | Dashboards interactivos gratis | Visualizaciones publicadas |
| Blog personal | Control total del contenido | Artículos explicando tu proceso |
Estructura de un proyecto de portfolio
- Título claro: "Análisis de Churn Bancario: predicción de cancelación de clientes"
- Pregunta de negocio: "¿Qué características tienen los clientes que cancelan?"
- Dataset: de dónde vienen los datos, qué contienen (puede ser Kaggle o datos simulados)
- EDA: exploración completa con gráficos e insights
- Análisis / Modelo: estadísticas, correlaciones, ML si aplica
- Conclusiones: hallazgos accionables para el negocio
- README profesional en GitHub
Proyecto Final: Análisis de Churn Bancario
Vamos a construir un proyecto completo paso a paso. Cada bloque de código es un paso del proceso.
Paso 1: Definir el problema y crear el dataset
Hacé clic en ▶ Ejecutar
Paso 2: EDA — Calidad de datos
Hacé clic en ▶ Ejecutar
Paso 3: EDA — Análisis visual
Hacé clic en ▶ Ejecutar
Paso 4: Modelo predictivo
Hacé clic en ▶ Ejecutar
Paso 5: Conclusiones y recomendaciones
Hacé clic en ▶ Ejecutar
Cómo armar tu GitHub profesional
Estructura de un repositorio de portfolio
Hacé clic en ▶ Ejecutar
Ejercicios del Proyecto Final
Ejercicio 1: Diagnóstico rápido del dataset
Imprimí las dimensiones, tipos de datos y nulos del dataset. Debe incluir shape.
Hacé clic en ▶ Ejecutar
Ejercicio 2: Tasa de churn
Calculá la tasa de churn (% de clientes que cancelaron). Debe incluir %.
Hacé clic en ▶ Ejecutar
Ejercicio 3: Estadísticas por grupo
Calculá la media de Productos y Saldo agrupando por Churn (0 vs 1). Debe incluir mean.
Hacé clic en ▶ Ejecutar
Ejercicio 4: Gráfico de churn por segmento
Graficá la tasa de churn por segmento con un barplot. Imprimí Gráfico churn OK.
Hacé clic en ▶ Ejecutar
Ejercicio 5: Imputar nulos con mediana por grupo
Rellenálos nulos de Saldo con la mediana de cada Segmento. Debe incluir 0 (nulos restantes).
Hacé clic en ▶ Ejecutar
Ejercicio 6: Train/Test + modelo simple
Entrenáun modelo de churn y mostrá el accuracy. Debe incluir %.
Hacé clic en ▶ Ejecutar
Ejercicio 7: Dashboard EDA de 4 gráficos
Creá un dashboard con 4 gráficos del proyecto: boxplot, histograma, countplot y heatmap. Imprimí
EDA completo.
Hacé clic en ▶ Ejecutar
Ejercicio 8: Comparar 2 modelos con métricas completas
Compará Árbol y Logística. Imprimí accuracy, precision y recall de ambos. Debe incluir Recall.
Hacé clic en ▶ Ejecutar
Ejercicio 9: Generar tabla de recomendaciones
Basándote en los datos, imprimí 3 recomendaciones accionables para el negocio. Debe incluir
Recomendación.
Hacé clic en ▶ Ejecutar
Ejercicio 10: Pipeline completo mini-proyecto
Pipeline end-to-end: crear datos → limpiar → EDA → modelo → insight. Debe incluir
Proyecto finalizado.
Hacé clic en ▶ Ejecutar
Resumen y conexión
- Tu portfolio demuestra lo que sabés hacer — es más valioso que cualquier certificado.
- Un proyecto completo incluye: pregunta de negocio → datos → EDA → modelo → conclusiones.
- GitHub con README profesional es el estándar para presentar proyectos.
- El proceso importa más que el resultado — código limpio, visualizaciones claras, insights accionables.
- 2-3 proyectos bien hechos valen más que 10 mediocres.
En la lección final (19 · Preparación para entrevistas) vas a aprender qué te van a preguntar en entrevistas de Data Analyst, cómo prepararte y cómo presentar tu portfolio profesionalmente.