Preparación para Entrevistas
Sabés Python, SQL, pandas, visualización y ML. Ahora viene la parte que define si conseguís el puesto: la entrevista. Esta lección te prepara con las preguntas reales que hacen en entrevistas de Data Analyst, ejercicios de live coding, casos de negocio y estrategias para destacarte.
El proceso de entrevista para Data Analyst
Las 4 etapas típicas
| Etapa | Formato | Qué evalúan | Duración |
|---|---|---|---|
| 1. Screening | Llamada con RRHH | Fit cultural, expectativas, experiencia general | 15-30 min |
| 2. Técnica | Interview con el equipo | SQL, Python, estadística, herramientas | 45-60 min |
| 3. Case Study | Ejercicio práctico | Resolver un problema de negocio con datos | 60-90 min |
| 4. Final | Con el hiring manager | Fit técnico y de equipo, presentar portfolio | 30-45 min |
Las 5 áreas que te van a preguntar
| Área | Peso | Preguntas típicas |
|---|---|---|
| SQL | 30% | JOINs, GROUP BY, subqueries, window functions |
| Python/pandas | 25% | Limpieza, transformaciones, groupby, merge |
| Estadística | 20% | Media vs mediana, correlación, distribuciones, probabilidad |
| Negocio/Caso | 15% | "¿Cómo medirías el éxito de X?", "Bajaron las ventas, ¿qué harías?" |
| Herramientas/Soft skills | 10% | Excel, Power BI, comunicación, trabajo en equipo |
Preguntas de SQL — Live Coding
Pregunta 1: "Encontrá los clientes top y su ticket promedio"
Este tipo de pregunta aparece en el 80% de las entrevistas. Testea JOINs, GROUP BY y ORDER BY.
Hacé clic en ▶ Ejecutar
Pregunta 2: "Calculá la variación mensual de ventas"
Testea GROUP BY con funciones de fecha y análisis temporal — muy común en roles de BI.
Hacé clic en ▶ Ejecutar
Preguntas de Python/pandas
Pregunta 3: "Limpiá este dataset y extraé insights"
Te dan un dataset sucio y esperan que lo limpies, explores y saques conclusiones — todo en 20 minutos.
Hacé clic en ▶ Ejecutar
Preguntas de estadística
Las preguntas conceptuales más frecuentes
| Pregunta | Respuesta esperada |
|---|---|
| "¿Cuándo usarías la mediana en vez de la media?" | Cuando hay outliers. La media es sensible a valores extremos (ej: sueldos de una empresa con un CEO que gana 100x más). La mediana es más representativa del "valor típico". |
| "¿Qué es la correlación? ¿Implica causalidad?" | Correlación mide la fuerza de la relación lineal entre 2 variables (-1 a +1). No implica causalidad. Las ventas de helado y los ahogamientos correlacionan, pero la causa es el verano. |
| "Explicá la diferencia entre precision y recall" | Precision: ¿de los que dije positivos, cuántos son realmente positivos? Recall: ¿de los positivos reales, cuántos capturé? En fraude, querés alto recall (no perder ningún fraude). En marketing, querés alta precision (no molestar clientes equivocados). |
| "¿Qué es overfitting?" | Cuando un modelo memoriza los datos de entrenamiento en vez de aprender patrones generales. Se detecta cuando la accuracy en train es alta pero en test baja. Se soluciona con regularización, menos features o más datos. |
| "¿Qué distribucion usarías para modelar cantidad de llamadas al call center por hora?" | Poisson — modela la cantidad de eventos en un intervalo de tiempo. Es discreta, solo valores ≥ 0, y tiene un solo parámetro λ (promedio). |
Pregunta práctica de estadística
Hacé clic en ▶ Ejecutar
Preguntas de caso de negocio
Caso: "Las ventas del e-commerce bajaron un 15% este mes. ¿Qué harías?"
Hacé clic en ▶ Ejecutar
Cómo presentar tu portfolio
Hacé clic en ▶ Ejecutar
Ejercicios de práctica de entrevista
Ejercicio 1: SQL — Total por categoría
Escribí una query que calcule el total de ventas por producto. Debe incluir total.
Hacé clic en ▶ Ejecutar
Ejercicio 2: pandas — Limpieza rápida
Normalizá strings, eliminá duplicados, contá nulos. Debe incluir Limpio.
Hacé clic en ▶ Ejecutar
Ejercicio 3: Estadística — Media vs Mediana
Calculá media y mediana de los datos. Explicá cuál es más representativa. Debe incluir mediana.
Hacé clic en ▶ Ejecutar
Ejercicio 4: SQL — JOIN + GROUP BY + HAVING
Encontrá los clientes con más de 3 operaciones. Debe incluir operaciones.
Hacé clic en ▶ Ejecutar
Ejercicio 5: pandas — groupby + múltiples agregaciones
Calculá media, mediana y conteo por Segmento. Debe incluir median.
Hacé clic en ▶ Ejecutar
Ejercicio 6: "¿Correlación implica causalidad?"
Mostrá dos variables que correlacionan pero no tienen causalidad. Imprimí la correlación y la explicación.
Debe incluir No.
Hacé clic en ▶ Ejecutar
Ejercicio 7: Pipeline SQL → pandas → insight
Extraé datos con SQL, calculá participación % en pandas, y generá un insight. Debe incluir
Insight.
Hacé clic en ▶ Ejecutar
Ejercicio 8: Modelo + interpretación para el negocio
Entrenáun modelo, mostrá las métricas y explicá qué significan para el negocio. Debe incluir
Negocio.
Hacé clic en ▶ Ejecutar
Ejercicio 9: Análisis de caso — "bajaron las ventas"
Segmentá la caída de ventas por canal y mes. Identificá dónde está el problema. Debe incluir
concentra.
Hacé clic en ▶ Ejecutar
Ejercicio 10: Simulación de entrevista completa
Simulá una mini-entrevista: (1) limpiar datos, (2) EDA rápido con gráfico, (3) insight con recomendación.
Debe incluir Recomiendo.
Hacé clic en ▶ Ejecutar
Resumen final del track completo
| # | Habilidad | Herramienta |
|---|---|---|
| 1-3 | Fundamentos de pandas: Series, DataFrames, lectura de datos | pandas |
| 4-6 | Selección, filtrado, limpieza y transformaciones | pandas |
| 7-8 | GroupBy, Pivot Tables, Merge, Join, Concat | pandas |
| 9 | Estadística descriptiva: centralidad, dispersión, distribuciones | numpy, pandas |
| 10-11 | Visualización con Matplotlib y Seaborn | matplotlib, seaborn |
| 12 | EDA completo: proceso de 6 pasos profesional | todo combinado |
| 13 | NumPy: arrays, vectorización, broadcasting | numpy |
| 14-15 | Machine Learning: clasificación, regresión, métricas | scikit-learn |
| 16 | Business Intelligence: Power BI, Tableau, dashboards | conceptual + pandas |
| 17 | Integración SQL + Python: pipelines completos | sqlite3, pandas |
| 18 | Portfolio profesional y proyecto final | todo el stack |
| 19 | Preparación para entrevistas técnicas | todo el stack |
- Tenés las herramientas para aplicar a puestos de Data Analyst Junior/Semi-senior.
- Tu próximo paso: construir tu portfolio con 2-3 proyectos y publicarlos en GitHub.
- Practicá SQL y pandas diariamente — LeetCode SQL, Kaggle Datasets.
- Mantené tu LinkedIn actualizado y compartí tus proyectos.
¡Éxitos en tu carrera como Data Analyst!
Recursos: Kaggle · LeetCode SQL · GitHub · Power BI