QuieroProgramar por Rodri Gonzalez
Data Analysis · Lección 19 de 19

Preparación para Entrevistas

Sabés Python, SQL, pandas, visualización y ML. Ahora viene la parte que define si conseguís el puesto: la entrevista. Esta lección te prepara con las preguntas reales que hacen en entrevistas de Data Analyst, ejercicios de live coding, casos de negocio y estrategias para destacarte.

90–120 min Lección final del track
01

El proceso de entrevista para Data Analyst

Las 4 etapas típicas

Etapa Formato Qué evalúan Duración
1. Screening Llamada con RRHH Fit cultural, expectativas, experiencia general 15-30 min
2. Técnica Interview con el equipo SQL, Python, estadística, herramientas 45-60 min
3. Case Study Ejercicio práctico Resolver un problema de negocio con datos 60-90 min
4. Final Con el hiring manager Fit técnico y de equipo, presentar portfolio 30-45 min

Las 5 áreas que te van a preguntar

Área Peso Preguntas típicas
SQL 30% JOINs, GROUP BY, subqueries, window functions
Python/pandas 25% Limpieza, transformaciones, groupby, merge
Estadística 20% Media vs mediana, correlación, distribuciones, probabilidad
Negocio/Caso 15% "¿Cómo medirías el éxito de X?", "Bajaron las ventas, ¿qué harías?"
Herramientas/Soft skills 10% Excel, Power BI, comunicación, trabajo en equipo
Realidad del mercado: las empresas buscan analistas que puedan hacer 3 cosas: (1) extraer datos (SQL), (2) analizarlos (Python + estadística), y (3) comunicar hallazgos (visualización + storytelling). Si demostrás esas 3 cosas en la entrevista, tenés una ventaja enorme.
02

Preguntas de SQL — Live Coding

Pregunta 1: "Encontrá los clientes top y su ticket promedio"

Este tipo de pregunta aparece en el 80% de las entrevistas. Testea JOINs, GROUP BY y ORDER BY.

sql_pregunta_01.pyInterview SQL

        
Hacé clic en ▶ Ejecutar

Pregunta 2: "Calculá la variación mensual de ventas"

Testea GROUP BY con funciones de fecha y análisis temporal — muy común en roles de BI.

sql_pregunta_02.pyInterview SQL

        
Hacé clic en ▶ Ejecutar
03

Preguntas de Python/pandas

Pregunta 3: "Limpiá este dataset y extraé insights"

Te dan un dataset sucio y esperan que lo limpies, explores y saques conclusiones — todo en 20 minutos.

pandas_pregunta_03.pyInterview pandas

        
Hacé clic en ▶ Ejecutar
04

Preguntas de estadística

Las preguntas conceptuales más frecuentes

Pregunta Respuesta esperada
"¿Cuándo usarías la mediana en vez de la media?" Cuando hay outliers. La media es sensible a valores extremos (ej: sueldos de una empresa con un CEO que gana 100x más). La mediana es más representativa del "valor típico".
"¿Qué es la correlación? ¿Implica causalidad?" Correlación mide la fuerza de la relación lineal entre 2 variables (-1 a +1). No implica causalidad. Las ventas de helado y los ahogamientos correlacionan, pero la causa es el verano.
"Explicá la diferencia entre precision y recall" Precision: ¿de los que dije positivos, cuántos son realmente positivos? Recall: ¿de los positivos reales, cuántos capturé? En fraude, querés alto recall (no perder ningún fraude). En marketing, querés alta precision (no molestar clientes equivocados).
"¿Qué es overfitting?" Cuando un modelo memoriza los datos de entrenamiento en vez de aprender patrones generales. Se detecta cuando la accuracy en train es alta pero en test baja. Se soluciona con regularización, menos features o más datos.
"¿Qué distribucion usarías para modelar cantidad de llamadas al call center por hora?" Poisson — modela la cantidad de eventos en un intervalo de tiempo. Es discreta, solo valores ≥ 0, y tiene un solo parámetro λ (promedio).

Pregunta práctica de estadística

stats_pregunta_04.pyInterview estadística

        
Hacé clic en ▶ Ejecutar
05

Preguntas de caso de negocio

Caso: "Las ventas del e-commerce bajaron un 15% este mes. ¿Qué harías?"

caso_negocio.pyInterview caso

        
Hacé clic en ▶ Ejecutar
06

Cómo presentar tu portfolio

presentar_portfolio.pyTips de presentación

        
Hacé clic en ▶ Ejecutar
07

Ejercicios de práctica de entrevista

Nivel 1 · Básico

Ejercicio 1: SQL — Total por categoría

Escribí una query que calcule el total de ventas por producto. Debe incluir total.

ejercicio_01.pyDebe incluir "total"

          
Hacé clic en ▶ Ejecutar
Nivel 1 · Básico

Ejercicio 2: pandas — Limpieza rápida

Normalizá strings, eliminá duplicados, contá nulos. Debe incluir Limpio.

ejercicio_02.pyDebe incluir "Limpio"

          
Hacé clic en ▶ Ejecutar
Nivel 1 · Básico

Ejercicio 3: Estadística — Media vs Mediana

Calculá media y mediana de los datos. Explicá cuál es más representativa. Debe incluir mediana.

ejercicio_03.pyDebe incluir "mediana"

          
Hacé clic en ▶ Ejecutar
Nivel 2 · Intermedio

Ejercicio 4: SQL — JOIN + GROUP BY + HAVING

Encontrá los clientes con más de 3 operaciones. Debe incluir operaciones.

ejercicio_04.pyDebe incluir "operaciones"

          
Hacé clic en ▶ Ejecutar
Nivel 2 · Intermedio

Ejercicio 5: pandas — groupby + múltiples agregaciones

Calculá media, mediana y conteo por Segmento. Debe incluir median.

ejercicio_05.pyDebe incluir "median"

          
Hacé clic en ▶ Ejecutar
Nivel 2 · Intermedio

Ejercicio 6: "¿Correlación implica causalidad?"

Mostrá dos variables que correlacionan pero no tienen causalidad. Imprimí la correlación y la explicación. Debe incluir No.

ejercicio_06.pyDebe incluir "No"

          
Hacé clic en ▶ Ejecutar
Nivel 3 · Avanzado

Ejercicio 7: Pipeline SQL → pandas → insight

Extraé datos con SQL, calculá participación % en pandas, y generá un insight. Debe incluir Insight.

ejercicio_07.pyDebe incluir "Insight"

          
Hacé clic en ▶ Ejecutar
Nivel 3 · Avanzado

Ejercicio 8: Modelo + interpretación para el negocio

Entrenáun modelo, mostrá las métricas y explicá qué significan para el negocio. Debe incluir Negocio.

ejercicio_08.pyDebe incluir "Negocio"

          
Hacé clic en ▶ Ejecutar
Nivel 3 · Avanzado

Ejercicio 9: Análisis de caso — "bajaron las ventas"

Segmentá la caída de ventas por canal y mes. Identificá dónde está el problema. Debe incluir concentra.

ejercicio_09.pyDebe incluir "concentra"

          
Hacé clic en ▶ Ejecutar
Nivel 4 · Desafío

Ejercicio 10: Simulación de entrevista completa

Simulá una mini-entrevista: (1) limpiar datos, (2) EDA rápido con gráfico, (3) insight con recomendación. Debe incluir Recomiendo.

ejercicio_10_desafio.pyDebe imprimir "Recomiendo"

          
Hacé clic en ▶ Ejecutar
08

Resumen final del track completo

¡Felicitaciones! Completaste las 19 lecciones del track de Data Analysis. Esto es lo que ahora sabés hacer:
# Habilidad Herramienta
1-3 Fundamentos de pandas: Series, DataFrames, lectura de datos pandas
4-6 Selección, filtrado, limpieza y transformaciones pandas
7-8 GroupBy, Pivot Tables, Merge, Join, Concat pandas
9 Estadística descriptiva: centralidad, dispersión, distribuciones numpy, pandas
10-11 Visualización con Matplotlib y Seaborn matplotlib, seaborn
12 EDA completo: proceso de 6 pasos profesional todo combinado
13 NumPy: arrays, vectorización, broadcasting numpy
14-15 Machine Learning: clasificación, regresión, métricas scikit-learn
16 Business Intelligence: Power BI, Tableau, dashboards conceptual + pandas
17 Integración SQL + Python: pipelines completos sqlite3, pandas
18 Portfolio profesional y proyecto final todo el stack
19 Preparación para entrevistas técnicas todo el stack

¡Éxitos en tu carrera como Data Analyst!

Recursos: Kaggle · LeetCode SQL · GitHub · Power BI