Operaciones Avanzadas con Pandas

pandas/pandas-parte6
@Lautaroff 24-03-2025

1. Agrupación de Datos (groupby)

La agrupación de datos es una técnica utilizada para dividir un conjunto de datos en grupos basados en una o más columnas. Con groupby en Pandas, podemos aplicar funciones de agregación como sum(), mean(), count(), entre otras.

Ejemplo básico de groupby

import pandas as pd

datos = {
    'Categoria': ['A', 'B', 'A', 'B', 'A', 'B'],
    'Valor': [10, 20, 15, 25, 10, 30]
}
df = pd.DataFrame(datos)

# Agrupar por 'Categoria' y calcular la suma
agrupado = df.groupby('Categoria')['Valor'].sum()
print(agrupado)

Salida:

Categoria
A    35
B    75
Name: Valor, dtype: int64

Uso de múltiples funciones de agregación

Podemos aplicar varias funciones de agregación simultáneamente con agg().

df.groupby('Categoria')['Valor'].agg(['sum', 'mean', 'count'])

Esto nos dará el total, el promedio y la cantidad de valores para cada categoría.


Lección Anterior Curso Siguiente Lección