1. Agrupación de Datos (groupby
)
La agrupación de datos es una técnica utilizada para dividir un conjunto de datos en grupos basados en una o más columnas. Con groupby
en Pandas, podemos aplicar funciones de agregación como sum()
, mean()
, count()
, entre otras.
Ejemplo básico de groupby
import pandas as pd
datos = {
'Categoria': ['A', 'B', 'A', 'B', 'A', 'B'],
'Valor': [10, 20, 15, 25, 10, 30]
}
df = pd.DataFrame(datos)
# Agrupar por 'Categoria' y calcular la suma
agrupado = df.groupby('Categoria')['Valor'].sum()
print(agrupado)
Salida:
Categoria
A 35
B 75
Name: Valor, dtype: int64
Uso de múltiples funciones de agregación
Podemos aplicar varias funciones de agregación simultáneamente con agg()
.
df.groupby('Categoria')['Valor'].agg(['sum', 'mean', 'count'])
Esto nos dará el total, el promedio y la cantidad de valores para cada categoría.