2. DataFrames: Carga y Exploración Básica

@Lautaroff 24-03-2025

2.1 ¿Qué es un DataFrame?

Un DataFrame es una estructura de datos bidimensional similar a una tabla, donde cada columna puede tener un tipo de dato distinto. Cada fila representa una observación y cada columna una variable.

2.2 Creación de un DataFrame

A partir de un diccionario

data = {
    'Nombre': ['Ana', 'Luis', 'Carlos', 'María'],
    'Edad': [23, 45, 35, 29],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla']
}

df = pd.DataFrame(data)
print(df)

Explicación:
Cada clave del diccionario se convierte en una columna y los valores asociados forman las filas.

Cargando datos desde un archivo CSV

# Suponiendo que tienes un archivo 'datos.csv' en el directorio actual
df_csv = pd.read_csv('datos.csv')
print(df_csv.head())

Explicación:
El método read_csv() carga datos de un archivo CSV y crea un DataFrame, facilitando el análisis de datasets reales.

2.3 Exploración Básica de un DataFrame

Visualizar las primeras filas:

print("Primeras 5 filas:")
print(df.head())

Obtener información general (tipos de datos y valores nulos):
```
print("\nInformación del DataFrame:")
print(df.info())
```

Resumen estadístico de las columnas numéricas:

print("\nDescripción estadística:")
print(df.describe())

Lección Anterior Curso Siguiente Lección