2.1 ¿Qué es un DataFrame?
Un DataFrame es una estructura de datos bidimensional similar a una tabla, donde cada columna puede tener un tipo de dato distinto. Cada fila representa una observación y cada columna una variable.
2.2 Creación de un DataFrame
A partir de un diccionario
data = {
'Nombre': ['Ana', 'Luis', 'Carlos', 'María'],
'Edad': [23, 45, 35, 29],
'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla']
}
df = pd.DataFrame(data)
print(df)
Explicación:
Cada clave del diccionario se convierte en una columna y los valores asociados forman las filas.
Cargando datos desde un archivo CSV
# Suponiendo que tienes un archivo 'datos.csv' en el directorio actual
df_csv = pd.read_csv('datos.csv')
print(df_csv.head())
Explicación:
El método read_csv()
carga datos de un archivo CSV y crea un DataFrame, facilitando el análisis de datasets reales.
2.3 Exploración Básica de un DataFrame
- Visualizar las primeras filas:
print("Primeras 5 filas:") print(df.head())
- Obtener información general (tipos de datos y valores nulos):
print("\nInformación del DataFrame:") print(df.info())
- Resumen estadístico de las columnas numéricas:
print("\nDescripción estadística:") print(df.describe())