Ir al contenido principal
Introducción a NumPy y Pandas para Análisis de Datos

Introducción a NumPy y Pandas para Análisis de Datos

Python ofrece poderosas bibliotecas para el análisis y manipulación de datos. Dos de las más populares son NumPy y Pandas:

NumPy

NumPy es una biblioteca fundamental para la computación científica en Python. Proporciona estructuras de datos como matrices multidimensionales y funciones para operar con estas estructuras de manera eficiente:


import numpy as np

# Creación de un array en NumPy
mi_array = np.array([1, 2, 3, 4, 5])

# Operaciones con arrays
suma = np.sum(mi_array)
promedio = np.mean(mi_array)
    

Pandas

Pandas es una herramienta poderosa para el análisis de datos que se basa en NumPy. Ofrece estructuras de datos como Series y DataFrames, ideales para trabajar con datos tabulares:


import pandas as pd

# Creación de un DataFrame en Pandas
data = {'Nombre': ['Ana', 'Juan', 'María'],
        'Edad': [25, 30, 28],
        'Puntuación': [80, 75, 90]}

df = pd.DataFrame(data)

# Operaciones con DataFrames
print(df.head())  # Muestra las primeras filas del DataFrame
promedio_edad = df['Edad'].mean()
    

Estas bibliotecas son esenciales para el análisis, manipulación y visualización de datos en Python, facilitando tareas comunes en ciencia de datos e investigación.

Comentarios