Logo Finanzas Fast Analytics

Think Tank Data.

With data, decisions.

With education, impact.

LinkedIn TikTok WhatsApp

No enviamos spam. Puede darse de baja en cualquier momento.

Estructuras de datos en Python

Listas, tuplas, diccionarios y arreglos

Cuando uno inicia en Python, entender las estructuras de datos es clave para organizar, manipular y analizar información. Aquí le presentamos las más usadas, sus características y ejemplos básicos para que pueda dominarlas desde ya.

📋 1. Listas (list)

Son colecciones ordenadas y modificables. Se usan para almacenar múltiples elementos.

frutas = ["manzana", "banana", "cereza"]
print(frutas[1])  # banana
frutas.append("naranja")

Cuándo usarla: cuando necesite una secuencia de elementos que pueda cambiar (agregar, eliminar, modificar).

📌 2. Tuplas (tuple)

Colecciones ordenadas pero inmutables (no se pueden modificar una vez creadas).

coordenadas = (10.5, 20.8)
print(coordenadas[0])  # 10.5

Cuándo usarla: cuando quiera asegurar que los datos no se alteren, como en coordenadas o configuraciones fijas.

📚 3. Diccionarios (dict)

Estructuras clave-valor. Muy potentes para almacenar información asociada, como datos de una persona.

persona = {
  "nombre": "Ana",
  "edad": 30,
  "ciudad": "Bogotá"
}
print(persona["nombre"])  # Ana

Cuándo usarlo: cuando necesite acceder a valores mediante nombres o etiquetas, no por posición.

🔢 4. Arreglos con NumPy (numpy.array)

No son nativos de Python puro, pero son fundamentales para ciencia de datos. Más eficientes y rápidos que las listas cuando se hacen operaciones numéricas masivas.

import numpy as np

edades = np.array([25, 30, 35, 40])
print(edades.mean())  # 32.5

Cuándo usarlo: cuando trabaje con números, matrices o vectores y requiera velocidad y funciones avanzadas.

Nota: Python también tiene otras estructuras como set, deque, defaultdict y más. Pero estas cuatro son las más utilizadas para comenzar con analítica de datos y automatización.


Tipos de variables en Python

Modo Fast: Sin rodeos, con ejemplos.

Saber qué tipo de variable está usando le evita errores, mejora su análisis y acelera su código. Aquí van los más usados. Sin rodeos:

🔢 int – Enteros

Números sin decimales.

edad = 30

🌡️ float – Decimales

Números con punto decimal.

precio = 19.99

💬 str – Texto

Cadenas de caracteres.

nombre = "Ana"

bool – Lógico

Solo dos valores: True o False.

activo = True

📋 list – Lista

Conjunto ordenado que puede cambiar.

frutas = ["manzana", "pera"]

📌 tuple – Tupla

Conjunto ordenado que no cambia.

coordenadas = (10, 20)

🧠 dict – Diccionario

Estructura clave-valor.

persona = {"nombre": "Luis", "edad": 25}

🧹 None – Sin valor

Representa “nada”.

resultado = None

🕵️‍♂️ ¿Y cómo saber qué tipo es?

x = 5
print(type(x))  # <class 'int'>

⚡ En resumen

Tipo ¿Para qué sirve?
intContar, ciclos, saldos simples
floatPrecios, porcentajes
strNombres, textos
boolCondiciones, filtros
listSecuencias que cambian
tupleDatos fijos
dictDatos por nombre (clave-valor)
NoneInicializar o marcar vacíos

📊 5 librerías para graficar en Python con Colab

Visualizar datos es fundamental para entender tendencias, comparar escenarios y tomar decisiones. Aquí le presentamos 5 librerías esenciales para graficar en Python desde Google Colab:

  • Matplotlib: Versátil y ampliamente usada. Ideal para gráficos básicos.
  • Seaborn: Basada en Matplotlib, pero con gráficos estadísticos más bonitos.
  • Plotly: Interactiva y perfecta para dashboards o publicaciones web.
  • Altair: Declarativa, limpia y fácil de usar con pandas.
# Ejemplo con Seaborn
import seaborn as sns
import matplotlib.pyplot as plt

df = sns.load_dataset("tips")
sns.boxplot(x="day", y="total_bill", data=df)
plt.show()

📁 Cómo trabajar con datasets en Python desde Google Colab

Google Colab es una herramienta poderosa para ejecutar código Python en la nube. Aquí le explicamos cómo cargar y manipular datasets en minutos.

  1. Suba su archivo CSV desde su equipo o Google Drive.
  2. Use pandas para leerlo y explorarlo:
import pandas as pd

# Cargar el dataset
df = pd.read_csv('archivo.csv')

# Primeras filas
print(df.head())

# Información general
print(df.info())

🧮 Introducción a NumPy en Google Colab

NumPy es la librería base para trabajar con datos numéricos en Python. Ideal para cálculos eficientes y manipulación de arreglos.

  • Arrays: Más rápidos y eficientes que las listas de Python.
  • Operaciones vectorizadas: Permiten realizar cálculos sin ciclos explícitos.
  • Integración: Se complementa con pandas, matplotlib y scikit-learn.
import numpy as np

# Crear un arreglo
a = np.array([1, 2, 3, 4, 5])

# Operación básica
print(a * 2)

📈 Visualizaciones rápidas con Pandas en Colab

Pandas no solo sirve para manejar datos: también permite generar visualizaciones simples sin necesidad de usar otras librerías.

  1. Cargue su DataFrame con pandas.
  2. Use .plot() para visualizar columnas numéricas.
  3. Personalice con parámetros como tipo de gráfico o colores.
import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame({
    'mes': ['Ene', 'Feb', 'Mar', 'Abr'],
    'ventas': [200, 250, 300, 280]
})

df.plot(x='mes', y='ventas', kind='bar', color='orange')
plt.title('Ventas mensuales')
plt.show()

💾 Cómo guardar resultados desde Google Colab

Guardar resultados es clave al trabajar en la nube. Google Colab permite descargar archivos procesados de forma sencilla:

  • CSV: Ideal para almacenar tablas y resultados numéricos.
  • Descarga directa: Puede usar comandos de Colab para descargar a su equipo.
from google.colab import files
import pandas as pd

# Crear DataFrame
df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})

# Guardar como CSV
df.to_csv('resultado.csv', index=False)

# Descargar
files.download('resultado.csv')

No enviamos spam. Puede darse de baja en cualquier momento.