Inicio/Glosario
Diccionario de Datos

Glosario de Términos

Aprende el vocabulario técnico clave que utilizan los analistas y profesionales de datos. Definiciones directas y amigables para estructurar tu conocimiento.

Filtrar:

SQL (Structured Query Language)

Bases de Datos
TL;DR: Lenguaje estándar de programación utilizado para administrar, consultar y manipular bases de datos relacionales.

Es la herramienta fundamental para cualquier analista de datos. Permite realizar consultas mediante sentencias como SELECT, JOIN y GROUP BY para extraer información estructurada de servidores como SQL Server, PostgreSQL o MySQL.

DAX (Data Analysis Expressions)

Power BI
TL;DR: Lenguaje de fórmulas y expresiones matemáticas utilizado en Microsoft Power BI para crear cálculos y medidas personalizadas.

DAX permite realizar cálculos avanzados de modelado de datos e inteligencia de tiempo (Time Intelligence), tales como calcular ventas acumuladas año a fecha (YTD) o variaciones porcentuales año contra año.

ETL (Extract, Transform, Load)

Ingeniería de Datos
TL;DR: Proceso de ingeniería de datos que extrae información de múltiples fuentes, la transforma/limpia y la carga en un repositorio central o Data Warehouse.

En el análisis de datos, el flujo ETL permite automatizar la recolección de archivos planos, bases de datos y APIs para dejarlos unificados y listos para su visualización.

Pandas

Python
TL;DR: Librería de código abierto para el lenguaje de programación Python diseñada para el análisis y manipulación de datos.

Ofrece estructuras de datos potentes como los DataFrames, ideales para realizar limpiezas, filtrados, agrupaciones y análisis estadísticos rápidos sobre grandes volúmenes de datos.

Power Query

Power BI
TL;DR: Motor de conexión y transformación de datos desarrollado por Microsoft para Power BI y Excel.

Permite importar datos desde cientos de fuentes diferentes y realizar limpiezas complejas (como pivotar columnas o filtrar filas) de manera visual y sin escribir código complejo, registrando cada paso en código M.

Machine Learning (Aprendizaje Automático)

Inteligencia Artificial
TL;DR: Rama de la Inteligencia Artificial que permite a los sistemas informáticos aprender de los datos y hacer predicciones de forma autónoma sin programación explícita.

Se clasifica principalmente en aprendizaje supervisado (regresiones y clasificaciones) y no supervisado (clustering). Se implementa principalmente en Python utilizando librerías como Scikit-Learn.

Data Warehouse (Bodega de Datos)

Bases de Datos
TL;DR: Repositorio centralizado que almacena datos integrados de una o más fuentes diferentes para facilitar el análisis y la reportabilidad de negocios.

A diferencia de las bases de datos transaccionales (OLTP), los Data Warehouses (OLAP) están diseñados y optimizados específicamente para realizar consultas rápidas e informes de agregación masivos.

CTE (Common Table Expression)

Bases de Datos
TL;DR: Conjunto de resultados temporal y con nombre que se puede definir dentro de la ejecución de una consulta SELECT, INSERT, UPDATE o DELETE en SQL.

Mejora significativamente la legibilidad y mantenimiento de consultas complejas en SQL, actuando como una tabla virtual temporal en la consulta sin necesidad de crear una tabla física.

Churn (Tasa de Fuga de Clientes)

Negocios & Analytics
TL;DR: Métrica de negocios que mide el porcentaje de clientes que dejan de consumir el servicio o producto de una empresa en un periodo determinado.

Es un indicador crítico para empresas con modelos de suscripción. Utilizando modelos predictivos en Python, es posible anticipar el churn analizando comportamientos de soporte y ausentismo.

KPI (Key Performance Indicator)

Negocios & Analytics
TL;DR: Métrica cuantificable utilizada para evaluar el éxito de una organización, campaña o profesional en el cumplimiento de objetivos estratégicos.

Ejemplos comunes incluyen el Ticket Promedio, Costo de Adquisición de Clientes (CAC) y Margen Neto. Estos se visualizan típicamente en dashboards ejecutivos de Power BI.

Forecasting (Pronóstico de Demanda)

Negocios & Analytics
TL;DR: Proceso estadístico y analítico que predice eventos futuros basado en patrones y datos históricos.

En el análisis logístico y de retail, permite calcular el stock de seguridad necesario y predecir ventas semanales mediante modelos predictivos de series de tiempo de Python.

JOIN

Bases de Datos
TL;DR: Operación de SQL que permite combinar registros de dos o más tablas en una base de datos relacional basada en un campo común.

Los tipos principales son INNER JOIN (coincidencias exactas), LEFT JOIN (todos los de la izquierda más coincidentes de la derecha), RIGHT JOIN y FULL OUTER JOIN.

Python

Python
TL;DR: Lenguaje de programación de alto nivel, interpretado y multipropósito, ampliamente adoptado en ciencia de datos por su legibilidad y robusto ecosistema.

Su popularidad radica en su sintaxis amigable y en la gran cantidad de librerías especializadas (como Pandas, Numpy, Scikit-Learn y TensorFlow) dedicadas al procesamiento y modelamiento de datos.

Modelado Dimensional (Esquema Estrella)

Power BI
TL;DR: Técnica de diseño de bases de datos optimizada para sistemas de Business Intelligence, compuesta por tablas de hechos y tablas de dimensiones.

En Power BI, organizar los datos en un esquema estrella (una tabla central de hechos conectada a dimensiones satélite) optimiza el rendimiento de las consultas y simplifica las fórmulas DAX.

Prompt Engineering

Inteligencia Artificial
TL;DR: Práctica de diseñar, optimizar y refinar instrucciones de entrada (prompts) para guiar el comportamiento y respuestas de modelos de Inteligencia Artificial (LLMs).

Es una habilidad crucial en el desarrollo de software moderno y análisis de datos, permitiendo a los analistas co-programar y automatizar flujos mediante herramientas de IA de forma productiva.

Aprende a aplicar estos conceptos

No te quedes solo en la teoría. Aprende SQL, modelamiento de Power BI y programación en Python mediante proyectos prácticos guiados paso a paso con instructores en vivo.

Explorar Cursos en Vivo