
Guía sencilla de los términos más comunes en IA: desde LLMs hasta alucinaciones.
Consideramos que sería útil crear un glosario que contenga definiciones de algunas de las palabras y frases más relevantes que utilizamos en nuestros artículos.
En el campo de la inteligencia artificial, el uso de terminología técnica y jerga es común entre los científicos. Esta complejidad puede dificultar la comprensión del trabajo que se realiza en el sector. Por ello, se ha elaborado un glosario que define términos clave de la industria, el cual se actualizará periódicamente para incluir nuevas contribuciones a medida que los investigadores descubren métodos innovadores y abordan riesgos emergentes de seguridad.
AGI
La inteligencia general artificial, o AGI, es un término que se refiere a una inteligencia artificial que puede realizar tareas en un nivel superior al humano promedio en diversas áreas. Según Sam Altman, CEO de OpenAI, AGI podría compararse con un compañero de trabajo que es el equivalente a un humano medio. Sin embargo, este concepto varía entre organizaciones como OpenAI y Google DeepMind, que lo definen de maneras ligeramente diferentes.
Agente de IA
Un agente de IA es una herramienta que utiliza tecnologías de inteligencia artificial para ejecutar tareas en nombre del usuario, y va más allá de lo que un chatbot básico puede ofrecer. Ejemplos de estas tareas incluyen gestionar gastos, realizar reservas y escribir o mantener código. La interpretación de "agente de IA" puede variar según la perspectiva, y la infraestructura está en construcción para cumplir con sus capacidades esperadas.
Cadena de pensamiento
La cadena de pensamiento en modelos de lenguaje grandes implica descomponer un problema en pasos intermedios para mejorar la calidad de la respuesta final. Aunque este enfoque puede tardar más tiempo, generalmente lleva a resultados más precisos en contextos como la lógica o la programación.
Aprendizaje profundo
Este enfoque es un subconjunto del aprendizaje automático que usa redes neuronales artificiales con múltiples capas, permitiéndoles establecer correlaciones complejas en comparación con sistemas de aprendizaje automático más simples. Los modelos de aprendizaje profundo pueden identificar características importantes en los datos sin intervención humana.
Difusión
La difusión es una técnica utilizada en muchos modelos de generación de arte, música y texto. Se basa en la idea física de destruir gradualmente la estructura de los datos mediante la adición de ruido, con el objetivo de aprender a restaurar esos datos a través de un proceso inverso.
Destilación
Esta técnica permite extraer conocimiento de un modelo de IA más grande mediante un sistema de "maestro-alumno". El modelo maestro genera respuestas que son utilizadas para entrenar a un modelo alumno, optimizando así la eficiencia de este último.
Ajuste fino
El ajuste fino se refiere al entrenamiento adicional de un modelo de IA para optimizar su rendimiento en tareas específicas. Muchas startups de IA utilizan modelos de lenguaje grandes como base para crear productos comerciales, mejorando su utilidad con datos especializados.
GAN
Las Redes Generativas Antagónicas (GAN) son un marco de aprendizaje automático clave en la IA generativa, que hace posible producir datos realistas. Las GANs funcionan con dos redes neuronales que compiten entre sí, lo que permite mejorar la precisión de los datos generados.
Alucinación
El término alucinación se refiere a cuando los modelos de IA generan información incorrecta, lo que puede ser dañino. Este problema está vinculado a vacíos en los datos de entrenamiento y ha llevado a un impulso hacia modelos de IA más especializados y específicos.
Inferencia
La inferencia es el proceso de ejecutar un modelo de IA para hacer predicciones basadas en datos previamente vistos. Este proceso requiere que los modelos hayan sido entrenados previamente para identificar patrones.
Modelo de lenguaje grande (LLM)
Los LLM son usados por asistentes de inteligencia artificial populares, como ChatGPT y otros. Estos modelos procesan solicitudes, generando respuestas significativas a partir de patrones aprendidos en grandes volúmenes de texto.
Red neuronal
Una red neuronal es la estructura algorítmica detrás del aprendizaje profundo, inspirada en la conectividad del cerebro humano. Esta arquitectura ha permitido grandes avances en el rendimiento de sistemas de IA en diversas áreas.
Entrenamiento
El entrenamiento de modelos de IA implica la introducción de datos para que el sistema aprenda patrones y produzca resultados útiles. Este proceso es fundamental para modelar su funcionamiento y eficiencia.
Aprendizaje por transferencia
Esta técnica permite utilizar un modelo ya entrenado como base para desarrollar uno nuevo, aplicando el conocimiento previo a tareas relacionadas, lo que puede acelerar el desarrollo.
Pesos
Los pesos son parámetros numéricos en el entrenamiento de IA que determinan la importancia de diferentes variables en el conjunto de datos utilizado. Las modificaciones en estos pesos durante el entrenamiento son claves para que el modelo refine sus salidas.