Cover Image for Exinvestigadores destacados de Google han creado un nuevo tipo de agente de inteligencia artificial.

Exinvestigadores destacados de Google han creado un nuevo tipo de agente de inteligencia artificial.

La misión consiste en enseñar a los modelos a comprender de manera más efectiva cómo se puede construir código, lo que conducirá al desarrollo de una inteligencia artificial superinteligente.

Un nuevo tipo de agente de inteligencia artificial, conocido como Asimov, ha sido desarrollado por Reflection, una startup ambiciosa fundada por destacados investigadores en IA provenientes de Google. Este agente está diseñado para comprender cómo se construye el software, analizando una amplia variedad de datos de la empresa, como códigos, correos electrónicos, mensajes de Slack y actualizaciones de proyectos, con el objetivo de conectar todos estos elementos para producir un software acabado.

Reflection aspira a crear una inteligencia artificial superinteligente, un objetivo en el que varios laboratorios de IA importantes también están trabajando. Meta, por su parte, ha establecido un nuevo laboratorio de Superinteligencia, ofreciendo considerable financiamiento a investigadores interesados en participar.

En una visita a la sede de Reflection en Brooklyn, Nueva York, el CEO de la compañía, Misha Laskin, comentó que la forma óptima de construir agentes de IA altamente inteligentes es enseñándoles a dominar la programación, ya que esto les permite interactuar con el mundo de manera más natural. A diferencia de otras empresas que desarrollan agentes que utilizan interfaces humanas y navegan por la web, Laskin, quien tiene experiencia en Google DeepMind, sostiene que esto no resulta natural para un modelo de lenguaje grande. Además, enfatiza que instruir a la IA para entender el desarrollo de software generará asistentes de programación más útiles.

Asimov está estructurado como varios agentes más pequeños trabajando en conjunto. Estos agentes colaboran para entender el código y responder a las consultas de los usuarios. Un agente de razonamiento más grande sintetiza la información recopilada por los agentes más pequeños para ofrecer respuestas coherentes. Reflection asegura que Asimov ya se considera más efectivo que algunas herramientas líderes de IA, ya que, según una encuesta interna, un 82% de los desarrolladores prefirió las respuestas de Asimov en comparación con un 63% para Claude Code de Anthropic.

Daniel Jackson, un científico informático del MIT, considera que el enfoque de Reflection es prometedor debido a su amplia recopilación de información, aunque subraya que los beneficios aún están por confirmarse y que la encuesta no es concluyente. También menciona que tal enfoque podría aumentar los costos computacionales y generar nuevos problemas de seguridad, dado que implicaría el análisis de mensajes privados. Sin embargo, Asimov opera dentro de las nubes privadas virtuales de los clientes, lo que asegura que todos los datos permanezcan bajo su control.

En una reunión con Ioannis Antonoglou, CTO de Reflection, se discutió su experiencia en entrenar modelos de IA para razonar y realizar tareas útiles. Antonoglou, quien fue ingeniero en Google DeepMind, aplicó su conocimiento sobre el aprendizaje por refuerzo, una técnica utilizada en el desarrollo de AlphaGo. Este tipo de aprendizaje, que combina la práctica con retroalimentación positiva y negativa, se ha vuelto relevante en los últimos años para entrenar modelos de lenguaje grande que generen mejores resultados.

Asimov está comenzando a utilizar modelos de código abierto, mientras que Reflection usa el aprendizaje por refuerzo para entrenar modelos personalizados que aseguran un rendimiento superior. En lugar de enfocarse en ganar juegos como Go, el modelo se centra en aprender a construir software completo. La recopilación de datos de diversas áreas de una empresa proporciona a la IA la información necesaria para desarrollar un código de calidad de manera autónoma.

Grandes empresas de inteligencia artificial ya aplican el aprendizaje por refuerzo para optimizar sus agentes. Por ejemplo, una herramienta de OpenAI llamada Deep Research utiliza la información y retroalimentación de expertos para enseñar a un agente a investigar información en sitios web y elaborar reportes. "Hemos creado algo similar a Deep Research, pero para sistemas de ingeniería", mencionó Antonoglou, resaltando que la formación en aspectos más amplios que el código brinda a Reflection una ventaja competitiva.

Stephanie Zhan, socia de la firma de inversión Sequoia, que apoya a Reflection, comentó que la startup "actúa al mismo nivel que los laboratorios de vanguardia". A medida que la industria de la IA avanza hacia la superinteligencia, empresas con mayores recursos, como Meta, están invirtiendo grandes sumas en contratación y construcción de infraestructura, lo que podría hacer más difícil la competencia para startups como Reflection.

Los líderes de Reflection apuntan a que el futuro de sus agentes más avanzados implicaría convertirse en oráculos del conocimiento institucional de las empresas, permitiendo la construcción y reparación autónoma de software, e incluso la invención de nuevos algoritmos y productos. Sin embargo, el próximo paso podría ser menos ambicioso: "Hemos estado hablando con clientes que han comenzado a preguntar si su personal de ventas técnicas o de soporte técnico puede usar esto", indicó Laskin.