
El modelo V-JEPA 2 de Meta capacita a la inteligencia artificial para comprender su entorno.
El modelo V-JEPA 2 de Meta es un "modelo del mundo", lo que indica que está diseñado para comprender su entorno físico.
Meta presentó recientemente su nuevo modelo de inteligencia artificial V-JEPA 2, diseñado para ofrecer a los agentes de IA una comprensión más profunda del entorno que los rodea. Este nuevo modelo es una evolución del V-JEPA anterior, lanzado el año pasado, que se entrenó con más de un millón de horas de video. Este extenso conjunto de datos permite a los robots y otros agentes de IA operar de manera más efectiva en el mundo físico, ayudándoles a comprender y predecir cómo influirán conceptos como la gravedad en una secuencia de eventos.
La esencia de este modelo es similar a la forma en que los niños pequeños y los animales desarrollan su entendimiento del mundo. Por ejemplo, cuando se juega a buscar con un perro, se espera que el animal comprenda que si la pelota rebota en el suelo, caerá en una dirección específica. Meta ilustró situaciones donde un robot, al sostener una placa y una espátula y caminar hacia una estufa con huevos cocidos, puede anticipar que la acción más probable sería usar la espátula para colocar los huevos en el plato.
Además, Meta ha afirmado que V-JEPA 2 es 30 veces más rápido que el modelo Cosmos de Nvidia, que también busca mejorar la inteligencia relacionada con el mundo físico. Sin embargo, se ha señalado que la comparación puede no ser completamente justa, ya que Meta podría estar utilizando criterios de evaluación distintos a los de Nvidia. Yann LeCun, el principal científico de IA de Meta, comentó en un video que creen que los modelos del mundo facilitarán una nueva era para la robótica, permitiendo que los agentes de IA realicen tareas domésticas y físicas sin requerir enormes volúmenes de datos de entrenamiento robótico.