Meta Platforms lanzó Llama 3.1 405B, que es la mejor versión de sus modelos de inteligencia artificial (IA), que tendrá mejoras en habilidades multilingües y métricas generales de rendimiento, con lo que busca pisarle los talones a los modelos de pago de rivales como OpenIA.
Con el lanzamiento del modelo (Llama 3) estamos impulsando la innovación, con oportunidades de crecimiento y explotación sin precedentes
se lee en el comunicado de Meta Platforms.
El nuevo lanzamiento de la compañía de Mark Zuckerberg puede conversar en ocho idiomas, escribir código informático de mayor calidad y resolver problemas matemáticos más complejos que las versiones anteriores.
La publicación se produce en un momento en el que las empresas tecnológicas se apresuran a demostrar que sus crecientes carteras de modelos de lenguaje de gran tamaño pueden ofrecer ganancias significativas en áreas problemáticas como el razonamiento avanzado, para justificar las sumas que se han invertido en ellos.
A pesar de ello, Meta puso a disposición sus modelos Llama de forma gratuita, como parte de una estrategia, que según Zuckerberg dará frutos en forma de productos innovadores y una mayor participación en las principales redes sociales de la compañía.
Las mejoras en Llama 3.1
De acuerdo con la compañía, en comparación con las versiones anteriores del modelo se ha mejorado la cantidad y calidad de los datos utilizados en el preentrenamiento y postentrenamiento, con mejoras que incluyen curación y desarrollo de enfoques de filtrado.
Además, se mejoró la calidad y capacidad de seguir instrucciones detalladas de los modelos en respuesta a las instrucciones de los usuarios, que garantizan altos niveles de seguridad.
Asimismo, Meta permite la descarga del modelo con lo que los desarrolladores pueden personalizarlo según sus necesidades y aplicaciones, de este modo, los desarrolladores pueden ejecutarlas en cualquier entorno, ya sea en la nube o incluso localmente en un portátil sin tener que compartir datos con la compañía.
De este modelo, la comunidad de desarrolladores pueden aprovechar mejor el potencial de la IA generativa
explicó la compañía.
IA de Meta podría superar a ChatGPT
Aunque el progreso en el desarrollo de la IA es complicado de medir, los resultados de las pruebas proporcionados por Meta parecían sugerir que su modelo Llama 3 casi igualaba y, en algunos casos, superaba a Claude 3.5 Sonnet, de Anthropic y a GPT-4o, de OpenAI.
En la prueba MATH de problemas matemáticos de nivel competitivo, por ejemplo, el modelo de la compañía de Mark Zuckerberg obtuvo una puntuación de 73.8 frente a los 76.6 de GPT-40 y los 71.1 de Claude 3.5 Sonnet.
El modelo obtuvo una puntuación de 88.6 en MMLU —una prueba de referencia que abarca docenas de asignaturas de matemáticas, ciencias y humanidades— mientras que el último modelo de OpenAI obtuvo 88.7 y Claude 3.5 presentó 88.3.
Hoy, damos inicio a una nueva era con el código abierto liderando el camino presentado por Llama 3.1 405B, que creemos que es el modelo de lenguaje a gran escala de código abierto más potente hasta la fecha
afirmó Meta en el comunicado.
Con información de Reuters
También puedes leer: