Hace pocos días, Meta anunció el lanzamiento de Llama 3, el modelo de Inteligencia Artificial de código abierto desarrollado por este gigante que vendrá en 3 sabores, 2 de los cuales ya han sido liberados al mercado para que los usuarios puedan “jugar” con ellos.
Las 2 versiones liberadas vienen en dos tamaños: la pequeña de 8.000 millones de parámetros y la mediana de 70.000 millones. La versión grande de Llama 3 vendrá con 400.000 millones de parámetros, superando en este aspecto a competidores como Claude Sonnet y Mistral Medium.
Por cierto, la versión grande todavía se está entrenando y por ello no ha sido liberada. También vale la pena destacar que Llama 3 será la base que potencie a Meta AI, el chatbot de inteligencia artificial detrás de WhatsApp, Instagram y Messenger.
¿Por qué es tan importante Llama 3?
El último anuncio de Meta es llamativo porque, de ser ciertas las métricas de evaluación liberadas recientemente y que están disponibles en este enlace, entonces tendríamos un modelo de Inteligencia Artificial libre, de código abierto, tan potente como los sistemas propietarios del mercado.
Gracias a ello, la comunidad podría tomar estos modelos y aplicarlos como quieran, beneficiando la innovación. Como muestra, con Llama 3 es posible construir un GPT, un chat con Inteligencia Artificial en minutos de forma gratuita en plataformas como Hugging Chat.
Anunciado originalmente en abril de 2023 como el gran modelo de lenguaje (LLM) de Meta que iba a ser usado con fines científicos y de acceso limitado, esta fue filtrada de manera ilegal en el foro 4Chan apenas 2 semanas después de su anuncio. De hecho, muchos sospechan de lo fácil que ocurrió esta filtración.
Futuro y hermano mayor
Aunque estos modelos mejoran con el tiempo, la realidad es que Llama 3 está optimizado para trabajar en inglés. De hecho, apenas el 5% del conjunto de datos de pre-entrenamiento de Llama 3 está conformado por datos en lengua no inglesa abarcando más de 30 idiomas.
Sin embargo, Meta ha dejado claro que desea que Llama 3 sea una Inteligencia Artificial multimodal y multilingüe. Recordemos que cuando hablamos de multimodalidad nos referimos a los sistemas capaces de comprender y procesar información proveniente de diversas fuentes como imágenes, texto, audio, datos clínicos, entre otras posibilidades.
En lo que refiere al hermano mayor de Llama 3, que aún está en entrenamiento, este será destinado a proyectos grandes de laboratorios, grandes empresas o centros académicos, y aunque está generando mucha expectativa, lo más conveniente es esperar por mediciones independientes.
Por último, lo más conveniente ahora es esperar qué hará OpenAI, la propietaria de ChatGPT: ¿Esta última jugada de Meta los forzará a responder antes de lo esperado? ¿Sacarán nuevas versiones de ChatGPT? Por ahora, debemos esperar, pero la feroz guerra de la Inteligencia Artificial está para comer crispetas.