ANÁLISIS

Gemini 2.0 Flash, todo lo que debes saber sobre el modelo más eficiente de Google

Esta es la primera versión experimental de la familia Gemini 2.0. Es el modelo de referencia con baja latencia y rendimiento mejorado a la vanguardia de la tecnología de Google. Admite salidas multimodales, como imágenes generadas de forma nativa mezcladas con texto y audio de conversión de texto a voz (TTS) multilingüe ajustable.

Redacción Impacto TIC

Publicado el 3 de feb. de 2025

Google lanzó el primer modelo de la familia Gemini 2.0 Flash, una versión experimental de Gemini 2.0 Flash. Es el modelo de referencia con baja latencia y rendimiento mejorado a la vanguardia de la tecnología de Google, el cual ya se puede usar de manera gratuita.

Con esta movida Google ha dado un nuevo golpe sobre la mesa en la competencia por la Inteligencia Artificial con el lanzamiento de Gemini 2.0 Flash, su modelo más eficiente hasta la fecha, diseñado para integrarse plenamente en dispositivos móviles. Con esta actualización, la compañía busca reforzar su estrategia frente a rivales de modelos de razonamiento como OpenAI y DeepSeek, que han redefinido el panorama de la IA con modelos altamente optimizados. La gran apuesta de Google es consolidar Gemini como el sucesor natural de Google Assistant, permitiendo a los usuarios acceder a una IA más rápida, precisa y con un mayor rango de capacidades sin depender de recursos computacionales masivos.

La eficiencia energética y de procesamiento es clave en esta nueva versión, lo que le permite ejecutar tareas avanzadas en dispositivos móviles sin necesidad de infraestructura de alto rendimiento. Gemini 2.0 Flash promete ofrecer respuestas más ágiles, generación de contenido creativo y una interacción más natural con los usuarios, gracias a su capacidad para comprender lenguaje natural y trabajar con múltiples formatos de información.

Índice de temas

Conoce Gemini 2.0 Flash

Gemini 2.0 Flash se basa en el éxito del 1.5 Flash, el modelo de razonamiento más popular entre los desarrolladores, con un rendimiento mejorado y tiempos de respuesta igual de rápidos. En concreto, 2.0 Flash supera incluso al 1.5 Pro en las principales pruebas, con una velocidad que se duplica.

Flash 2.0 también viene con nuevas funciones. Además de admitir entradas multimodales, como imágenes, vídeo y audio, Flash 2.0 admite salidas multimodales, como imágenes generadas de forma nativa mezcladas con texto y audio de síntesis de voz multilingüe (TTS) ajustable. También puede acceder de forma nativa a herramientas como la Búsqueda de Google, la ejecución de código y las funciones de terceros definidas por el usuario.

Este nuevo modelo ofrece un rendimiento mejorado y tiempos de respuesta igual de rápidos, superando incluso al 1.5 Pro en las principales pruebas con una velocidad duplicada. Flash 2.0 presenta nuevas funciones, ya que admite entradas multimodales, como imágenes, vídeo y audio, y salidas multimodales, como imágenes generadas y síntesis de voz multilingüe.

Gemini 2.0 Flash, acceso y disponibilidad

Google se compromete a proporcionar sus modelos de forma segura y rápida. Tras compartir las primeras versiones experimentales de Gemini 2.0, los comentarios de los desarrolladores han sido excelentes. Actualmente, Gemini 2.0 Flash está disponible como modelo experimental a través de la API de Gemini en Google AI Studio y Vertex AI, con entrada multimodal y salida textual para los socios con acceso anticipado.

La nota de Sundar Pichai, director ejecutivo de Google y Alphabet

El director ejecutivo de Google y Alphabet, Sundar Pichai, publicó una nota en el blog de la empresa en la que dice:

“Hoy estamos superando los límites de la IA para organizar esta información a partir de cada entrada y ponerla a disposición en cualquier plataforma, ofreciendo un valor real para todos. (…) Durante el último año, invertimos en desarrollar más modelos, que puedan comprender mejor el mundo que lo rodea, anticipar más pasos y actuar en su nombre, bajo su supervisión.

Hoy nos entusiasma lanzar Gemini 2.0, nuestra tecnología más avanzada, lista para una era de IA aún más versátil. Con salidas de imagen y audio nativas y herramientas integradas, Gemini 2.0 allana el camino hacia el asistente universal del futuro.

Gemini 2.0 está ahora en manos de desarrolladores y evaluadores de confianza, ya que trabajamos para integrarlo rápidamente en nuestros productos, empezando por Gemini y Google Search. A partir de hoy, todos los usuarios de Gemini podrán acceder al modelo experimental Gemini 2.0 Flash. Además, presentamos una funcionalidad diseñada para ayudarle con investigaciones complejas, aprovechando las habilidades de razonamiento avanzadas y los contextos extensos para producir informes detallados para usted. Esta función ya está activa en Gemini Advanced. (…) Como siguiente paso, incorporaremos las habilidades de razonamiento avanzadas de Gemini 2.0 a AI Overview para abordar temas más complejos y preguntas de varios pasos, como ecuaciones matemáticas avanzadas, consultas multimodales y escritura de código.

Comenzamos las pruebas limitadas esta semana y esperamos una implementación más amplia a principios del año que viene. También seguiremos llevando la visión general de la IA a más países e idiomas durante el próximo año. El progreso de Gemini 2.0 se basa en más de una década de inversiones en nuestro exclusivo enfoque integral de innovación en IA.

El modelo es compatible con hardware personalizado como Trillium, nuestra sexta generación de TPU. Estos TPU gestionaban completamente el entrenamiento y la inferencia de Gemini 2.0. A partir de hoy, Trillium está disponible para todos los clientes, lo que les permite explotar su potencial. Gemini 1.0 nos ayudó a organizar y comprender la información, pero con Gemini 2.0, el objetivo es transformarla en herramientas más útiles“.

Nuevas API para aplicaciones interactivas

Para apoyar el desarrollo de aplicaciones dinámicas, Google ha lanzado una nueva API Multimodal Live, que ofrece entradas de audio y vídeo en tiempo real. Encontrará más información sobre Flash 2.0 y la API Multimodal Live en blog para desarrolladores de Google.

Gemini 2.0 en la aplicación Gemini

Los usuarios de Gemini pueden acceder a una versión optimizada del chat de Flash Experimental 2.0 a través del menú desplegable de modelos en la web móvil y de escritorio, que se lanzará próximamente en la aplicación móvil Gemini. Este nuevo modelo permite a los usuarios disfrutar de un asistente Gemini aún más útil.

Experiencias de agencia con Gemini 2.0

Las capacidades avanzadas de Gemini 2.0 Flash, como el razonamiento multimodal y la comprensión del contexto, allanan el camino para una nueva clase de experiencias de agencia. Google está explorando esta frontera con prototipos como Project Astra, Project Mariner y Jules, que pueden ayudar a las personas a realizar tareas complejas.

Proyecto Astra: comprensión multimodal

Google ha introducido el Proyecto Astra, probado en teléfonos inteligentes Android, lo que ha mejorado el diálogo multilingüe y el uso de herramientas como Google Lens y Maps. Con una memoria mejorada y una latencia reducida, este asistente de IA se vuelve más personalizado y útil para los usuarios.

Project Mariner: simplificación de tareas

Project Mariner, es un prototipo avanzado para Chrome, ofrece nuevas formas de interactuar desde el navegador, lo que demuestra que es técnicamente posible navegar con la ayuda de un agente de IA. Google continúa explorando nuevos riesgos y soluciones para garantizar un desarrollo seguro y responsable.

Jules: agentes desarrolladores

Google está explorando el uso de agentes de IA con Jules, un agente experimental que se integra en el flujo de trabajo de GitHub y propone soluciones para problemas de desarrollo bajo la supervisión del desarrollador.

Creación responsable en la era de los agentes

Google explora las fronteras de la IA con Gemini 2.0 Flash, manteniendo su compromiso con un desarrollo responsable y seguro. Colabora con expertos para mitigar los riesgos y garantizar la seguridad, sin dejar de priorizar la responsabilidad en su proceso de desarrollo.

Google celebra un momento clave en la evolución de Gemini y continúa explorando con seguridad las posibilidades que lo acercan cada vez más a la Inteligencia Artificial general (AGI).

Prohibida su reproducción total o parcial.

Fuente: Ai4business.it, Network Digital360

Temas

Canales