Google presenta Gemini 3 Flash con respuestas en menos de 300 ms

Presentó la versión optimizada de Gemini 3, llamada Gemini 3 Flash, que reduce drásticamente el tiempo de respuesta de la IA a menos de 300 milisegundos.

|
Autor: Especial
Compartir noticia en twitter
Compartir noticia en facebook
Compartir noticia por whatsapp
Compartir noticia por Telegram
Compartir noticia en twitter
Compartir noticia en facebook
Compartir noticia por whatsapp
Compartir noticia por Telegram

Google DeepMind desplegó esta semana la versión definitiva de Gemini 3 Flash, un modelo de inteligencia artificial optimizado para alcanzar una velocidad de respuesta casi humana al interactuar por voz o texto.

Este avance reduce los tiempos de espera tradicionales, que antes podían superar uno o dos segundos, a menos de 300 milisegundos, acercando la experiencia conversacional a la fluidez propia de una interacción humana.

Los desarrolladores de DeepMind explicaron que esta mejora no solo se basa en mayor potencia de cómputo, sino en una arquitectura más eficiente, que incluye técnicas como la “predicción de tokens de flujo continuo” —que acelera el procesamiento sin sacrificar calidad— y el uso de hardware especializado de última generación.

Cambio en la experiencia de uso de inteligencia artificial

Según Google, la optimización de Gemini 3 Flash permite que la herramienta responda casi en tiempo real, eliminando lo que muchos usuarios describen como el “silencio incómodo” entre una pregunta y la respuesta de la IA.

La nueva versión también es capaz de reaccionar a variaciones en la voz y ajustar sus respuestas de manera más natural durante las conversaciones.

La mejora en los tiempos de respuesta representa un avance significativo respecto a modelos anteriores, y abre posibilidades para que la IA sea utilizada en aplicaciones que requieren interacciones rápidas y fluidas, como asistentes de voz, agentes conversacionales o servicios que dependen de respuesta inmediata sin interrupciones perceptibles.

Gemini 3 Flash y su enfoque en eficiencia

Gemini 3 Flash fue diseñado con una arquitectura de procesamiento paralelo que reduce la latencia al procesar entradas y generar respuestas, lo que le permite competir con los tiempos de respuesta propios de una conversación humana normal, estimados entre 200 y 400 milisegundos.

Con información de FayerWayer

Lo más leído

skeleton





skeleton