Gemini Diffusion es el innovador modelo de lenguaje de Google DeepMind que aplica la técnica de difusión, antes usada en generación de imágenes, a la generación de texto. Presentado en Google I/O 2025, este modelo supone un cambio respecto a los modelos tradicionales, ofreciendo mayor velocidad y coherencia en los textos generados.
¿Cómo funciona?
- Enfoque de difusión: En vez de generar texto palabra por palabra, Gemini Diffusion parte de ruido aleatorio y lo refina progresivamente hasta obtener texto coherente, como si esculpiera el contenido.
- Generación por bloques: Trabaja con bloques completos de texto, lo que permite mantener la coherencia y el sentido global durante todo el proceso.
- Corrección de errores: Su proceso iterativo le permite corregir errores sobre la marcha, mejorando la precisión y la fluidez, especialmente útil para programación y edición de textos.
Características clave
- Velocidad: Puede generar hasta 1,479 tokens por segundo, mucho más rápido que los modelos anteriores de Google.
- Coherencia: Al trabajar con bloques, los textos son más consistentes y lógicos.
- Rendimiento en código y matemáticas: Destaca en tareas de programación y razonamiento matemático complejo.
Impacto potencial
Gemini Diffusion promete eficiencia y menor coste computacional para tareas específicas. Aunque por ahora solo está disponible como demo de investigación y con lista de espera, podría redefinir el panorama de la IA en generación de texto y código.