Google presenta el modelo de IA de código abierto ultrapequeño y eficiente Gemma 3 270M que puede ejecutarse en teléfonos inteligentes


Crédito: VentureBeat realizado con Midjourney
¿Quieres recibir información más inteligente en tu bandeja de entrada? Suscríbete a nuestros boletines semanales para recibir solo lo que importa a los líderes empresariales en IA, datos y seguridad. Suscríbete ahora.
El equipo de investigación de inteligencia artificial DeepMind de Google ha presentado hoy un nuevo modelo de inteligencia artificial de código abierto, Gemma 3 270M.
Como su nombre lo sugiere, este es un modelo de 270 millones de parámetros , mucho más pequeño que los 70 mil millones o más de parámetros de muchos LLM de frontera (los parámetros son la cantidad de configuraciones internas que rigen el comportamiento del modelo).
Si bien más parámetros generalmente se traducen en un modelo más grande y más poderoso, el enfoque de Google con esto es casi lo opuesto: alta eficiencia, brindando a los desarrolladores un modelo lo suficientemente pequeño como para ejecutarse directamente en teléfonos inteligentes y localmente , sin una conexión a Internet , como se muestra en pruebas internas en un Pixel 9 Pro SoC.
Sin embargo, el modelo todavía es capaz de manejar tareas complejas y específicas del dominio y puede ajustarse rápidamente en cuestión de minutos para adaptarse a las necesidades de una empresa o un desarrollador independiente.
La escalabilidad de la IA alcanza sus límites
Los límites de potencia, el aumento del coste de los tokens y los retrasos en la inferencia están transformando la IA empresarial. Únase a nuestro exclusivo salón para descubrir cómo los mejores equipos:
- Convertir la energía en una ventaja estratégica
- Arquitectura de inferencia eficiente para obtener ganancias de rendimiento reales
- Cómo desbloquear el ROI competitivo con sistemas de IA sostenibles
Reserva tu lugar para estar a la vanguardia : https://bit.ly/4mwGngO
En la red social X , el ingeniero de relaciones con desarrolladores de inteligencia artificial de Google DeepMind, Omar Sanseviero, agregó que Gemma 3 270M también puede ejecutarse directamente en el navegador web de un usuario, en una Raspberry Pi y "en su tostadora", lo que subraya su capacidad para operar en hardware muy liviano.
Gemma 3 270M combina 170 millones de parámetros de incrustación (gracias a un amplio vocabulario de 256k capaz de gestionar tokens raros y específicos) con 100 millones de parámetros de bloque de transformador.
Según Google, la arquitectura permite un sólido desempeño en tareas de seguimiento de instrucciones desde el primer momento y, al mismo tiempo, es lo suficientemente pequeña para permitir un rápido ajuste e implementación en dispositivos con recursos limitados, incluido el hardware móvil.
Gemma 3 270M hereda la arquitectura y el preentrenamiento de los modelos Gemma 3 más grandes, lo que garantiza la compatibilidad en todo el ecosistema Gemma. Con documentación, recetas de ajuste y guías de implementación disponibles para herramientas como Hugging Face, UnSloth y JAX, los desarrolladores pueden pasar rápidamente de la experimentación a la implementación.
En el índice de referencia IFEval, que mide la capacidad de un modelo para seguir instrucciones , el Gemma 3 270M optimizado para instrucciones obtuvo un puntaje de 51.2% .
La puntuación lo sitúa muy por encima de modelos similares pequeños como SmolLM2 135M Instruct y Qwen 2.5 0.5B Instruct , y más cerca del rango de rendimiento de algunos modelos de mil millones de parámetros, según la comparación publicada por Google.
Sin embargo, como señalaron los investigadores y líderes de la startup rival de IA Liquid AI en las respuestas en X, Google omitió el modelo LFM2-350M de Liquid, lanzado en julio de este año, que obtuvo un enorme puntaje de 65,12 % con solo unos pocos parámetros más (modelo de lenguaje de tamaño similar, sin embargo).
Una de las fortalezas del modelo es su eficiencia energética. En pruebas internas con el modelo cuantificado INT4 en un SoC Pixel 9 Pro, 25 conversaciones consumieron tan solo el 0,75 % de la batería del dispositivo.
Esto hace que Gemma 3 270M sea una opción práctica para la IA en el dispositivo, particularmente en casos donde la privacidad y la funcionalidad fuera de línea son importantes.
La versión incluye un modelo previamente entrenado y otro adaptado a las instrucciones, lo que ofrece a los desarrolladores una utilidad inmediata para tareas generales de seguimiento de instrucciones.
También están disponibles los puntos de control entrenados con conocimiento de cuantificación (QAT), lo que permite la precisión INT4 con una pérdida de rendimiento mínima y prepara el modelo para producción en entornos con recursos limitados.
Google presenta a Gemma 3 270M como parte de una filosofía más amplia de elegir la herramienta adecuada para el trabajo en lugar de confiar en el tamaño del modelo en bruto.
Para funciones como análisis de sentimientos, extracción de entidades, enrutamiento de consultas, generación de texto estructurado, controles de cumplimiento y redacción creativa, la empresa afirma que un modelo pequeño y afinado puede ofrecer resultados más rápidos y rentables que uno grande de propósito general.
Los beneficios de la especialización son evidentes en trabajos anteriores, como la colaboración de Adaptive ML con SK Telecom.
Al ajustar un modelo Gemma 3 4B para la moderación de contenido multilingüe, el equipo superó a sistemas propietarios mucho más grandes.
Gemma 3 270M está diseñado para permitir un éxito similar a una escala aún menor, respaldando flotas de modelos especializados adaptados a tareas individuales.
La aplicación de demostración Bedtime Story Generator muestra el potencial de Gemma 3 270MMás allá del uso empresarial, el modelo también se adapta a escenarios creativos. En un video de demostración publicado en YouTube , Google muestra una aplicación generadora de cuentos para dormir desarrollada con Gemma 3 270M y Transformers.js que funciona completamente sin conexión en un navegador web, lo que demuestra la versatilidad del modelo en aplicaciones ligeras y accesibles.
El video destaca la capacidad del modelo para sintetizar múltiples entradas al permitir selecciones para un personaje principal (por ejemplo, "un gato mágico"), un escenario ("en un bosque encantado"), un giro en la trama ("descubre una puerta secreta"), un tema ("Aventurero") y una duración deseada ("Corto").
Una vez configurados los parámetros, el modelo Gemma 3 270M genera una historia coherente e imaginativa. La aplicación teje un relato breve y aventurero basado en las elecciones del usuario, demostrando la capacidad del modelo para generar texto creativo y contextualizado.
Este video sirve como un poderoso ejemplo de cómo el liviano pero capaz Gemma 3 270M puede impulsar aplicaciones rápidas, atractivas e interactivas sin depender de la nube , lo que abre nuevas posibilidades para las experiencias de IA en el dispositivo.
Gemma 3 270M se lanza bajo los Términos de uso de Gemma, que permiten el uso, la reproducción, la modificación y la distribución del modelo y sus derivados, siempre que se cumplan ciertas condiciones.
Esto incluye la aplicación de las restricciones de uso descritas en la Política de Uso Prohibido de Google, la entrega de las Condiciones de Uso a los destinatarios posteriores y la indicación clara de cualquier modificación realizada. La distribución puede ser directa o a través de servicios alojados, como API o aplicaciones web.
Para equipos empresariales y desarrolladores comerciales, esto significa que el modelo puede integrarse en productos, implementarse como parte de servicios en la nube o perfeccionarse en derivados especializados, siempre que se respeten los términos de la licencia. Google no reclama los resultados generados por el modelo, lo que otorga a las empresas plenos derechos sobre el contenido que crean.
Sin embargo, los desarrolladores son responsables de garantizar el cumplimiento de las leyes aplicables y de evitar usos prohibidos, como generar contenido dañino o violar las reglas de privacidad.
La licencia no es de código abierto en el sentido tradicional, pero permite un amplio uso comercial sin una licencia paga separada.
Para las empresas que crean aplicaciones de IA comerciales, las principales consideraciones operativas son garantizar que los usuarios finales estén sujetos a restricciones equivalentes, documentar las modificaciones del modelo e implementar medidas de seguridad alineadas con la política de usos prohibidos.
Ahora que Gemmaverse ha superado los 200 millones de descargas y la línea Gemma abarca variantes optimizadas para la nube, el escritorio y los dispositivos móviles, los desarrolladores de IA de Google están posicionando a Gemma 3 270M como una base para crear soluciones de IA rápidas, rentables y centradas en la privacidad, y ya parece un gran comienzo.
Si quieres impresionar a tu jefe, VB Daily te tiene cubierto. Te ofrecemos información exclusiva sobre lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, para que puedas compartir tus conocimientos y maximizar el retorno de la inversión.
Lea nuestra Política de Privacidad
Gracias por suscribirte. Consulta más boletines de VB aquí .
Se produjo un error.

venturebeat