La presencia omnipresente de la inteligencia artificial es innegable, y en la carrera por dominar esta tecnología, todos aspiran a liderar. Gigantes tecnológicos como Google y Microsoft han estado inmersos en el desarrollo de IA en un contexto científico durante años. Sin embargo, OpenAI cambió el juego al enfocarse en la visibilidad y el reconocimiento público con su IA GPT y la herramienta ChatGPT. Desde entonces, Google ha estado esforzándose por recuperar su posición dominante. Inicialmente con Bard y ahora, con un impulso renovado en el ámbito de la inteligencia artificial, presenta Gemini, su modelo de IA más avanzado hasta la fecha.
Bard fue la primera respuesta de Google a OpenAI, intentando posicionarse como la alternativa a ChatGPT. Con Gemini, Google aspira a eclipsar a GPT, el modelo de inteligencia artificial de OpenAI, ofreciendo al mundo un modelo de IA superior. El lanzamiento de Gemini fue anunciado por Sundar Pichai, CEO de Google y su empresa matriz Alphabet, y Demis Hassabis, CEO y cofundador de DeepMind, una compañía pionera en el campo de la inteligencia artificial adquirida por Google hace años.
Este anuncio representa un movimiento estratégico significativo para Google. El titular proclama “Introduciendo Gemini: nuestro modelo de IA más grande y avanzado”. Seguido por un eslogan que se ha convertido en un mantra común entre los desarrolladores de IA: “Haciendo que la IA sea más útil para todos”. Pero surge la pregunta, ¿qué es exactamente Gemini? ¿Qué implicaciones tiene para nosotros y qué busca Google ofrecer con este nuevo modelo de IA?
¿Qué es Google Gemini?
Cuando Microsoft decidió integrar la IA GPT de OpenAI en su buscador Bing, rápidamente se hizo evidente que el siguiente paso sería incorporar inteligencia artificial generativa en otros productos y servicios de Microsoft, tales como Office 365 (Word, Excel, Outlook, etc.), Windows (a través de Copilot) y muchos más. Siguiendo este enfoque, Google también planea potenciar su gama de servicios y productos en línea con capacidades de IA. Aunque Google ya utiliza IA en varias de sus aplicaciones en línea y móviles, su integración se hará cada vez más evidente para el usuario final.
Como menciona Sundar Pichai en el anuncio de Gemini, “millones de personas ya están utilizando IA generativa en nuestros productos” para “encontrar respuestas a preguntas complejas” y en tareas de creación y colaboración. Asimismo, empresas y desarrolladores están aprovechando los modelos de IA para crear aplicaciones basadas en IA generativa.
Gemini es un desarrollo vinculado a Google DeepMind, uno de los múltiples brazos de Google dedicados a la inteligencia artificial. En su sitio web oficial, alojado en el dominio de DeepMind, se detalla que este ambicioso y potente modelo de IA de Google es multimodal, capaz de trabajar con texto, imágenes, videos, audio y código.
Google compara Gemini con GPT-4, afirmando que supera a este último en tareas como responder preguntas, razonar, resolver problemas matemáticos y programar código. Además, destaca en su capacidad para procesar imágenes, videos y audio, entendiendo, descifrando y razonando sobre lo que "ve" u "oye".
Te podrá interesar: Copilot se Actualiza con GPT-4 Turbo y DALL·E 3 Mejorado
Tres Versiones de Gemini para Elegir
Google Gemini se ofrece en tres versiones, adaptadas a distintos usuarios y necesidades. Estas versiones son:
- Gemini Ultra: La más completa, destinada a tareas altamente complejas.
- Gemini Pro: Una versión intermedia, ideal para usuarios avanzados y profesionales.
- Gemini Nano: La versión más eficiente, diseñada para funcionar en dispositivos como computadoras y teléfonos móviles.
Gemini es capaz de realizar diversas tareas generativas, como se muestra en ejemplos en su página oficial: escribir código a partir de solicitudes en forma de texto, imagen, video o audio, generar texto e imágenes, y analizar e interpretar imágenes.
Demis Hassabis, CEO y cofundador de DeepMind, explica que “Gemini fue diseñado desde el principio para ser multimodal y preentrenado en diferentes modalidades, luego se refinó con datos adicionales para mejorar su eficacia. Esto permite a Gemini entender y razonar sin problemas sobre diferentes tipos de entradas, superando a modelos multimodales existentes en casi todos los dominios”.
Te podrá interesar leer: Descubre Cómo Activar y Aprovechar al Máximo CoPilot
Inteligencia Artificial Fiable, Escalable y Eficiente
La eficiencia en el consumo de recursos es clave, especialmente considerando que tareas específicas pueden requerir supercomputadoras. Dada la integración de Gemini en servicios populares como Google Search, YouTube, Gmail, Google Maps, Google Play y Android, se prevén millones de peticiones simultáneas.
Para manejar esta demanda, Google ha desplegado Cloud TPU v5p, un superordenador de IA, que forma parte de Google Cloud. Esta infraestructura se describe como “una arquitectura innovadora de supercomputación que utiliza un sistema integrado de hardware optimizado, software abierto y modelos de consumo flexibles”.
¿Cómo Empezar a Usar Gemini?
Gemini 1.0 ya está integrado en varios productos y servicios de Google. Por ejemplo, Bard utiliza Gemini Pro. Aunque actualmente está limitado al inglés, está disponible en más de 170 países.
Gemini también se encuentra en los teléfonos Pixel, como el Pixel 8 Pro, el cual es “el primer teléfono inteligente diseñado para ejecutar Gemini Nano”. Pronto, Gemini estará presente en Google Search, Google Ads, Google Chrome y Due AI. Además, los desarrolladores y empresas podrán acceder a Gemini Pro a través de Google AI Studio o Google Cloud Vertex AI.
Finalmente, Gemini Ultra se lanzará próximamente, enfocado a un grupo selecto de clientes y desarrolladores. Además, se espera la llegada de Bard Advanced el próximo año, integrando Gemini Ultra.
Conclusión
Google Gemini representa una nueva era en el campo de la inteligencia artificial. Con su capacidad para aprender de manera autónoma y adaptarse a nuevos entornos, este proyecto no solo mejora las aplicaciones existentes de la IA sino que también abre la puerta a innovaciones futuras. A medida que Google Gemini evoluciona, es crucial seguir explorando sus aplicaciones prácticas y abordar los desafíos éticos y de privacidad asociados con su uso.