Google desafía a OpenAI: afirman que Gemini supera a ChatGPT

En un año marcado por los avances en inteligencia artificial, Google ha dado un golpe sobre la mesa con el lanzamiento de Gemini, su última herramienta de IA. La empresa, que anteriormente se consideraba rezagada en este ámbito, ha demostrado un cambio notable con modelos como Bard y nuevas funciones en sus aplicaciones. Ahora, con Gemini, busca superar a su competidor más cercano, el exitoso ChatGPT de OpenAI.

En un comunicado oficial de Alphabet, la empresa matriz de Google, se afirma que Gemini supera los resultados del chatbot de OpenAI. «El modelo de IA es el más capaz jamás creado gracias al modo de entrenamiento que se ha utilizado», destacan.

Desde su lanzamiento, ChatGPT ha sido líder en el sector, pero Google está decidido a destronarlo con su nueva propuesta.

El despliegue de Gemini: tres tamaños, una potencia inigualable

El lanzamiento de Gemini el 6 de diciembre no pasó desapercibido. La herramienta se presenta en tres tamaños diferentes, cada uno diseñado para satisfacer necesidades específicas. Gemini Ultra, el modelo más potente, está destinado a tareas de gran complejidad. Gemini Pro se destaca como el mejor para una amplia gama de tareas, mientras que Gemini Nano es el modelo más eficiente diseñado para ejecutar tareas directamente en dispositivos móviles.

Google define a Gemini como un modelo de IA multimodal, capaz de «generalizar y comprender, operar y combinar a la perfección distintos tipos de información». Esta capacidad incluye texto, audio, imágenes, vídeo y lenguajes de código. La versatilidad de Gemini es un punto clave, ya que permite abordar una amplia variedad de tareas de manera eficiente.

El desarrollo de Gemini: una nueva perspectiva en la inteligencia artificial

Google explica que, hasta ahora, los modelos multimodales requerían entrenar componentes separados para diferentes modalidades y luego combinarlos. Sin embargo, Gemini adopta un enfoque diferente al valorar diversas modalidades desde el principio, convirtiéndose en un modelo multimodal de forma nativa. Esta innovación permite a Gemini comprender y razonar sobre varios tipos de entradas desde cero.

La flexibilidad de Gemini no se limita a su potencia, sino también a su capacidad para ejecutarse eficientemente en una variedad de dispositivos. Desde móviles hasta centros de datos, Google asegura que Gemini mejorará significativamente la forma en que los desarrolladores y las empresas construyen y escalan con IA. Esto posiciona a Gemini como una herramienta versátil y accesible para una amplia gama de aplicaciones.

El enfoque de entrenamiento utilizado en Gemini marca una diferencia fundamental. Mientras que otros modelos multimodales se basaban en entrenar componentes separados, Gemini valora las diferentes modalidades desde el principio. Esta estrategia proporciona a la herramienta una comprensión más profunda y coherente de la información multimodal, mejorando su capacidad para realizar tareas complejas.

Colaboración a escala con Gemini

La creación de Gemini es el resultado de un arduo trabajo colaborativo a escala de múltiples equipos dentro de Google, incluidos los equipos de DeepMind y Google Research. La colaboración entre estos equipos ha sido crucial para pulir los datos multimodales adicionales y optimizar la eficacia de la herramienta. Este enfoque conjunto destaca la importancia de la colaboración en la vanguardia de la inteligencia artificial.

La competencia entre Gemini y ChatGPT plantea la pregunta crucial sobre quién liderará el futuro de la inteligencia artificial. Ambas herramientas tienen características impresionantes, pero la versatilidad y el enfoque de entrenamiento único de Gemini podrían ser la clave para ganarse a desarrolladores y clientes empresariales.