Qué hay de nuevo en Gemini, la inteligencia artificial con la que Google quiere retomar el liderazgo

Qué hay de nuevo en Gemini, la inteligencia artificial con la que Google quiere retomar el liderazgo

Qué hay de nuevo en Gemini, la inteligencia artificial con la que Google quiere retomar el liderazgo

Faltan pocas semanas para que termine uno de los años más trascendentales en materia de tecnología pero eso no significa que los lanzamientos de productos se den por acabados. Google no se rinde y presentó lo que la empresa denomina “el modelo de Inteligencia Artificial más avanzado que ha desarrollado hasta la fecha”. Se trata de Gemini, con el que claramente quiere competir contra ChatGPT y el modelo que está por detrás desde el minuto cero, ubicándose, según sus análisis comparativos, por encima de las capacidades que hasta ahora demostró el producto de OpenAI.

Google apuesta ahora por un producto multimodal, es decir, se diferencia de su competidor porque su nuevo modelo podría generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación. Además destaca que tiene un horizonte de aplicación mucho más flexible que su competencia, ya que podrá ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos.

“Es el comienzo de una nueva era de la IA en Google: la era Gemini”, expresó Sundar Pichai, el CEO del gran buscador que hasta ahora no ha podido instalar un producto definitivo que seduzca a quienes se vieron sorprendidos por ChatGPT hace exactamente un año. Google ha dominado por más de dos décadas el mercado de los buscadores y durante esos años ha desplegado un ecosistema que va mucho más allá de los resultados. De hecho, es una de las empresas líderes en IA, pero aplicadas a sectores no tan masivos como se mostró desde el inicio su nuevo competidor.

A pesar del anuncio grandilocuente, el usuario masivo y que utiliza de forma diversa ChatGPT quizás no se haya percatado de la pretensión de Pichai. Gemini por ahora es tema de conversación de los nichos tecnológicos que pueden dimensionar las ventajas que tendría un modelo multimodal. El lanzamiento funciona bajo el entorno de Bard, el chat conversacional que tiene Google, muy similar a ChatGPT y que lanzó la compañía en julio de este año. Casualmente, Bard todavía no tiene la popularidad que merecería un producto estrella de Google.

Pero hay tres cosas que llamaron la atención de la presentación de Google. La primera es que su promoción estuviese tan enfocada en la comparación con el mercado. Resulta lógica esta estrategia en un momento en el que además de GPT-4 también están disputándose el escenario otros productos como Bing, de Microsoft y dentro de poco conoceremos más sobre Grok, el modelo de IA de Elon Musk. Pareciera entonces que 2024 será un año de comparaciones como éstas, tales como las conocimos cuando Apple y Samsung contrastaban el poderío de los procesadores, cámaras y pantallas de sus celulares. Esta carrera puede impulsar el desarrollo de estos productos, pero seguramente será limitada si sólo se restringe en comparar quién es el más potente y no quién es el más innovador o el más disruptivo.

En segundo lugar, todavía sorprende que Google no utilice todo su ecosistema de productos y servicios para ganar la carrera de la IA generativa, el tipo de tecnología que genera nuevos contenidos a partir de sus algoritmos. La empresa tiene sistemas operativos en móviles, computadoras, relojes y televisores. Cuenta con celulares propios, streaming de video como Youtube, servicios en la nube como Google Drive, correo electrónico y claro, el buscador más popular del mundo, entre otras cosas. Es decir, podría integrar rápidamente las soluciones que ofrece un chat de texto en distintos formatos realmente innovadores. Esta capacidad solo la tiene Google. Los planes parecen estar más cerca según sus anuncios, tal como Pichai adelantó: “Se trata de un enorme salto adelante en un modelo de inteligencia artificial que afectará a prácticamente todos los productos de Google”.

Finalmente queda por descubrir de qué se trata la “mejora de razonamiento” que vendría con Gemini. Los ingenieros que lo desarrollaron auguran que no solo será más efectivo en el análisis y procesamiento de lenguaje, sino también podrá razonar mejor. Ese procesamiento se podrá aplicar a problemas matemáticos, de lenguaje o bien de programación. El razonamiento, ese bastión que hasta ahora considerábamos capital de los humanos, ahora comienza a crecer y optimizarse en algoritmos que se dejan conocer conversaciones en una pantalla.

¿Hasta dónde competirán los modelos de IA? ¿Habrá un límite? ¿Cuánto falta para que un robot llegue a la cámara de nuestros celulares? ¿Qué tipo de razonamientos tendrán dichos modelos? Gemini por ahora nos arroja estas preguntas y quizás esto sea lo más provechoso de su presentación.

Tamaño texto
Comentarios
Comentarios