Google lanza su competidor de IA a GPT-4
- Marlon López
- 8 dic 2023
- 2 Min. de lectura
Aproximadamente un año después de que el lanzamiento de ChatGPT por parte de OpenAI llevara a ebullición la carrera de la inteligencia artificial, el muy esperado modelo de inteligencia artificial de Google, Gemini, finalmente se unió a la competencia.
Lanzado hace 2 días, Gemini es un modelo de lenguaje grande (LLM) que, según el director ejecutivo de Google, Sundar Pichai, y los ejecutivos de la división de inteligencia artificial DeepMind de la compañía revolucionará la tecnología generativa para los negocios y la vida diaria.
La tecnología es una familia de tres modelos que Google está incorporando lentamente a su conjunto de servicios:
Gemini Nano, el pequeño del grupo, está destinado principalmente a dispositivos móviles. A partir de ayer, los propietarios de Google Pixel 8 Pro podían contratar a Gemini Nano para resumir grabaciones de audio o redactar respuestas automáticas a mensajes.
Gemini Pro es una oferta de tamaño mediano diseñada para tareas más complejas. Pro ahora impulsa el chatbot de Google, Bard, pero la tecnología de inteligencia artificial no estará disponible para los clientes de Google Cloud hasta el 13 de diciembre.
Gemini Ultra, la poderosa versión orientada a centros de datos y grandes empresas, se lanzará el próximo año y respaldará a "Bard Advanced", un nuevo chatbot que podrá procesar simultáneamente texto, imágenes, audio y video, según demostraciones pregrabadas de Google.
Si Gemini puede hacer lo que promete Google, podría reducir el liderazgo de OpenAI en el espacio LLM.
Géminis contra GPT
Google afirma que Gemini Pro supera al GPT-3.5 de OpenAI y que Gemini Ultra supera al GPT-4 en la mayoría de las pruebas de sus capacidades, incluso en razonamiento, matemáticas y codificación. Pero el rendimiento informado de Gemini en esos puntos de referencia de la industria es sólo ligeramente mejor que el de GPT-4, señala The Verge.
La verdadera ventaja de Google sobre OpenAI podría llegar si Gemini Ultra es realmente lo suficientemente multifacético como para crear escrituras e imágenes originales, idear proyectos de arte y manualidades basados en una fotografía de materiales, elegir un género musical que coincida con una imagen y explicar errores en ecuaciones escritas a mano. —Todo en un solo producto. Las herramientas generativas de OpenAI para imágenes y audio (el complemento Vision de GPT-4, DALL-E y Whisper) están todas separadas.
Comments