OpenAI y Google se encuentran enfrascados en una carrera por desarrollar nuevos dispositivos y herramientas impulsadas por inteligencia artificial, que mejoren los productos que a nivel mundial utilizan millones de personas.
La segunda semana de mayo se presentó el ChatGPT 4o, una actualización que lo convierte en un asistente personal digital capaz de entablar conversaciones habladas en tiempo real.
“También podrá interactuar mediante texto y “visión”, lo que significa que podrá ver capturas de pantalla, fotos, documentos o gráficos subidos por los usuarios y mantener una conversación sobre ellos”, explicó la directora de Tecnología de OpenAI, Mira Murati.
La nueva versión del ChatGPT, podrá aprender de conversaciones anteriores con los usuarios y realizar traducciones en tiempo real, haciendo la interacción más fácil y natural.
Los ejecutivos de OpenAI demostraron una conversación hablada con ChatGPT para obtener instrucciones en tiempo real para resolver un problema de matemáticas, contar un cuento antes de dormir y obtener consejos de codificación. ChatGPT fue capaz de hablar con una voz natural y humana, así como con una voz robótica, e incluso cantó parte de una respuesta. La herramienta también era capaz de mirar la imagen de un gráfico y discutir sobre él.
También mostraron que el modelo detectaba las emociones de los usuarios; en un caso, escuchó la respiración de un ejecutivo y le animó a calmarse. “¡No eres una aspiradora!”, le dijo bromeando
ChatGPT también es capaz de mantener una conversación en varios idiomas traduciendo y respondiendo automáticamente. Según Open AI, la herramienta admite ahora más de 50 idiomas.
Estos cambios se producen en un momento en el que la integración de la IA en productos de consumo más utilizados por Google y Meta, como Instagram y Google Assistant, puede hacer que la tecnología de esas empresas sea más amplia y fácilmente accesible.
De hecho, un día después, el CEO de Google, Sundar Pichai, mostró varias funciones nuevas impulsadas por su último modelo de inteligencia artificial, Gemini 1.5 Pro. Una nueva característica, llamada Ask Photos, permite a los usuarios buscar fotos para obtener información más profunda, como preguntar cuándo aprendió su hija a nadar o recordar cuál es su número de placa, tras mirar las imágenes guardadas.
Los ejecutivos de Google también demostraron que podían “leer” un libro de texto y convertirlo en una especie de conferencia sobre inteligencia artificial, con profesores que suenan reales que responderían sus preguntas.
Las mejoras de la IA también llegarán a Gmail, donde los usuarios por ejemplo, podrán pedirle a Gemini 1.5 Pro que resuma todos los correos electrónicos recientes de la escuela de su hijo mediante el análisis archivos adjuntos y el resumen de puntos clave.
Datos a destacar
La segunda semana de mayo, se presentó el ChatGPT 4o, una actualización que lo convierte en un asistente personal digital capaz de entablar conversaciones habladas en tiempo real.
Estos cambios se producen en un momento en el que la integración de la IA en productos de consumo más utilizados por Google y Meta, como Instagram y Google Assistant, puede hacer que la tecnología de esas empresas sea más amplia y fácilmente accesible.
Texto y fotos: Manuel Pool