ChatGPT

ChatGPT incorpora el procesamiento de video en tiempo real en el Modo de voz avanzado

La compañía anunció también el Modo de voz avanzado, una funcionalidad para su modelo GPT-4o y que permite elegir entre una serie de voces para personalizar la interacción con el 'chatbot'.

Ciencia y Tecnología

Por Portaltic / EP

viernes, 13 de diciembre de 2024 · 10:38

MADRID 13 Dic. (Portaltic/EP) - OpenAI anunció una nueva catacterística para el Modo de voz avanzado de ChatGPT, que va a integrar el procesamiento de video en tiempo real, lo que permitirá a su 'chatbot' ofrecer respuestas más concretas a las solicitudes de los usuarios según su contexto y lo que pueda identificar a través de las cámaras del dispositivo.

La compañía anunció hace una semana que inauguraría una serie de 12 días de novedades, en la que ya anunció el lanzamiento del modelo de Inteligencia Artificial (IA) o1, un nuevo nivel de ChatGPT Pro y la disponibilidad general de la herramienta de video Sora.

En estas sesiones, también hizo referencia al Modo de voz avanzado, una funcionalidad que anunció con la presentación de su modelo GPT-4o y que permite elegir entre una serie de voces para personalizar la interacción con el 'chatbot'.

Si bien esta característica se iba a probar con un grupo de usuarios en julio, OpenAI anunció que retrasaba su lanzamiento para seguir probando su fiabilidad. Así, fue en septiembre cuando finalmente la empezó a implementar para los usuarios suscritos a la versión Plus y Teams, aunque quedaron excluidos los de la Unión Europea, Suiza, Islandia, Liechtenstein y Noruega.

La compañía ahora anunció la incorporación de la entrada de vídeo de vídeo en el Modo de voz avanzado, lo que permitirá al modelo multimodal procesar en tiempo real las imágenes, así como acceder a las aplicaciones que se estén utilizando en el dispositivo mediante la opción 'Share Screen' o 'Compartir pantalla'.

Como resultado de esta integración, "las conversaciones con Modo de voz avanzado tendrán un ritmo mucho más natural" y podrá profundizar en aspectos como el ritmo o el tono de la voz en más de 50 idiomas, según han explicado los responsables de la firma en un vídeo.

Gracias a esta funcionalidad, que se puede utilizar bien con la cámara delantera o bien con la trasera, ChatGPT podrá indicar a una persona cuáles son los pasos que debe dar para preparar un café con los elementos que identifique y que estén situados frente al objetivo.

Asimismo, con 'Compartir Pantalla', el usuario podrá solicitar al 'chatbot' ayuda para ejecutar acciones. Por ejemplo, para responder a un mensaje desde la aplicación de Mensajes del 'smartphone', de modo que le dará las indicaciones pertinentes para contestar con el tono elegido.

OpenAI confirmó que llevará esta función a Europa "tan pronto como pueda" y que ofrecerá acceso anticipado a suscriptores de los planes Enterprise y Edu antes de 2025. Asimismo, ha anunciado que ha personalizado el Modo de voz avanzado de ChatGPT con un modo Papá Noel con motivo de las fiestas de Navidad.

El modo Santa Claus se puede activar durante todo el mes de diciembre pulsando sobre el icono de un copo de nieve, que aparece junto a la barra de mensajes, o bien a través de la Configuración de voz. Esta característica funciona en aplicaciones móviles, iOS, Android y la versión web de ChatGPT.

Ciencia y Tecnología

Buscar

ChatGPT

ChatGPT incorpora el procesamiento de video en tiempo real en el Modo de voz avanzado

La escuela no es un lugar de resguardo de niños por conveniencia del mercado: Mario Delgado

Denuncian por acoso sexual y laboral al director de Desarrollo Carretero de la 4T

Sheinbaum plantea que se conserven seis semanas de vacaciones tras críticas a cambios en calendario

Abogado de Manuel Roberto Farías, marino implicado en huachicol fiscal acusa “justicia selectiva”

SEP da marcha atrás: el calendario escolar se queda sin cambios (Video)

Ayuso acusa a Sheinbaum y al gobierno de España de “ponerla en peligro” en México (Audio)

Chubascos y lluvias puntuales fuertes pegarán este martes a los siguientes estados

Era abogado apócrifo y chofer de DiDi; intenta raptar a pasajera en Mexicali

Explosión en refinería de Pemex en Salinas Cruz, Oaxaca; seis personas lesionadas (Video)

Carolyn Adams considera demanda por fotos de José Ramón López Beltrán dentro de boutique Cartier

Otras Noticias

Google dice que frustró el plan de hackers de usar IA para amenazar a otra empresa

Cómo cambia el cerebro humano desde la infancia hasta la vejez, según la UNAM

Científicos de la UNAM crean antibióticos con veneno de alacrán y chile habanero