El hecho de que Google haya integrado Bard en muchas aplicaciones como Gmail, YouTube, Google Maps y Flights es una gran ventaja sobre ChatGPT, por lo que OpenAI anunció recientemente que la versión gratuita de ChatGPT pronto permitirá la entrada de voz e imágenes.
Esto significa que los usuarios pueden hacer preguntas en ChatGPT de forma más natural que escribiendo en iPhone y Android, o incluso usar imágenes para obtener mejores respuestas. Lo más importante es que no tendrán que pagar por ChatGPT Plus para recibir actualizaciones, aunque las cuentas de pago serán las primeras en disfrutar de una prueba gratuita.
Los usuarios de Plus y Enterprise recibirán esta actualización en las próximas dos semanas, seguidos por otros grupos de usuarios, incluyendo desarrolladores. El uso de imágenes para introducir datos en ChatGPT es la forma en que funcionan los modelos de IA multimodal. Es similar a cómo el gigante de las búsquedas usa Google Lens con IA.
Se espera que dos nuevas funciones de ChatGPT atraigan a más usuarios que Google Bard
Mientras tanto, la función de soporte de voz solo estará disponible en la app ChatGPT para iPhone y Android. Los usuarios solo tienen que habilitarla en la configuración de la app una vez activada. OpenAI afirma que ChatGPT solo necesita unos segundos de muestra de voz para generar audio con calidad humana a partir de texto, y para ello utiliza un nuevo modelo de conversión de texto a voz.
La tecnología, que puede generar voces sintéticas realistas a partir de voz real en segundos, abre la puerta a diversas aplicaciones innovadoras y centradas en la accesibilidad. Sin embargo, también plantea nuevos riesgos, como la posibilidad de suplantación de identidad de famosos o fraude. OpenAI también afirmó estar trabajando con Spotify para probar una función de traducción de voz para podcasts, que permite a los creadores traducir su contenido a otros idiomas utilizando sus propias voces.
[anuncio_2]
Enlace de origen
Kommentar (0)