Actualización de ChatGPT: Ahora podrá Ver, escuchar y hablar

OpenAI ha sacado una actualización apocalíptica para ChatGPT, y digo apocalíptica porque después de esto, ya solo queda sacar el Terminator.

De hecho es la actualización más grande hasta la fecha, desde la salida del modelo Chat GPT4.

Ya que dentro de poco, ChatGPT podrá ver, oír y hablar.

Exacto, como lo oyes. Por fin va a ser un modelo de inteligencia artíficial multimodal (de verdad).

Vamos a ver si es para tanto o no.

¿Qué Cambia de ChatGPT?

El nuevo ChatGPT va a ser muy distinto de lo que tenemos ahora mismo.

vídeo

Tendremos una interfaz en la que, supuestamente, podrás interactuar no solamente de forma escrita sino a través de la voz.

Esto ya se puede hacer con el modelo de Whisper, pero lo más épico es que ahora ChatGPT te podrá hablar a ti.

Antes tú podías hablarle a ChatGPT y te podía contestar, podías transcribir vídeos, podrías hacer un montón de cosas, pero es que ahora te podrá responder en voz.

Más adelante, veremos un pequeño ejemplo.

¿Multimodal? ¡Sí, Por Favor!

Parece que estemos finalmente ante el tan aclamado ChatGPT multimodal que tanto se ha hablado.

Podrás interactuar con ChatGPT a través de la voz.

La gente se ha vuelto toda loca con esto.

¿Podremos hacernos amigos de ChatGPT?

Ejemplos de ChatGPT multimodal (voz)

El ejemplo que veremos a continuación está en el blog de OpenAi, donde nos explica que efectivamente ChatGPT ahora puede ver, oír y hablar.

Podremos hablar con ChatGPT y obtener una respuesta de este modelo.

Este es el primer modelo de OpenAI que hace esto.

Ha habido otras empresas que lo han hecho y bastante bien de hecho. Pero de OpenAI es el primero en hacer esto.

¿Y las Imágenes?

Ahora podrás subir imágenes y trabajar con ellas de una forma más precisa.

Podremos tener ya el reconocimiento de imágenes. Hay modelos de inteligencia artificial actualmente que lo hacen, por ejemplo, Midourney.

Pero estamos hablando de que esto va a ser completamente multimodal. Todo esto lo tendremos integrado en la misma interfaz de ChatGPT.

Te dejo otro ejemplo por aquí, porque realmente vale la pena verlo.

Es ahí donde está el potencial.

Salida de DALL-E 3 ¿Qué Más Podemos Esperar?

Una cosa también muy interesante es que podrá aceptar texto, imágenes y audio (desde la misma aplicación de ChatGPT.

Esto da un abanico de posibilidades mucho mayor que el que teníamos hasta ahora.

Esto va a ser un hostión a aplicaciones como midjourney y otras de inteligencia artificial que se utilizan para crear imágenes y todo esto.

Esto se va a hacer gracias a DALL-E 3. Te dejo un ejemplo para que lo veas tu mismo

¡Ideas y más ideas!

El ejemplo que a mí más me ha impactado y más ideas me ha dado es el de crear logos.

Podrás hacer tus imágenes de productos de esta manera o cualquier otro montaje (muy realista).

Por ejemplo, esto puede ser muy útil para modelos de negocio de print-on-deman.

Y todo esto, lo podrás hacer todo con inteligencia artificial 🤯.

Conclusión

Como has podido ver, se acercan grandes cambios. Yo creo que es la actualización más importante que ha sacado OpenAI hasta la fecha.

Esto del tema multimodal ya hace tiempo que lo llevan anunciando.

En breve voy a hacer unos cuantos experimentos para probar la nueva herramienta.

Espero que te haya gustado el vídeo. Ya sabes que si tienes alguna pregunta o tienes alguna sugerencia puedes dejarla en los comentarios.

¡Nos vemos en el próximo! Adiós.

Si hay algo que todavía no te han explicado está aquí

Apuntate al boletín y conoce los secretos mejor guardados del Blogging, SEO, Marketing y Wordpress.

Suscríbete

0 Comentarios

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Aviso de Cookies

Utilizamos cookies para almacenar y/o acceder a información en tu dispositivo. Al dar tu consentimiento, nos permites procesar datos como tu comportamiento de navegación o identificadores únicos en este sitio.

Tus datos personales se tratarán y la información de tu dispositivo (cookies, identificadores únicos y otros datos del dispositivo) podrá ser almacenada, consultada y compartida con 136 proveedores aprobados por el TCF y 62 partners publicitarios o utilizada específicamente por este sitio o aplicación.
Es posible que algunos proveedores traten tus datos personales en virtud de un interés legítimo, algo a lo que puedes oponerte gestionando tus opciones a continuación. En la parte inferior de esta página, busca un enlace para gestionar o retirar el consentimiento en la configuración de privacidad y cookies.