OpenAI presenta GPT-4, meses después de que ChatGPT sorprendiera a Silicon Valley

Hace cuatro meses, una pequeña empresa de San Francisco se convirtió en el tema de conversación de la industria de la tecnología cuando presentó un nuevo chatbot en línea que podía responder preguntas complejas, escribir poesía e incluso imitar las emociones humanas.

Ahora, la empresa está de vuelta con una nueva versión de la tecnología que impulsa sus chatbots. El sistema subirá la apuesta en la carrera de Silicon Valley para adoptar la inteligencia artificial y decidir quién será la próxima generación de líderes en la industria de la tecnología.

OpenAI, que tiene alrededor de 375 empleados pero ha sido respaldada con miles de millones de dólares de inversión de Microsoft y celebridades de la industria, dijo el martes que había lanzado una tecnología que llama GPT-4. Fue diseñado para ser el motor subyacente que impulsa los chatbots y todo tipo de otros sistemas, desde motores de búsqueda hasta tutores personales en línea.

La mayoría de las personas usará esta tecnología a través de una nueva versión del chatbot ChatGPT de la compañía, mientras que las empresas la incorporarán en una amplia variedad de sistemas, incluido el software comercial y los sitios web de comercio electrónico. La tecnología ya hace que el chatbot esté disponible para un número limitado de personas que utilizan el motor de búsqueda Bing de Microsoft.

El progreso de OpenAI, en tan solo unos meses, llevó a la industria de la tecnología a uno de sus momentos más impredecibles en décadas. Muchos líderes de la industria creen que los desarrollos en IA representan un cambio tecnológico fundamental, tan importante como la creación de navegadores web a principios de la década de 1990. La rápida mejora ha dejado atónitos a los informáticos.

GPT-4, que aprende sus habilidades mediante el análisis de grandes cantidades de datos extraídos de Internet, mejora lo que impulsaba al ChatGPT original de varias maneras. Es más preciso. Puede, por ejemplo, aprobar el examen de la barra uniforme, calcular instantáneamente la responsabilidad fiscal de alguien y proporcionar descripciones detalladas de las imágenes.

Pero la nueva tecnología de OpenAI todavía tiene algunas de las deficiencias extrañamente parecidas a las humanas que han irritado a los expertos de la industria y desconcertado a las personas que han trabajado con los chatbots más nuevos. Es un experto en algunos temas y un diletante en otros. Puede hacerlo mejor en las pruebas estandarizadas que la mayoría de las personas y ofrecer consejos médicos precisos a los médicos, pero también puede estropear la aritmética básica.

Las empresas que apuestan su futuro en la tecnología pueden, al menos por ahora, tener que soportar la imprecisión, que fue un tabú durante mucho tiempo en una industria construida desde cero sobre la noción de que las computadoras son más exigentes que sus creadores humanos.

“No quiero que suene como si hubiéramos resuelto el razonamiento o la inteligencia, que ciertamente no lo hemos hecho”, dijo Sam Altman, director ejecutivo de OpenAI, en una entrevista. “Pero este es un gran paso adelante de lo que ya existe”.

Es probable que otras empresas de tecnología incluyan las características de GPT-4 en una variedad de productos y servicios, incluido el software de Microsoft para realizar tareas comerciales y sitios de comercio electrónico que desean brindar a los clientes nuevas formas de probar virtualmente sus productos. Varios gigantes de la industria como Google y la empresa matriz de Facebook, Meta, también están trabajando en sus propios chatbots y tecnología de IA.

ChatGPT y tecnologías similares ya están cambiando el comportamiento de los estudiantes y educadores que intentan comprender si las herramientas deben adoptarse o prohibirse. Debido a que los sistemas pueden escribir programas de computadora y realizar otras tareas comerciales, también están a punto de cambiar la naturaleza del trabajo.

Incluso los sistemas más impresionantes tienden a complementar a los trabajadores calificados en lugar de reemplazarlos. Los sistemas no se pueden utilizar en lugar de médicos, abogados o contadores. Todavía se necesitan expertos para detectar sus errores. Pero pronto podrían reemplazar a algunos asistentes legales (cuyo trabajo es revisado y editado por abogados capacitados), y muchos expertos en inteligencia artificial creen que reemplazarán a los trabajadores que moderan el contenido en Internet.

“Definitivamente hay una interrupción, lo que significa que desaparecen algunos trabajos y se crean otros nuevos”, dijo Greg Brockman, presidente de OpenAI. “Pero creo que el efecto neto es que las barreras de entrada se reducen y la productividad de los expertos aumenta”.

El martes, OpenAI comenzó a vender acceso a GPT-4 para que las empresas y otros desarrolladores de software pudieran crear sus propias aplicaciones. La compañía también usó la tecnología para crear una nueva versión de su popular chatbot, que está disponible para cualquier persona que compre acceso a ChatGPT Plus, un servicio de suscripción con un precio de $20 al mes.

Un puñado de empresas ya están trabajando con GPT-4. Morgan Stanley Wealth Management está construyendo un sistema que recuperará instantáneamente la información de los documentos de la empresa y otros registros, y la entregará a los asesores financieros en prosa conversacional. Khan Academy, una empresa de educación en línea, está utilizando la tecnología para crear un tutor automatizado.

“Esta nueva tecnología puede actuar más como un tutor”, dijo el director ejecutivo y fundador de Khan Academy, Sal Khan. “Queremos que le enseñe al estudiante nuevas técnicas mientras el estudiante hace la mayor parte del trabajo”.

Al igual que tecnologías similares, el nuevo sistema a veces “alucina”. Genera información completamente falsa sin previo aviso. Cuando se le preguntó por sitios web que presentan lo último en investigación sobre el cáncer, podría dar varias direcciones de Internet que no existen.

GPT-4 es una red neuronal, un tipo de sistema matemático que aprende habilidades mediante el análisis de datos. Es la misma tecnología que usan los asistentes digitales como Siri para reconocer los comandos hablados y los autos autónomos para identificar a los peatones.

Alrededor de 2018, empresas como Google y OpenAI comenzaron a construir redes neuronales que aprendían de enormes cantidades de texto digital, incluidos libros, artículos de Wikipedia, registros de chat y otra información publicada en Internet. Se denominan modelos de lenguaje extenso o LLM.

Al identificar miles de millones de patrones en todo ese texto, los LLM aprenden a generar texto por sí mismos, incluidos tweets, poemas y programas de computadora. OpenAI incorporó más y más datos a su LLM Más datos, esperaba la compañía, significarían mejores respuestas.

OpenAI también perfeccionó esta tecnología utilizando los comentarios de evaluadores humanos. A medida que las personas probaban ChatGPT, calificaban las respuestas del chatbot, separando las que eran útiles y veraces de las que no lo eran. Luego, utilizando una técnica llamada aprendizaje de refuerzo, el sistema pasó meses analizando esas calificaciones y obteniendo una mejor comprensión de lo que debería y no debería hacer.

“Los humanos califican qué cosas les gusta ver y qué cosas no les gusta ver”, dijo Luke Metz, investigador de OpenAI.

El ChatGPT original se basó en un gran modelo de lenguaje llamado GPT-3.5. GPT-4 de OpenAI aprendió de cantidades significativamente mayores de datos.

Los ejecutivos de OpenAI se negaron a revelar la cantidad de datos de los que había aprendido el nuevo chatbot, pero Brockman dijo que el conjunto de datos era de “escala de Internet”, lo que significa que abarcaba suficientes sitios web para proporcionar una muestra representativa de todos los angloparlantes en Internet.

Las nuevas capacidades de GPT-4 pueden no ser obvias para la persona promedio que usa la tecnología por primera vez. Pero es probable que se enfocan rápidamente a medida que los legos y los expertos continúan usando el servicio.

Dado un artículo extenso de The New York Times y se le pide que lo resuma, el bot dará un resumen preciso casi siempre. Agregue algunas oraciones aleatorias a ese resumen y pregúntele al chatbot si el resumen revisado es correcto, y señalará las oraciones agregadas como las únicas inexactitudes.

El Sr. Altman describió el comportamiento como “razonamiento”. Pero la tecnología no puede duplicar el razonamiento humano. Es bueno para analizar, resumir y responder preguntas complejas sobre un libro o artículo de noticias. Es mucho menos hábil si se le pregunta sobre eventos que aún no han sucedido.

Puede escribir un chiste, pero no demuestra que entiende lo que realmente hará reír a alguien. “No capta los matices de lo que es divertido”, dijo Oren Etzioni, director ejecutivo fundador del Instituto Allen para la IA, un destacado laboratorio en Seattle.

Al igual que con tecnologías similares, los usuarios pueden encontrar formas de persuadir al sistema para que tenga un comportamiento extraño y espeluznante. Cuando se le pide que imite a otra persona o que actúe, este tipo de bot a veces se desvía hacia áreas de las que fue diseñado para mantenerse alejado.

GPT-4 también puede responder a las imágenes. Dada una fotografía, gráfico o diagrama, la tecnología puede proporcionar una descripción detallada de la imagen en párrafos largos y responder preguntas sobre su contenido. Podría ser una tecnología útil para las personas con discapacidad visual.

En una tarde reciente, el Sr. Brockman mostró cómo reaccionaba el sistema a las imágenes. Le dio al nuevo chatbot una imagen del telescopio espacial Hubble y le pidió que describiera la foto “con minucioso detalle”. Respondió con una descripción de cuatro párrafos, que incluía una explicación de la línea blanca etérea que se extendía a lo largo de la foto. Un “rastro de un satélite o una estrella fugaz”, escribió el chatbot.

Los ejecutivos de OpenAI dijeron que la compañía no lanzaría de inmediato la parte de descripción de la imagen de la tecnología porque no estaban seguros de cómo podría usarse indebidamente.

Construir y servir chatbots es enormemente costoso. Debido a que está capacitado en cantidades de datos aún mayores, el nuevo chatbot de OpenAI aumentará los costos de la empresa. Mira Murati, directora de tecnología de OpenAI, dijo que la empresa podría restringir el acceso al servicio si genera demasiado tráfico.

Pero a largo plazo, OpenAI planea construir e implementar sistemas que puedan hacer malabarismos con múltiples tipos de medios, incluidos sonido y video, así como texto e imágenes.

“Podemos tomar todas estas habilidades de conocimiento de propósito general y distribuirlas en todo tipo de áreas diferentes”, dijo Brockman. “Esto lleva la tecnología a un dominio completamente nuevo”.