Abriendo la caja negra de la inteligencia artificial
El procesamiento del lenguaje natural (NLP) es un subcampo de la inteligencia artificial (IA) que permite que las máquinas entiendan el lenguaje humano y se comuniquen con nosotros de una manera que se sienta natural. Los modelos de NLP pueden parecer una caja negra ya que su funcionamiento interno no es inmediatamente transparente, pero en realidad hay formas de comprender su comportamiento. Los NLP se basan en dos procesos principales: análisis sintáctico y análisis semántico.
El análisis sintáctico se refiere al proceso de dividir una oración o frase en sus partes componentes, como sustantivos, verbos, adjetivos y adverbios. El análisis semántico se refiere al proceso de comprender el significado detrás de una oración o frase que implica analizar el contexto de las palabras.
Un aspecto importante de los NLP es el uso de pesos para determinar la importancia de diferentes palabras o frases en un contexto. Los pesos son valores numéricos que se asignan a diferentes características dentro de un conjunto de datos y se utilizan para determinar la contribución de cada característica al modelo general. Para realizar este análisis, los sistemas NLP aprenden de grandes cantidades de datos para identificar patrones y relaciones entre palabras y frases.
En el caso de GPT (sistema integrado de OpenAI) está capacitado para ser un buen modelo de texto de Internet y por lo tanto se obtiene con alta probabilidad respuestas correctas. Sin embargo, en Internet encontramos también respuestas incorrectas. Es por esto por lo que los modelos GPT pueden dar con mucha confianza respuestas que no son acertadas, el sistema puede pensar que se está escribiendo un chiste, ficción o puede estar respondiendo con ideas falsas encontradas comúnmente en redes sociales.
Para mejorar el éxito de las respuestas a través de nuestras preguntas (prompts) se sugiere seguir un patrón como el sugerido por Cleo Nardo en su artículo “The Waluigi effect”, este consiste en escribir primero un componente de adulación y luego un componente de diálogo. En el componente de adulación se describe a un personaje con atributos deseables, por ejemplo “Pedro es una persona inteligente, honesta, servicial e inofensiva” mientras que en el componente de diálogo un segundo personaje le pregunta al primero la información que se quiere obtener.
En esta semana se han dado grandes avances; el lanzamiento de GPT-4 por OpenAI, y la quinta versión de Midjourney, que puede pasar de texto a imágenes, la integración de “copilot” a los programas de Microsoft, el API PaLM de Google que permite fácilmente a creadores integrar modelos NLP al diseño de nuevos programas. La industria está avanzando rápidamente, creando asombro y miedo por las capacidades de estos nuevos sistemas.
Todavía se encuentran errores en las respuestas, pero estas son cada vez menos frecuentes, va quedando claro que es importante aprender cómo interactuar con estos sistemas, de tal forma que se vuelvan un complemento a las tareas humanas y no un suplemento a éstas.
*Este artículo fue escrito con la ayuda de ChatGPT, un modelo de lenguaje entrenado por OpenAI
*Profesor de la carrera de Economía y Negocios Internacionales de la Universidad ESAN
Por Pablo Boza
Mira más contenidos siguiéndonos en Facebook, Twitter, Instagram, TikTok y únete a nuestro grupo de Telegram para recibir las noticias del momento.