El arte del prompt: Cómo sacar el máximo provecho de la IA generativa

Los modelos generativos de IA pueden generar cualquier cosa, desde poesía y prosa hasta imágenes y código a su disposición. Pero para obtener el resultado deseado de estas herramientas de IA, se debe crear la entrada correcta, también conocida como indicación (o prompt, en inglés).

Los prompts son los que guían la salida del resultado ofrecido por el modelo de IA e influyen en su tono, estilo y calidad. Y los buenos prompts son las que provocan un texto brillante e imágenes sorprendentes.

“Escribir buenos prompts es la clave para desbloquear el poder y el potencial de la IA generativa”, dijo Jennifer Marsman, ingeniera principal en la Oficina del Director de Tecnología de Microsoft.

“Lo comparo con los primeros días de los motores de búsqueda: era un arte elegir las palabras clave correctas para obtener buenos resultados y, con el tiempo, tanto los usuarios como el motor de búsqueda mejoraron su entendimiento mutuo”, dijo. “Este es el mismo paradigma. Con el tiempo, tanto nosotros como usuarios como los modelos de aprendizaje automático nos entenderemos mejor”.

A medida que las herramientas de IA generativa se vuelven cada vez más populares para trabajar y jugar, es útil saber cómo aprovecharlas al máximo. Elaborar el prompt correcto es esencial, pero puede ser un toma y daca. Estos son algunos de los mejores consejos y trucos de Marsman para escribir indicaciones efectivas.

Sean específicos

Tienen una imagen impresionante en mente, pero cuando le dijeron a Bing Image Creator que la hiciera realidad, el resultado no fue para nada lo que pensaban. ¿Por qué pasa esto?

Es esencial proporcionar tantos detalles como sea posible al escribir prompts, en especial cuando se trata de imágenes, dijo Marsman. Un elemento clave que le gusta aportar es el estilo. Díganle al modelo que produzca la imagen como un boceto a lápiz, por ejemplo, una pintura al óleo o una caricatura. El punto de vista y la iluminación también son atributos para considerar. En una imagen de un estadio de béisbol, ¿miran hacia abajo desde las gradas, hacia el campo o desde arriba a vista de pájaro?

En el ejemplo del «palacio submarino», Marsman agregó la frase «arte digital de alta calidad» a su prompt. Sin ella, la imagen no habría tenido el mismo nivel de detalle, dijo.

Conversación de Bing Chat que muestra imágenes de un palacio submarino. a partir de prompts.
Incluyan detalles como el estilo, el punto de vista y la iluminación cuando escriban prompts para generar imágenes. Imagen cortesía de Microsoft.

Marsman estaba satisfecha con el resultado. Pero no tengan miedo de repetir, agregó. Cambiar el orden de las palabras en el indicador traerá diferentes elementos al primer plano. Si hubiera querido agregar sirenas como foco de la imagen, por ejemplo, podría haber enumerado «sirenas» primero.

Usen el modelo correcto para el trabajo correcto

Si buscan historias, poemas, chistes u otras respuestas imaginativas, usen el modo «más creativo» de Bing Chat.

Pero si solo buscan hechos, usen el modo «más preciso». Esto producirá respuestas sucintas y basadas en hechos, dijo Marsman. El modo «Equilibrado» es el predeterminado y funciona bien para la mayoría de los escenarios, agregó.

Revisen la información

Bing combina potentes modelos de IA con su inmenso índice de búsqueda de resultados actuales, citados y conversacionales. Pero una desventaja de los modelos de IA generativa es que en ocasiones pueden generar respuestas que suenan plausibles pero que, de hecho, son incorrectas. Aquí hay algunos consejos para ayudar a asegurarse de que la salida que suena razonable sea en realidad cierta:

  • Usen el estilo de conversación «más preciso» en Bing Chat. Este modelo tiende a funcionar mejor al fundamentar sus respuestas en el material fuente de la web.
  • Lea con atención las referencias. Pueden hacer clic en las citas y verificar que el modelo interpretó de manera correcta el texto.
  • Digan al modelo que resuma información específica en lugar de hacer una pregunta abierta. Por ejemplo, en lugar de preguntar «cuál es la teoría de la relatividad general», podrían enmarcar su pregunta como «resumir los conceptos clave de la relatividad general en un párrafo». Esto puede ayudar a guiar el modelo para generar respuestas más precisas y relevantes, dijo Marsman.

Ajusten los resultados a través de diferentes puntos de vista

Pueden obtener mejores respuestas de un chatbot diciéndole cómo desean que proporcione respuestas. Por ejemplo, si desean una explicación simple de la mecánica cuántica, pueden pedirle a Bing impulsado por IA que «me lo explique como si estuviera en octavo grado». Pero si conocen la jerga y los detalles del tema, pueden pedirle que actúe como un profesor universitario o un entrenador técnico. De esta manera, pueden ajustar la voz y el nivel de comprensión de Bing Chat para satisfacer sus necesidades.

Conversación de Bing Chat que muestra una explicación del prompt de lo que causa un arcoíris en un nivel de 3er grado.
Pueden ajustar la voz y el nivel de comprensión de Bing Chat para satisfacer sus necesidades. Imagen cortesía de Microsoft.

Cuando deseen cambiar la conversación, usen el botón «Nuevo tema»

Si desea hacer preguntas de seguimiento sobre el mismo tema en Bing Chat, es mejor mantener la conversación actual. Cuando deseen cambiar de tema, presionen el botón «Nuevo tema». Esto le da al modelo una pizarra limpia: no se confundirá ni fusionará temas no relacionados.

Pueden especificar la longitud

¿Quieren una respuesta sucinta o una historia larga? Pueden especificar la longitud (dos oraciones, por ejemplo, o dos párrafos) y guiar el modelo en consecuencia. Y si el chatbot se detiene antes de que estén satisfecho, siempre pueden indicarle que «continúe».

No olviden dar formato

Bing con tecnología de inteligencia artificial puede presentar datos e información de múltiples fuentes en la web y en una variedad de formas diferentes para mejorar la comprensión. Por ejemplo, las tablas y los esquemas pueden ayudar a los usuarios a ver la información en un formato estructurado. De manera similar, los diagramas y diagramas de flujo pueden ayudar a los usuarios a visualizar datos complejos, lo que facilita su comprensión e interpretación.

Bing con tecnología de IA puede presentar datos e información de múltiples fuentes y en una variedad de formas diferentes. Imagen cortesía de Microsoft.

Aprovechen su Copilot para escribir buen código

Recuerden que el modelo está entrenado con muchos lenguajes de programación, por lo que pedir tan solo que realice una tarea de codificación podría resultar en el uso de cualquier cantidad de lenguajes de programación. Especifiquen el lenguaje de programación que deseen. También deben incluir cualquier otra información contextual relevante, como bibliotecas, API o marcos que utilicen. También pueden mencionar el contexto del código ya escrito, como «la entrada del usuario se almacena en una variable llamada x».

¡No olviden ejecutar y probar siempre su código!

Si al principio no tienen éxito, pregunten de nuevo

Es importante recordar que incitar a la IA a generar respuestas no es una ciencia exacta y que la iteración es clave, dijo Marsman. La belleza de crear prompts es que pueden probar múltiples enfoques para ver qué funciona mejor. No tengan miedo de experimentar con diferentes longitudes, tonos y voces. Si los resultados iniciales no son lo que buscan, intenten ajustar su prompt y ejecutarlo de nuevo. Con la práctica, mejorarán al guiar el modelo hacia los resultados que desean.

Contenido relacionado:

Imagen principal: una imagen digital de un palacio submarino creado por Bing Image Creator. Imagen cortesía de Microsoft.