Qué son los tokens en los modelos de lenguaje

¿Sabías que los tokens son la base de los modelos de lenguaje? Entiende cómo funcionan y cómo afectan tus conversaciones con la IA.

dic 23, 2024

Aunque seas un usuario habitual de ChatGPT, es poco probable que hayas has oído el término “tokens”. No te asustes por la palabra, sé que puede sonar técnico, pero entender qué son los tokens y cómo funcionan es clave para aprovechar al máximo las capacidades de ChatGPT y otros modelos de IA.

Los tokens son el lenguaje "secreto" que usan estos sistemas para procesar nuestras palabras. Cuando envías un mensaje, este no llega al modelo como un simple texto: primero se divide en pequeños fragmentos llamados tokens.

¿Por qué es importante? Porque la cantidad de tokens determina cosas como el tamaño de las respuestas, los límites de procesamiento e incluso el coste de usar modelos avanzados como GPT-4o mediante su API.

En este artículo, te explico todo lo que necesitas saber sobre los tokens: qué son, cómo se calculan, cuáles son sus límites y cómo impactan tanto en el rendimiento como en el coste de usar un modelo de lenguaje.

¿Qué son los tokens y cómo se calculan?

Los tokens son pequeños fragmentos en los que se divide el texto antes de que el modelo lo procese. Piensa en ellos como piezas de un rompecabezas que, juntas, forman las palabras y frases que vemos.

Pero no siempre corresponden directamente con palabras completas. Por ejemplo, una sola palabra puede dividirse en varios tokens dependiendo de su longitud, su idioma o su contexto.

Aquí te dejo algunas reglas prácticas para entender los tokens:

1 token equivale aproximadamente a 4 caracteres en inglés.
100 tokens equivalen más o menos a 75 palabras.

Veamos algunos ejemplos concretos:

La frase “Perdemos el 100% de los tiros que no realizamos” está compuesta por 9 palabras, sin embargo, utiliza 14 tokens.
Una transcripción más larga, como la Declaración de Independencia de los Estados Unidos, ocupa aproximadamente 1.695 tokens.

Además, el número de tokens varía según el idioma. Por ejemplo, en inglés, las palabras suelen ser más cortas y los tokens más eficientes. Pero en español, las frases generan más tokens debido a la forma en la que el modelo procesa las conjugaciones de los verbos y los acentos.

¿Quieres calcular cuántos tokens utiliza tu texto? Puedes usar el Tokenizer, una herramienta de OpenAI que te permite ver cómo se divide tu mensaje en tokens. Es bastante interesante si eres curioso.

Límites de tokens en ChatGPT

Los modelos de OpenAI tienen límites específicos en la cantidad de tokens que pueden procesar en cada interacción. Este límite incluye tanto el texto que envías como la respuesta que genera el modelo.

Es decir, si usas muchos tokens en tu mensaje inicial, habrá menos espacio para que el modelo genere una respuesta detallada.

Aquí tienes una idea general de los límites según el modelo:

GPT-4o: Hasta 16.384 tokens por interacción.
o1: Hasta 32.768 tokens por interacción.

Para ponerlo en perspectiva, 16.384 tokens son aproximadamente 12.000 palabras, mientras que 32.768 tokens equivalen a unas 24.000 palabras, más que suficiente para analizar textos muy largos o realizar tareas complejas.

¿Qué pasa si superas este límite? En ese caso, el modelo no podrá procesar tu solicitud completa.

Por eso, cuando trabajes con textos largos, es útil dividirlos en partes más pequeñas o condensar la información para ajustarte al límite de tokens.

Impacto de los tokens en el rendimiento y los costes de la API

El uso de tokens no solo afecta la longitud de las respuestas, sino también el coste de usar la API de OpenAI. Esto es especialmente relevante si trabajas con modelos avanzados como GPT-4o, ya que los costes se calculan en función de la cantidad de tokens procesados (entrada + salida).

Por ejemplo:

GPT-4o mini es más económico por token, pero tiene un límite de procesamiento menor.
GPT-4o, aunque más caro, permite trabajar con interacciones mucho más extensas, lo que lo hace ideal para proyectos complejos.

Si buscas optimizar el precio de coste, aquí tienes algunos consejos prácticos:

Simplifica tus mensajes: Trata de ser claro y conciso en tus solicitudes para reducir la cantidad de tokens usados.
Divide tareas largas: Si tienes un texto extenso, procesa partes más pequeñas en lugar de enviarlo todo de una vez.
Aprovecha herramientas externas: Usa aplicaciones como Tiktoken para calcular los tokens antes de enviar una solicitud.

Estos pequeños ajustes pueden marcar una gran diferencia, especialmente si usas la API en proyectos profesionales.

Conclusión

Los tokens son uno de los conceptos más importantes para entender cómo funciona ChatGPT y otros modelos de lenguaje. Aunque puedan parecer un detalle técnico, su impacto es enorme: desde la forma en que el modelo entiende nuestras solicitudes hasta los costes asociados al uso de la API.

Ahora ya sabes qué son los tokens, cómo se calculan y cómo puedes gestionar sus límites para optimizar el rendimiento de ChatGPT.

Si quieres explorar más sobre este tema, te recomiendo usar herramientas como Tokenizer o experimentar con diferentes modelos para ver cómo manejan los tokens en la práctica.

Recuerda: entender los tokens te hará un usuario más eficiente, y te ayudará a aprovechar todo el potencial de la inteligencia artificial. ¡Atrévete a explorar y dominar este fascinante mundo! 😊