¿Cómo comprobar el uso de la API de Claude? Veamos primero Uso, Facturación y estos 4 campos

Para el uso de Claude API, primero debe mirar la página Uso para determinar cuánto ha usado y luego mirar la página Facturación para confirmar cuántos créditos quedan. Los campos más importantes para una sola solicitud son tokens de entrada, tokens de salida, tokens de entrada de creación de caché y tokens de entrada de lectura de caché.

El documento oficial del informe de uso y costo de Claude Console de Anthropic establece claramente que la página de Uso mostrará un desglose detallado del uso por modelo, fecha y hora, y clave API. La facturación se utiliza para realizar un seguimiento de los créditos y la recarga automática; Además, el uso de API es un sistema de crédito prepago y no forma parte de la suscripción al chat.

Después de que muchas personas comienzan a usar Claude API, lo primero en lo que se quedan atascados no es en "cómo llamar a la API", sino en "¿qué están mirando los números en segundo plano?" Vi claramente token, uso, facturación e incluso entrada, salida, lectura de caché, creación de caché, pero es difícil juzgar de un vistazo: cuánto tiempo dediqué, si fue normal y dónde hay espacio para la optimización. Esta es la dirección central capturada en su borrador original. Esta vez lo cambié a una versión que responde más directamente a la intención de búsqueda.

Dejemos claro primero: la tarifa de suscripción de Claude no es igual a la tarifa de API de Claude

Este punto debe quedar claro primero. El plan de suscripción de chat de Claude y la Consola/API de Claude son productos separados y se cobran por separado. Anthropic declaró oficialmente que API y Workbench actualmente se facturan mediante créditos de uso prepagos. Debes comprar créditos antes de poder usarlos. Una vez que se agoten los créditos, ya no podrá llamar a la API ni utilizar Workbench.

Esta distinción es importante porque muchas personas primero usan el modelo mental incorrecto cuando miran los números del backend. Si piensa en la API de Claude como "Ya pagué por Claude Pro o Team, por lo que no debería hacer daño ejecutar un poco más", es fácil subestimar el costo real. La comprensión correcta debe ser: la suscripción al chat resuelve su experiencia en la aplicación Claude y la API resuelve el costo de ejecución cuando conecta Claude a su sitio web, sistema, flujo de trabajo y scripts automatizados. No se pueden mezclar los dos. Esto también es coherente con el enfoque de su manuscrito original.

¿Dónde puedo comprobar el uso de la API de Claude? Los más importantes son dos lugares

El primer lugar: Página de uso

El documento oficial de Informes de uso y costos de Anthropic es muy claro. La página Uso proporcionará un desglose detallado del uso de API y se puede filtrar por modelo, fecha y hora y clave de API. También puede hacer clic en el gráfico de barras para ver la granularidad de horas y minutos, y admite la exportación CSV. Este es el primer lugar donde normalmente se ve "quién está comiendo, qué modelo se está quemando y en qué período de tiempo se produce el aumento".

Segundo lugar: página de facturación

La página de facturación no analiza el tráfico, sino el dinero. Anthropic declara oficialmente que el uso de API se deduce mediante créditos de uso prepagos. Puede verificar el saldo de crédito en la página de Facturación y también puede configurar la recarga automática para reponer automáticamente el saldo cuando el saldo esté por debajo de un cierto umbral. Esto significa que si sólo miras Uso y no Facturación, sabrás "cuánto has usado", pero no sabrás "cuánto te queda por usar".

Los hábitos de lectura más prácticos

El uso generalmente se rastrea todos los días o todas las semanas para ver quién lo está usando, qué modelo consume y qué clave API tiene un costo alto. Para mantenerse al tanto de su presupuesto o evitar interrupciones en el servicio, consulte Facturación para confirmar el saldo de crédito y la recarga automática. De esta manera, cuando observe los números del backend, no solo verá el flujo sino también el efectivo.

¿Qué estás mirando en la página de Uso? No solo el número total de tokens

La descripción oficial de Anthropic de la página de Uso es muy clara: no solo muestra un número total, sino que le permite dividir los datos usando diferentes dimensiones. La página de uso se puede ver:

Desmontado por fecha/hora

Desmontado por clave API

gráfico de tokens de entrada/salida

estadísticas totales de tokens de entrada/salida

solicitudes bloqueadas por límite de velocidad

Datos visuales de comparación ITPM / OTPM

En otras palabras, la página Uso puede ayudarle a responder no sólo "cuántos tokens he usado en total", sino también preguntas más prácticas, como: ¿Qué clave API se está quemando? ¿Es cierto modelo particularmente pesado? ¿Se trata de un aumento repentino durante un período determinado o un determinado flujo de trabajo siempre consume el volumen? Ninguno de estos juicios puede basarse únicamente en un número simbólico total.

Muchos novatos cometen un error, es decir, entran en pánico cuando ven una serie de números grandes, pensando que están abusados. Pero una ficha grande no significa necesariamente que el costo deba ser irrazonable. También debe considerar si es entrada o salida, si hay lectura de caché, si se usa un modelo más caro y si hay un costo adicional por el uso de herramientas. En otras palabras, la página Uso es el punto de entrada, pero no la respuesta completa. La respuesta real suele depender del campo de uso de una única solicitud. Este es también uno de los recordatorios más importantes de su artículo original.

Para comprender el costo de una sola solicitud, primero comprenda los 4 campos principales

Si desea comprender por qué una solicitud de Claude API es costosa o barata, lo primero en lo que debe concentrarse son estos 4 números:

1. tokens de entrada

Este campo no es tan simple como "todas las entradas que envía en toda la solicitud". El documento oficial de recuento de tokens de Anthropic establece claramente que el recuento de tokens admite indicaciones del sistema, herramientas, imágenes y archivos PDF, y también recuerda que el recuento de tokens real es una estimación. En la práctica, si solicita el almacenamiento en caché, es fácil juzgar mal la cantidad de entrada real al observar únicamente los tokens de entrada.

2. tokens de salida

Esto es más intuitivo, es la cantidad de tokens de salida realmente generados por el modelo. Muchos proyectos terminan siendo costosos no porque el mensaje sea demasiado largo, sino porque la configuración de salida es demasiado grande, las respuestas son demasiado largas o la tarea en sí requiere una salida larga. Esto es especialmente importante en la fijación de precios de Claude, porque el precio unitario del producto suele ser más alto que el del insumo.

3. tokens de entrada de creación de caché

Esto representa cuántos tokens de entrada se escribieron en el caché para esta solicitud para crear una nueva entrada de caché. No es gratis y escribir en el caché por primera vez no significa que ahorrará dinero de inmediato. Su borrador captura esto, así que mantendré esta dirección.

4. tokens de entrada de lectura de caché

Esto representa cuántos tokens se leyeron del caché existente en esta solicitud. Esto suele ser algo bueno, porque el almacenamiento en caché realmente comienza a ahorrar dinero cuando las lecturas se estabilizan. Si tiene un mensaje fijo del sistema, información de antecedentes extensa, contexto de archivo extenso o prefijo de conversación largo, esta columna suele ser la clave para determinar si la optimización es efectiva. Esto es consistente con la idea de costos de su manuscrito original.

El error más común para muchas personas es que los tokens de entrada no son iguales a la entrada total

Vale la pena mencionar este punto por separado. Los tokens de entrada que ve en segundo plano no son necesariamente iguales a la cantidad de entrada completa de toda su solicitud, especialmente cuando hay un caché, es más fácil juzgar mal. Es por eso que muchas personas dirán:

"Obviamente envié un mensaje y un archivo del sistema largos, ¿por qué hay tan pocos tokens de entrada?"

La respuesta generalmente no es que realmente enviaste muy pocos, sino que el contenido fijo anterior puede haber sido almacenado en caché o procesado de otras maneras, por lo que no todos caen en el número de entrada que entiendes intuitivamente. Una visión más práctica es: no centrarse solo en los tokens de entrada, sino observar la salida, la creación de caché y la lectura de caché en conjunto.

Solo así sabrás si tu estrategia de almacenamiento en caché te está ahorrando dinero. Su artículo original tenía mucha razón en este punto, pero lo conservé aquí y lo condensaré en una versión más legible.

¿Cómo calcular el coste? Primero mire el precio unitario del modelo y luego multiplíquelo por el tipo de token respectivo

El costo principal de Claude API sigue siendo: precio unitario del modelo × uso de token correspondiente. La página oficial de precios de Anthropic actualmente enumera los precios unitarios de entrada/salida de diferentes modelos. Por ejemplo, la brecha de costos entre los insumos y la producción de diferentes modelos de Claude es obvia. Generalmente el precio unitario del producto es mayor que el del insumo.

El malentendido más común aquí es: muchas personas solo miran el precio unitario del insumo, pero ignoran que el precio unitario del producto es en realidad más alto. Esto significa que si el escenario de su aplicación a menudo requiere que el modelo genere grandes cantidades de contenido, como:

Producción por lotes de copias del producto

, entonces el token de salida suele ser la parte realmente importante.

Entonces, cuando mires el backend de la API de Claude, no solo preguntes "cuánto envié", sino también "cuánto escupió el modelo". Muchos costos están fuera de control. De hecho, no es que el mensaje sea demasiado largo, sino que configuró los tokens máximos demasiado altos o no controló el rango de salida, lo que provocó que la salida se amplificara silenciosamente. Esto es completamente coherente con el criterio central de su borrador original.

Cuando se utiliza el almacenamiento en caché, el costo no es tan simple como entrada + salida

Si solicita el almacenamiento en caché, debe agregar una capa de lógica de almacenamiento en caché para verlo. Lo que realmente debería preguntar en este momento no es "¿Está habilitado el caché?", sino:

¿Hay mucha creación de caché?

¿Hay un acierto de lectura de caché estable?

¿Hay suficiente reutilización real?

Para los principiantes, la forma más fácil de juzgar no es diseñar primero un caché muy complejo, sino mirar primero los antecedentes: si los tokens de entrada de creación de caché a menudo tienen valor, pero los tokens de entrada de lectura de caché rara vez aparecen, generalmente significa que su estrategia de caché realmente no ha aportado valor de reutilización. Por otro lado, si la lectura ocurre de manera constante y el número es significativamente mayor que la entrada no almacenada en caché, generalmente significa que su caché está comenzando a ser efectiva. Esta forma de mirar es uno de los aspectos más valiosos de su manuscrito.

Además del token, ¿qué más afecta las tarifas de API de Claude?

Primero: herramientas del lado del servidor

Su borrador menciona la búsqueda web y otras herramientas, que es la dirección correcta. Siempre que ingrese al escenario de la herramienta, el costo ya no es solo el token de entrada/salida, sino que también puede ser el costo adicional de usar la herramienta en sí.

Segundo: el uso de herramientas en sí también hará que la solicitud sea más gorda

Cuando usa herramientas, no se trata simplemente de "ayudar al modelo a hacer una cosa más", sino que toda la estructura de la solicitud se hará más grande, incluidos los parámetros de herramientas, los bloques de uso de herramientas y los bloques de resultados de herramientas, lo que puede aumentar el uso de tokens. Mucha gente piensa que es solo una herramienta agregada, pero en realidad toda la estructura de costos de las solicitudes ha cambiado.

Tercero: El problema del límite de tasa no necesariamente equivale al problema del costo

Además de los tokens, la página de Uso de Anthropic también le permitirá ver la comparación entre las solicitudes de tasa limitada y ITPM / OTPM. Esto significa que si ve que la solicitud falla, no necesariamente significa que no tiene dinero, sino que también puede ser que se apresuró demasiado dentro de la unidad de tiempo.

Esta información es valiosa porque puede ayudarle a distinguir:

Si los dos se confunden, la dirección de optimización será completamente diferente.

¿Habrá algún cargo por solicitudes fallidas?

El Centro de ayuda oficial de Anthropic establece claramente que las solicitudes fallidas no se cobrarán, solo se cobrarán las llamadas API exitosas y las tareas completadas. Esto es importante para los costos de solución de problemas, porque si ve muchos registros de errores, no significa necesariamente que también se estén perdiendo créditos.

Pero esto no significa que pueda ignorar las solicitudes fallidas. Porque comercialmente todavía causará dos costos:

Vuelve a intentar la recuperación y el número total de solicitudes exitosas eventualmente aumentará

Por lo tanto, "no se cobran fallas" es una buena noticia, pero no significa que se pueda permitir que la tasa de fallas sea alta.

Tres hábitos que los principiantes deben establecer primero cuando miran el backend de la API de Claude

El primer hábito: uso y facturación separados

El uso resuelve "cómo es el tráfico" y la facturación resuelve "la cuota y el estado del flujo de efectivo". Si sólo miras uno de ellos, tu juicio fácilmente será incompleto. La documentación oficial de Anthropic lo ha dejado muy claro.

El segundo hábito: cada vez que verifique una sola solicitud, no mire solo los tokens de entrada

tokens de salida

tokens de entrada de creación de caché

tokens de entrada de lectura de caché

Especialmente cuando tiene un caché, mirar solo los tokens de entrada casi seguramente conducirá a un error de juicio.

El tercer hábito: dividir el juicio de costos en tres capas

Esta es una sección de su manuscrito que vale la pena conservar. Le ayudaré a condensarlo en una versión más clara:

Capa de modelo: ¿Qué modelo de Claude eligió?

Capa de salida: ¿La salida es demasiado larga?

Capa estructural: ¿Hay caché, herramientas, pensamiento u otros costos adicionales?

Las personas que realmente pueden comprender los costos de la API de Claude generalmente no solo miran el token, sino que pueden mirar estas tres capas juntas.

Para el uso de Claude API, primero debe consultar la página Uso para comprender el modelo, el tiempo y el uso de la clave API, y luego consultar la página Facturación para confirmar los créditos y la recarga automática. Los campos más importantes para una sola solicitud son tokens de entrada, tokens de salida, tokens de entrada de creación de caché y tokens de entrada de lectura de caché.

Cuando observa estos campos por separado del precio unitario del modelo, el uso de herramientas y el límite de velocidad, los números que originalmente parecían desordenados en Claude Console se convertirán en un panel que puede usar para controlar costos, riesgos y rendimiento. Este es también el punto central de su texto original que vale la pena conservar.

¿Cuál es la diferencia entre la página de Uso y la página de Facturación de Claude API?

La página Uso analiza principalmente el desglose del uso de API, como los datos de límite de tasa y token por modelo, fecha y clave de API; la página de Facturación analiza los créditos prepagos, el saldo y la configuración de recarga automática. El primero se centra en el análisis del tráfico, mientras que el segundo se centra en la gestión de pagos y cuotas.

¿Por qué los tokens de entrada de Claude API parecen ser menores que los que envié?

Debido a que el contenido que realmente envía no solo puede estar en el campo único de los tokens de entrada, especialmente cuando realiza almacenamiento en caché, es más fácil juzgar mal. En este momento, es necesario analizar la creación y la lectura del caché juntas.

Claude API tiene una suscripción de chat, ¿tengo que pagar tarifas API adicionales?

Sí. Anthropic establece oficialmente claramente que la suscripción al chat y la Consola/API son productos separados, y el uso de API y Workbench se factura mediante créditos de uso prepagos.

¿Habrá algún cargo por solicitudes fallidas de Claude API?

No. Oficialmente, solo se facturarán las llamadas API exitosas y las tareas completadas.

¿El almacenamiento en caché de la API de Claude realmente ahorra dinero?

Sí, pero solo si reutilizas el mismo prefijo de manera estable. Lo realmente valioso no es sólo ver la creación de caché, sino la aparición constante de lecturas de caché posteriores.

El uso de Claude API es alto, ¿significa necesariamente que el modelo es demasiado caro?

No necesariamente. También puede ser que la salida sea demasiado larga, la estructura de las herramientas sea demasiado gruesa, el caché no funcione en absoluto o sea simplemente un problema de límite de velocidad, no puramente un problema de precio del modelo.

Si desea volver a la página principal de los tutoriales de uso de tokens AI, puede leer este artículo primero: Tutorial de tokens AI para personas perezosas: desde los primeros pasos, el cálculo hasta el ahorro de costos, comprenda de inmediato

Fuente de datos y declaración de credibilidad Este artículo se basa principalmente en documentos oficiales de Anthropic e información oficial del centro de soporte, incluidos informes de costos y uso en Claude Console, ¿Cómo pago por el uso de mi API de Claude?, Conteo de tokens e información oficial de precios de Anthropic. otras fuentes. Dado que la interfaz, los precios de los modelos y los campos de funciones de Claude Console aún pueden ajustarse en el futuro, la pantalla real y las tarifas más recientes aún deberían estar sujetas al backend oficial de Anthropic y a los documentos oficiales. El objetivo de este artículo es ayudar a los usuarios principiantes y empresariales a establecer un marco de interpretación correcto, en lugar de reemplazar la página oficial de precios.

Este artículo pertenece a la categoría "Tutorial de uso de tokens de AI"

Esta categoría organiza principalmente el uso real de tokens de AI, la introducción de API, la interpretación del uso, la estimación de costos y la lógica de operación de la plataforma, para ayudar a los usuarios novatos, creadores de contenido, destinatarios de casos y empresas, cuando entran en contacto con la API de AI y las plataformas modelo, a comprender rápidamente cómo comenzar a usar, cómo verificar el uso y cómo evitar trampas al principio.

¿Qué pasa con la facturación de Claude Token? ¿Para qué escenarios de uso es adecuado?

¿Cómo juzgar si la versión de chat de Claude no es suficiente? En estas 5 situaciones, deberías leer Claude API

¿Qué deberías confirmar antes de usar Claude API? Se resumen costos, modelos y permisos

¿Qué puede hacer Claude API? Procesamiento de archivos, servicio al cliente, flujo de contenido 3 usos principales

API antrópica
API de Claude
Token de API
Almacenamiento en caché rápido
Uso de API de Claude
Tarifa de API de Claude
Consola de Claude

AI Token organiza los conceptos básicos, los métodos de cálculo, las tarifas de API y las comparaciones de modelos de AI Token (elementos de palabras) y cubre modelos comunes como ChatGPT, Gemini y Claude para ayudarlo a establecer una comprensión y un juicio claros más rápido.

¿Cómo comprobar el uso de la API de Claude? Veamos primero Uso, Facturación y estos 4 campos