Qu'est-ce qu'une politique de dépenses d'agent.
Une politique de dépenses d'agent est l'ensemble des règles attachées à un portefeuille d'agent IA qui régissent ce que l'agent est autorisé à payer - une allocation par période (quotidienne, hebdomadaire ou mensuelle), un plafond par transaction et une fenêtre de validité avec des dates de début et de fin. La politique est définie dans le tableau de bord et appliquée au niveau de l'API du portefeuille (en dehors du champ manipulable de l'agent), vérifiée à chaque paiement avant qu'il ne soit réglé. L'API l'expose en lecture seule.
La seule chose qui rend le paiement autonome sûr.
Sans une politique de dépenses, donner à un agent un portefeuille revient à donner à un LLM un accès illimité à un chéquier libellé en dollars. Deux modes de défaillance sont inévitables. Le premier est la boucle incontrôlée : le planificateur d'un agent reste bloqué à réessayer un outil payant et épuise le solde de l'espace de travail en quelques minutes. Le second est l'injection de prompt : un attaquant convainc l'agent de payer un portefeuille contrôlé par l'attaquant sous couvert de ressembler à une tâche normale.
Une politique de dépense limite les deux modes d'échec par construction. La boucle incontrôlable épuise l'allocation de période et s'arrête. Le paiement injecté dépasse le plafond par transaction (ou l'allocation restante) et ne se règle jamais. L'agent n'a pas besoin d'être parfaitement digne de confiance car le portefeuille refuse de régler quoi que ce soit en dehors de la politique. C'est la différence entre 'les agents qui paient' étant utilisables en production et étant une expérience.
Configurez une fois, évaluez chaque appel.
- Configurer. L'utilisateur humain définit la politique dans le tableau de bord : une allocation par période, un plafond par transaction et une fenêtre de validité optionnelle (dates de début et de fin). L'API expose la politique en lecture seule ; les modifications sont enregistrées dans un audit.
- Lier à l'identité. La politique s'attache à l'identité de paiement de l'agent. Les espaces de travail multi-agents ont une politique par agent, plus éventuellement un plafond au niveau de l'espace de travail qui limite la somme.
- Évaluer à chaque intention. Lorsque l'agent soumet une intention de paiement (généralement déclenchée par une réponse 402), l'API du portefeuille exécute la politique : vérifiez le plafond par transaction, vérifiez l'allocation restante par période, vérifiez la fenêtre de validité.
- Régler ou rejeter. Si toutes les vérifications passent, le portefeuille règle le paiement et décrémente l'allocation restante. Si une vérification échoue, le portefeuille rejette le paiement (il dépasse une limite ou tombe en dehors de la fenêtre) et ne règle pas.
- Audit. Chaque intention acceptée et chaque intention rejetée est enregistrée avec la décision de politique jointe. L'humain peut consulter le journal à tout moment pour voir ce que l'agent a tenté et ce que la politique a permis.
La politique est le même type d'objet peu importe combien d'agents partagent le portefeuille. Les politiques par agent isolent proprement les budgets ; une politique d'espace de travail au niveau parent applique un plafond strict à tous les agents enfants combinés.
Trois formes de politique que nous voyons en production.
Plafond quotidien par agent avec plafond d'appel unique
Un agent de recherche a un plafond de 5 $/jour et un plafond de 0,50 $/appel. Il peut effectuer 10 appels de 0,50 $, ou 100 appels de 0,05 $, ou toute combinaison sous le total quotidien. Une facture surprise de 2,00 $ d'un outil est rejetée au plafond d'appel avant de se régler. Les deux limites s'appliquent simultanément ; la plus stricte l'emporte par appel.
Verrouillage en réception seule
Un agent qui ne reçoit que des paiements a son allocation et son plafond par transaction tous deux fixés à zéro. Il peut être payé par n'importe qui à tout moment, mais il ne peut pas envoyer de USDC du tout - peu importe ce que son code ou une injection de prompt essaie de lui faire faire. Fixer les deux limites à zéro est la défense la plus forte contre la redirection de paiement par injection de prompt : le portefeuille refuse chaque paiement sortant.
Fenêtre d'engagement limitée dans le temps
Un agent contractuel se voit attribuer une autorisation de dépense qui n'est valide que pour la fenêtre de 30 jours de l'engagement (une date de début et de fin). Dans la fenêtre, il peut dépenser jusqu'à son allocation hebdomadaire ; après la date de fin, l'autorisation expire et aucun paiement supplémentaire ne se règle, sans que personne n'ait à se souvenir de l'éteindre.
Où cela s'intègre.
Identité de paiement de l'agent
L'identité d'agent à laquelle la politique de dépenses s'attache. Une identité, une politique, une enveloppe budgétaire.
Paiement d'agent à agent
Le flux pour lequel la politique de dépenses est la plus utile, car la contrepartie est elle-même un agent autonome.
Outil MCP payant
La catégorie d'outils la plus couramment régie par des politiques de dépenses. Le devis 402 est vérifié par rapport à la politique avant règlement.