एजेंट खर्च नीति क्या है।
एक एजेंट व्यय नीति उन नियमों का सेट है जो एक AI-एजेंट वॉलेट से जुड़े होते हैं जो यह निर्धारित करते हैं कि एजेंट को क्या भुगतान करने की अनुमति है - एक प्रति-काल भत्ता (दैनिक, साप्ताहिक, या मासिक), एक प्रति-लेनदेन सीमा, और प्रारंभ और समाप्ति तिथियों की वैधता विंडो। नीति डैशबोर्ड में सेट की जाती है और वॉलेट API स्तर पर लागू होती है (एजेंट के हेरफेर करने योग्य दायरे के बाहर), प्रत्येक भुगतान पर निपटान से पहले इसकी जांच की जाती है। API इसे केवल पढ़ने के लिए उजागर करता है।
एकमात्र चीज जो स्वायत्त भुगतान को सुरक्षित बनाती है।
खर्च नीति के बिना, एक एजेंट को वॉलेट देना एक LLM को डॉलर-निर्धारित चेकबुक तक असीमित पहुंच देना है। दो विफलता मोड अनिवार्य हैं। पहला है भागने वाला लूप: एक एजेंट का योजनाकार एक भुगतान किए गए टूल को फिर से प्रयास करते हुए फंस जाता है और कुछ ही मिनटों में कार्यक्षेत्र का बैलेंस जला देता है। दूसरा है प्रॉम्प्ट इंजेक्शन: एक हमलावर एजेंट को एक सामान्य कार्य की तरह दिखने के तहत एक हमलावर-नियंत्रित वॉलेट का भुगतान करने के लिए मनाता है।
एक व्यय नीति निर्माण द्वारा दोनों विफलता मोड को सीमित करती है। runaway लूप अवधि भत्ते को समाप्त करता है और रुक जाता है। इंजेक्ट किया गया भुगतान प्रति-लेनदेन सीमा (या शेष भत्ते) को पार करता है और कभी भी सेटल नहीं होता। एजेंट को पूरी तरह से विश्वसनीय होने की आवश्यकता नहीं है क्योंकि वॉलेट नीति के बाहर कुछ भी सेटल करने से इनकार करता है। यह 'भुगतान करने वाले एजेंटों' के उत्पादन में उपयोगी होने और एक प्रयोग होने के बीच का अंतर है।
एक बार कॉन्फ़िगर करें, हर कॉल का मूल्यांकन करें।
- कॉन्फ़िगर करें। मानव उपयोगकर्ता डैशबोर्ड में नीति सेट करता है: एक प्रति-कालीन भत्ता, एक प्रति-लेनदेन सीमा, और एक वैकल्पिक वैधता विंडो (शुरुआत और समाप्ति तिथियाँ)। API नीति को केवल पढ़ने योग्य बनाता है; परिवर्तन ऑडिट-लॉग किए जाते हैं।
- पहचान से बांधें। नीति एजेंट की भुगतान पहचान से जुड़ती है। मल्टी-एजेंट कार्यक्षेत्र में प्रति एजेंट एक नीति होती है, साथ ही वैकल्पिक रूप से एक कार्यक्षेत्र-स्तरीय सीमा होती है जो योग को सीमित करती है।
- हर इरादे पर मूल्यांकन करें। जब एजेंट एक भुगतान इरादा प्रस्तुत करता है (आमतौर पर 402 प्रतिक्रिया द्वारा प्रेरित), तो वॉलेट API नीति को चलाता है: प्रति-लेनदेन सीमा की जांच करें, शेष अवधि भत्ते की जांच करें, वैधता विंडो की जांच करें।
- सेटल या अस्वीकार करें। यदि सभी जांच पास होती हैं, तो वॉलेट भुगतान को सेटल करता है और शेष भत्ते को घटाता है। यदि कोई जांच विफल होती है, तो वॉलेट भुगतान को अस्वीकार करता है (यह एक सीमा से अधिक है या विंडो के बाहर गिरता है) और सेटल नहीं करता है।
- ऑडिट। प्रत्येक स्वीकृत और प्रत्येक अस्वीकृत इरादा नीति निर्णय के साथ लॉग किया जाता है। मानव किसी भी समय लॉग की समीक्षा कर सकता है यह देखने के लिए कि एजेंट ने क्या प्रयास किया और नीति ने क्या अनुमति दी।
नीति उसी प्रकार की वस्तु है चाहे कितने भी एजेंट वॉलेट साझा करें। प्रति-एजेंट नीतियाँ बजट को साफ़ रूप से अलग करती हैं; माता-पिता स्तर पर एक कार्यक्षेत्र नीति सभी बाल एजेंटों के लिए एक सख्त सीमा लागू करती है।
उत्पादन में तीन नीति आकार जो हम देखते हैं।
एकल-कॉल सीमा के साथ प्रति-एजेंट दैनिक कैप
एक अनुसंधान एजेंट के पास $5/दिन की सीमा और $0.50/कॉल की छत है। यह $0.50 की 10 कॉल कर सकता है, या $0.05 की 100 कॉल कर सकता है, या दैनिक कुल के तहत किसी भी संयोजन में। एक उपकरण से $2.00 का आश्चर्यजनक चालान कॉल छत पर निपटारे से पहले अस्वीकृत हो जाता है। दोनों सीमाएँ एक साथ लागू होती हैं; तंग एक प्रति कॉल जीतता है।
केवल प्राप्त करने के लिए लॉकडाउन
एक एजेंट जो केवल भुगतान प्राप्त करता है उसकी भत्ता और प्रति-लेनदेन सीमा दोनों शून्य पर सेट होती हैं। इसे किसी भी समय कोई भी भुगतान कर सकता है, लेकिन यह बिल्कुल भी USDC नहीं भेज सकता - चाहे इसका कोड या एक प्रॉम्प्ट इंजेक्शन इसे क्या करने की कोशिश करे। दोनों सीमाओं को शून्य पर सेट करना प्रॉम्प्ट-इंजेक्शन-चालित भुगतान पुनर्निर्देशन के खिलाफ सबसे मजबूत रक्षा है: वॉलेट हर आउटगोइंग भुगतान को अस्वीकार करता है।
समय-सीमित सहभागिता विंडो
एक ठेकेदार एजेंट को एक व्यय अनुमति दी जाती है जो केवल संलग्नता की 30-दिन की विंडो (एक प्रारंभ और समाप्ति तिथि) के लिए मान्य होती है। विंडो के भीतर यह अपनी साप्ताहिक भत्ते तक खर्च कर सकता है; समाप्ति तिथि के बाद अनुमति समाप्त हो जाती है और कोई और भुगतान नहीं सेटल होता है, बिना किसी को इसे बंद करने की याद रखने की आवश्यकता के।
जहाँ यह फिट होता है।
एजेंट भुगतान पहचान
वह agent identity जिससे spend policy जुड़ती है. एक identity, एक policy, एक budget envelope.
एजेंट-से-एजेंट भुगतान
वह flow जिसके लिए spend policy सबसे उपयोगी है, क्योंकि counterparty स्वयं एक autonomous agent होता है.
भुगतान किया गया MCP उपकरण
वह tool category जिसे spend policies सबसे आम तौर पर govern करती हैं. Settlement से पहले 402 quote को policy के खिलाफ checked किया जाता है.