मुख्य सामग्री पर जाएं
सीखेंशब्दावलीएजेंट व्यय नीति
शब्दावली

एजेंट खर्च नीति क्या है।

परिभाषा

एक एजेंट व्यय नीति उन नियमों का सेट है जो एक AI-एजेंट वॉलेट से जुड़े होते हैं जो यह निर्धारित करते हैं कि एजेंट को क्या भुगतान करने की अनुमति है - एक प्रति-काल भत्ता (दैनिक, साप्ताहिक, या मासिक), एक प्रति-लेनदेन सीमा, और प्रारंभ और समाप्ति तिथियों की वैधता विंडो। नीति डैशबोर्ड में सेट की जाती है और वॉलेट API स्तर पर लागू होती है (एजेंट के हेरफेर करने योग्य दायरे के बाहर), प्रत्येक भुगतान पर निपटान से पहले इसकी जांच की जाती है। API इसे केवल पढ़ने के लिए उजागर करता है।

यह क्यों महत्वपूर्ण है

एकमात्र चीज जो स्वायत्त भुगतान को सुरक्षित बनाती है।

खर्च नीति के बिना, एक एजेंट को वॉलेट देना एक LLM को डॉलर-निर्धारित चेकबुक तक असीमित पहुंच देना है। दो विफलता मोड अनिवार्य हैं। पहला है भागने वाला लूप: एक एजेंट का योजनाकार एक भुगतान किए गए टूल को फिर से प्रयास करते हुए फंस जाता है और कुछ ही मिनटों में कार्यक्षेत्र का बैलेंस जला देता है। दूसरा है प्रॉम्प्ट इंजेक्शन: एक हमलावर एजेंट को एक सामान्य कार्य की तरह दिखने के तहत एक हमलावर-नियंत्रित वॉलेट का भुगतान करने के लिए मनाता है।

एक व्यय नीति निर्माण द्वारा दोनों विफलता मोड को सीमित करती है। runaway लूप अवधि भत्ते को समाप्त करता है और रुक जाता है। इंजेक्ट किया गया भुगतान प्रति-लेनदेन सीमा (या शेष भत्ते) को पार करता है और कभी भी सेटल नहीं होता। एजेंट को पूरी तरह से विश्वसनीय होने की आवश्यकता नहीं है क्योंकि वॉलेट नीति के बाहर कुछ भी सेटल करने से इनकार करता है। यह 'भुगतान करने वाले एजेंटों' के उत्पादन में उपयोगी होने और एक प्रयोग होने के बीच का अंतर है।

यह कैसे काम करता है

एक बार कॉन्फ़िगर करें, हर कॉल का मूल्यांकन करें।

  1. कॉन्फ़िगर करें। मानव उपयोगकर्ता डैशबोर्ड में नीति सेट करता है: एक प्रति-कालीन भत्ता, एक प्रति-लेनदेन सीमा, और एक वैकल्पिक वैधता विंडो (शुरुआत और समाप्ति तिथियाँ)। API नीति को केवल पढ़ने योग्य बनाता है; परिवर्तन ऑडिट-लॉग किए जाते हैं।
  2. पहचान से बांधें। नीति एजेंट की भुगतान पहचान से जुड़ती है। मल्टी-एजेंट कार्यक्षेत्र में प्रति एजेंट एक नीति होती है, साथ ही वैकल्पिक रूप से एक कार्यक्षेत्र-स्तरीय सीमा होती है जो योग को सीमित करती है।
  3. हर इरादे पर मूल्यांकन करें। जब एजेंट एक भुगतान इरादा प्रस्तुत करता है (आमतौर पर 402 प्रतिक्रिया द्वारा प्रेरित), तो वॉलेट API नीति को चलाता है: प्रति-लेनदेन सीमा की जांच करें, शेष अवधि भत्ते की जांच करें, वैधता विंडो की जांच करें।
  4. सेटल या अस्वीकार करें। यदि सभी जांच पास होती हैं, तो वॉलेट भुगतान को सेटल करता है और शेष भत्ते को घटाता है। यदि कोई जांच विफल होती है, तो वॉलेट भुगतान को अस्वीकार करता है (यह एक सीमा से अधिक है या विंडो के बाहर गिरता है) और सेटल नहीं करता है।
  5. ऑडिट। प्रत्येक स्वीकृत और प्रत्येक अस्वीकृत इरादा नीति निर्णय के साथ लॉग किया जाता है। मानव किसी भी समय लॉग की समीक्षा कर सकता है यह देखने के लिए कि एजेंट ने क्या प्रयास किया और नीति ने क्या अनुमति दी।

नीति उसी प्रकार की वस्तु है चाहे कितने भी एजेंट वॉलेट साझा करें। प्रति-एजेंट नीतियाँ बजट को साफ़ रूप से अलग करती हैं; माता-पिता स्तर पर एक कार्यक्षेत्र नीति सभी बाल एजेंटों के लिए एक सख्त सीमा लागू करती है।

उदाहरण

उत्पादन में तीन नीति आकार जो हम देखते हैं।

उदाहरण 1

एकल-कॉल सीमा के साथ प्रति-एजेंट दैनिक कैप

एक अनुसंधान एजेंट के पास $5/दिन की सीमा और $0.50/कॉल की छत है। यह $0.50 की 10 कॉल कर सकता है, या $0.05 की 100 कॉल कर सकता है, या दैनिक कुल के तहत किसी भी संयोजन में। एक उपकरण से $2.00 का आश्चर्यजनक चालान कॉल छत पर निपटारे से पहले अस्वीकृत हो जाता है। दोनों सीमाएँ एक साथ लागू होती हैं; तंग एक प्रति कॉल जीतता है।

उदाहरण 2

केवल प्राप्त करने के लिए लॉकडाउन

एक एजेंट जो केवल भुगतान प्राप्त करता है उसकी भत्ता और प्रति-लेनदेन सीमा दोनों शून्य पर सेट होती हैं। इसे किसी भी समय कोई भी भुगतान कर सकता है, लेकिन यह बिल्कुल भी USDC नहीं भेज सकता - चाहे इसका कोड या एक प्रॉम्प्ट इंजेक्शन इसे क्या करने की कोशिश करे। दोनों सीमाओं को शून्य पर सेट करना प्रॉम्प्ट-इंजेक्शन-चालित भुगतान पुनर्निर्देशन के खिलाफ सबसे मजबूत रक्षा है: वॉलेट हर आउटगोइंग भुगतान को अस्वीकार करता है।

उदाहरण 3

समय-सीमित सहभागिता विंडो

एक ठेकेदार एजेंट को एक व्यय अनुमति दी जाती है जो केवल संलग्नता की 30-दिन की विंडो (एक प्रारंभ और समाप्ति तिथि) के लिए मान्य होती है। विंडो के भीतर यह अपनी साप्ताहिक भत्ते तक खर्च कर सकता है; समाप्ति तिथि के बाद अनुमति समाप्त हो जाती है और कोई और भुगतान नहीं सेटल होता है, बिना किसी को इसे बंद करने की याद रखने की आवश्यकता के।

सामान्य प्रश्न

तीन सामान्य प्रश्न।

व्यय नीति और दर सीमा के बीच क्या अंतर है?

एक दर सीमा कॉल की संख्या को नियंत्रित करती है; एक खर्च नीति कॉल के बीच डॉलर मूल्य को नियंत्रित करती है। एक एजेंट को प्रति मिनट 100 कॉल की दर सीमा हो सकती है लेकिन यदि उन कॉल की लागत $1 है और एजेंट उन्हें एक घंटे तक बनाता है तो यह अपने कार्यक्षेत्र को दिवालिया कर सकता है। एक खर्च नीति कॉल की संख्या की परवाह किए बिना डॉलर के जोखिम को सीमित करती है। दोनों नियंत्रण एक-दूसरे को पूरा करते हैं - दर सीमाएँ एजेंट रनटाइम पर सेवा-इनकार को रोकती हैं, खर्च नीतियाँ एजेंट के वॉलेट पर धन-इनकार को रोकती हैं।

नीति कहाँ लागू होती है - एजेंट कोड में या वॉलेट में?

वॉलेट में, भुगतान API परत पर। एजेंट कोड में इसे लागू करना यह होगा कि कोई भी प्रॉम्प्ट-इंजेक्शन हमला जो एजेंट के योजनाकार को बायपास करता है, बजट को भी बायपास करता है। इसे वॉलेट API में लागू करके, नीति एजेंट के हेरफेर करने योग्य दायरे से बाहर है। एजेंट एक भुगतान इरादा प्रस्तुत करता है; वॉलेट नीति के खिलाफ इरादे का मूल्यांकन करता है; वॉलेट या तो निपटान करता है या अस्वीकृत करता है। एजेंट अपनी सीमाएँ नहीं बढ़ा सकता।

क्या उपयोगकर्ता नीति को मध्य में समायोजित कर सकता है यदि एक वैध खर्च को अस्वीकार किया जा रहा है?

हाँ, लेकिन केवल मानव उपयोगकर्ता (या कोई अन्य अधिकृत मानव) इसे समायोजित कर सकता है - कभी भी एजेंट स्वयं नहीं। वॉलेट का प्रशासन पैनल नीति संपादक को उजागर करता है; परिवर्तन के साथ कौन और कब ऑडिट-लॉग होते हैं। यह डिफ़ॉल्ट रूप से एजेंट को गार्डरेल के भीतर रखता है जबकि मानव को वैध बड़े खर्च के आने पर उन्हें आवश्यक ओवरराइड देता है। एजेंट को अपनी योजना चक्र के भीतर 'कृपया मेरी सीमा बढ़ाएँ' पूछने का कोई तरीका नहीं मिलता, क्योंकि इससे सीमा रखने का उद्देश्य विफल हो जाएगा।
अंतिम समीक्षा: 2026-05-15. CC BY 4.0 के अंतर्गत प्रकाशित।

अपने एजेंट को एक बजट लिफाफा दें।

प्रति-काल भत्ते और प्रति-लेनदेन कैप, डैशबोर्ड में सेट किए गए। शुरू करने के लिए मुफ्त।