একটি এজেন্ট ব্যয় নীতি কী।
একটি এজেন্ট ব্যয় নীতি হল নিয়মগুলির সেট যা একটি AI-এজেন্ট ওয়ালেটের সাথে সংযুক্ত থাকে যা নিয়ন্ত্রণ করে এজেন্টকে কী পরিশোধ করতে দেওয়া হয়েছে - একটি প্রতি-সময়ের বরাদ্দ (প্রতিদিন, প্রতি সপ্তাহে, বা প্রতি মাসে), একটি প্রতি-লেনদেন ক্যাপ, এবং শুরু এবং শেষ তারিখের একটি বৈধতা উইন্ডো। নীতি ড্যাশবোর্ডে সেট করা হয় এবং ওয়ালেট API স্তরে (এজেন্টের নিয়ন্ত্রণযোগ্য পরিসরের বাইরে) প্রয়োগ করা হয়, এটি নিষ্পত্তির আগে প্রতিটি পেমেন্টে পরীক্ষা করা হয়। API এটি শুধুমাত্র পড়ার জন্য প্রকাশ করে।
এটি একমাত্র জিনিস যা স্বায়ত্তশাসিত পেমেন্টকে নিরাপদ করে।
একটি ব্যয় নীতি ছাড়া, একটি এজেন্টকে একটি ওয়ালেট দেওয়া হল একটি LLM-কে একটি ডলার-নির্ধারিত চেকবুকের অসীম অ্যাক্সেস দেওয়া। দুটি ব্যর্থতার মোড অনিবার্য। প্রথমটি হল runaway loop: একটি এজেন্টের পরিকল্পনাকারী একটি পেইড টুল পুনরায় চেষ্টা করতে আটকে যায় এবং কয়েক মিনিটের মধ্যে কর্মক্ষেত্রের ব্যালেন্স পুড়িয়ে দেয়। দ্বিতীয়টি হল প্রম্পট ইনজেকশন: একজন আক্রমণকারী এজেন্টকে একটি আক্রমণকারী-নিয়ন্ত্রিত ওয়ালেট পেমেন্ট করতে convinces করে একটি স্বাভাবিক কাজের মতো দেখানোর আড়ালে।
একটি খরচ নীতি উভয় ব্যর্থতার মোডকে নির্মাণ দ্বারা সীমাবদ্ধ করে। runaway লুপ সময়ের বরাদ্দ শেষ করে এবং থেমে যায়। ইনজেক্ট করা পেমেন্ট প্রতি-লেনদেনের সীমা (অথবা বাকি বরাদ্দ) অতিক্রম করে এবং কখনও নিষ্পত্তি হয় না। এজেন্টকে পুরোপুরি বিশ্বাসযোগ্য হতে হবে না কারণ ওয়ালেট নীতির বাইরে কিছু নিষ্পত্তি করতে অস্বীকার করে। এটি 'যে এজেন্টগুলি অর্থ প্রদান করে' উৎপাদনে ব্যবহারযোগ্য হওয়ার এবং একটি পরীক্ষার মধ্যে ব্যবধান।
একবার কনফিগার করুন, প্রতিটি কল মূল্যায়ন করুন।
- কনফিগার করুন। মানব ব্যবহারকারী ড্যাশবোর্ডে নীতি সেট করে: একটি প্রতি-পিরিয়ড বরাদ্দ, একটি প্রতি-লেনদেন সীমা, এবং একটি ঐচ্ছিক বৈধতা উইন্ডো (শুরু এবং শেষ তারিখ)। API নীতিটি পড়ার জন্য উপলব্ধ করে; পরিবর্তনগুলি অডিট-লগ করা হয়।
- পরিচয়ের সাথে বাঁধুন। নীতি এজেন্টের পেমেন্ট পরিচয়ের সাথে সংযুক্ত। মাল্টি-এজেন্ট কর্মক্ষেত্রের প্রতিটি এজেন্টের জন্য একটি নীতি রয়েছে, এছাড়াও একটি কর্মক্ষেত্র-স্তরের ক্যাপ থাকতে পারে যা মোটকে সীমাবদ্ধ করে।
- প্রতিটি উদ্দেশ্যে মূল্যায়ন করুন। যখন এজেন্ট একটি পেমেন্ট উদ্দেশ্য জমা দেয় (সাধারণত একটি 402 প্রতিক্রিয়া দ্বারা চালিত), ওয়ালেট API নীতিটি চালায়: প্রতি-লেনদেন সীমা পরীক্ষা করুন, বাকি সময়ের বরাদ্দ পরীক্ষা করুন, বৈধতা উইন্ডো পরীক্ষা করুন।
- নিষ্পত্তি করুন বা প্রত্যাখ্যান করুন। যদি সমস্ত পরীক্ষা পাস হয়, তবে ওয়ালেট অর্থ প্রদান নিষ্পত্তি করে এবং বাকি বরাদ্দ কমায়। যদি কোন পরীক্ষা ব্যর্থ হয়, তবে ওয়ালেট অর্থ প্রদান প্রত্যাখ্যান করে (এটি একটি সীমা অতিক্রম করে বা উইন্ডোর বাইরে পড়ে) এবং নিষ্পত্তি করে না।
- অডিট। প্রতিটি গৃহীত এবং প্রতিটি প্রত্যাখ্যাত উদ্দেশ্য নীতির সিদ্ধান্ত সংযুক্ত করে লগ করা হয়। মানুষ যে কোনও সময় লগ পর্যালোচনা করতে পারে যাতে দেখতে পারে এজেন্টটি কি চেষ্টা করেছে এবং নীতি কি অনুমোদন করেছে।
নীতি হল একই ধরনের বস্তু, তা যতজন এজেন্ট ওয়ালেট শেয়ার করে তার উপর নির্ভর করে না। প্রতি এজেন্ট নীতিগুলি বাজেটগুলি পরিষ্কারভাবে বিচ্ছিন্ন করে; একটি পিতামাতার স্তরের কর্মক্ষেত্রের নীতি সমস্ত শিশু এজেন্টগুলির সম্মিলিত উপর একটি কঠোর সিলিং প্রয়োগ করে।
তিনটি নীতি আকার যা আমরা উৎপাদনে দেখি।
একক কল সিলিং সহ এজেন্ট-প্রতি দৈনিক সীমা
একটি গবেষণা এজেন্টের $৫/দিনের ক্যাপ এবং $০.৫০/কলের সিলিং রয়েছে। এটি $০.৫০ এর ১০টি কল করতে পারে, অথবা $০.০৫ এর ১০০টি কল করতে পারে, অথবা দৈনিক মোটের অধীনে যেকোনো সংমিশ্রণ করতে পারে। একটি টুল থেকে একটি অপ্রত্যাশিত $২.০০ চালান কলের সিলিংয়ে প্রত্যাখ্যাত হয় আগে এটি কখনও নিষ্পত্তি হয়। উভয় সীমা একসাথে কার্যকর হয়; সবচেয়ে কঠোরটি প্রতি কলের জন্য জয়ী হয়।
গ্রহণ-শুধু লকডাউন
একটি এজেন্ট যা কেবলমাত্র পেমেন্ট গ্রহণ করে তার বরাদ্দ এবং প্রতি-লেনদেন ক্যাপ উভয়ই শূন্যে সেট করা হয়। এটি যে কেউ যে কোনও সময়ে পরিশোধ করতে পারে, তবে এটি মোটেও USDC পাঠাতে পারে না - এটি কীভাবে কোড বা একটি প্রম্পট ইনজেকশন এটি করতে চেষ্টা করে তার উপর নির্ভর করে। উভয় সীমা শূন্যে সেট করা হল প্রম্পট-ইনজেকশন-চালিত পেমেন্ট পুনর্নির্দেশের বিরুদ্ধে সবচেয়ে শক্তিশালী প্রতিরক্ষা: ওয়ালেট প্রতিটি আউটগোয়িং পেমেন্ট প্রত্যাখ্যান করে।
টাইম-বক্সড এনগেজমেন্ট উইন্ডো
একটি ঠিকাদার এজেন্টকে একটি খরচ অনুমতি দেওয়া হয় যা শুধুমাত্র নিয়োগের 30 দিনের উইন্ডোর জন্য বৈধ (একটি শুরু এবং শেষ তারিখ)। উইন্ডোর মধ্যে এটি তার সাপ্তাহিক বরাদ্দ পর্যন্ত খরচ করতে পারে; শেষ তারিখের পরে অনুমতি মেয়াদ শেষ হয় এবং আর কোন পেমেন্ট নিষ্পত্তি হয় না, কাউকেই এটি বন্ধ করার কথা মনে রাখতে হবে না।
এখানে এটি ফিট করে।
এজেন্ট পেমেন্ট পরিচয়
যে agent identity-এর সাথে spend policy যুক্ত থাকে। একটি identity, একটি policy, একটি budget envelope।
এজেন্ট-থেকে-এজেন্ট অর্থপ্রদান
যে flow-এর জন্য spend policy সবচেয়ে উপযোগী, কারণ counterparty নিজেই একটি autonomous agent।
পেইড MCP টুল
spend policies দ্বারা সবচেয়ে সাধারণভাবে governed tool category। settlement-এর আগে 402 quote policy-এর বিরুদ্ধে checked হয়।