Cos'è un server MCP.
Un server MCP è un servizio che espone strumenti, risorse o prompt agli agenti AI tramite il Protocollo di Contesto del Modello. Gli agenti scoprono il server, leggono le descrizioni degli strumenti e chiamano quegli strumenti come parte del loro piano. Un server MCP a pagamento aggiunge un comportamento in più: può restituire HTTP 402 con un URL di pagamento, aspettandosi che il portafoglio dell'agente si regoli prima che lo strumento venga effettivamente eseguito.
Un contratto, molti runtime per agenti.
Prima di MCP, ogni fornitore di strumenti doveva fornire un'integrazione diversa per ogni host di agente - una per Claude Desktop, una per un'estensione Cursor, una per un runtime interno di agente, una per il formato di chiamata delle funzioni di OpenAI. Ogni integrazione si allontanava indipendentemente. MCP riduce tutto a un'unica interfaccia server. Scrivi il server una volta; qualsiasi client consapevole di MCP può usarlo.
Quel contratto uniforme è ciò che rende la monetizzazione del server MCP fattibile. Se ogni runtime di agente parlasse il proprio dialetto, addebitare per chiamata di strumento richiederebbe un'integrazione di fatturazione separata per dialetto. Con MCP, il server restituisce 402 una volta, in HTTP, e qualsiasi runtime il cui agente ha un wallet può regolarlo. Il protocollo fissa il contratto; il layer di pagamento si inserisce sotto di esso.
Pubblica, invoca, facoltativamente addebita.
- Pubblicità. Il server pubblica un elenco di strumenti, ciascuno con un nome, input JSON-schema e una descrizione in linguaggio naturale. Il pianificatore dell'agente legge queste descrizioni quando decide quale strumento chiamare.
- Invoca. L'agente chiama uno strumento con argomenti strutturati. Il trasporto MCP (stdio, SSE o HTTP) consegna la chiamata al server.
- Autorizza. I server a pagamento controllano se questo chiamante ha già pagato per questa chiamata di strumento (tipicamente tramite chiave API, sessione o ricevuta di pagamento). Se sì, esegui lo strumento. Se no, restituisci 402 con un URL di pagamento.
- Regola (se pagato). Il wallet dell'agente paga all'URL. Il fornitore del wallet conferma il pagamento al server (tipicamente tramite un webhook firmato); il server contrassegna il chiamante come pagato e la chiamata ripetuta esegue lo strumento.
- Restituisci. Il risultato torna all'agente attraverso il trasporto MCP. L'agente integra il risultato nel suo prossimo passo di ragionamento. I server MCP gratuiti saltano completamente i passaggi 3 e 4.
Il fornitore non deve mai sapere quale runtime dell'agente sta chiamando, e l'agente non deve mai sapere quale fornitore di pagamento utilizza il server MCP. Entrambi i lati comunicano attraverso il contratto di protocollo.
Tre forme di server MCP.
Un server MCP di ricerca documentazione
Una startup pubblica un server MCP che espone un singolo strumento, search_docs(query). Qualsiasi agente consapevole di MCP (Claude Desktop, un agente di codifica, un agente interno presso un cliente) può installare il server, vedere lo strumento pubblicizzato e chiamarlo. La startup non deve mai spedire un SDK separato per ogni runtime dell'agente - il server MCP è l'SDK. Inizialmente gratuito, poi monetizzato successivamente restituendo 402 su query pesanti.
Un server MCP interno che collega un database privato
Un team di ingegneria gestisce un server MCP all'interno della propria infrastruttura che espone strumenti in sola lettura contro il loro magazzino di analisi di produzione. I loro agenti interni basati su Claude chiamano quegli strumenti per rispondere a domande aziendali. Nessuna API esterna, nessun SDK; il server MCP è il contratto. Poiché è interno, non è necessario alcun strato di pagamento - ma lo stesso modello di server funziona invariato se in seguito espongono una versione a pagamento ai partner.
Un elenco di marketplace MCP a pagamento
Un sviluppatore indipendente pubblica un server MCP che chiama un'API di dati finanziari premium e la rivende per query. Il loro server restituisce 402 con un URL di pagamento ospitato per qualsiasi chiamata allo strumento. Gli agenti che hanno un portafoglio pagano automaticamente (all'interno della loro politica di spesa); gli agenti senza portafoglio vedono il 402 e si fermano. Lo sviluppatore cattura entrate per chiamata senza dover inserire manualmente ogni cliente.