Home / Video / Costruire agenti AI
Costruire agenti AI: agent loop, MCP e context engineering
Perché vale la pena vederlo
Agenti AI da zero: questo corso spiega la differenza tra chat e agent, l'agent loop e come trasformare cartelle di file markdown in reparti operativi della tua azienda. Builder-to-builder, zero teoria, demo su Claude Code, Codex e Antigravity.
Per chi è
Riassunto
Greg Isenberg ospita Remy Gaskill in un corso gratuito su come costruire agenti AI funzionanti partendo da zero. La premessa è semplice: l'ecosistema AI si sta spostando dalla fase chat alla fase agent, e chi si ferma ai modelli di chat rischia di perdere terreno. Secondo Gaskill i founder e i dipendenti che usano gli agent sono dalle 10 alle 20 volte più produttivi ogni giorno, e quel vantaggio cresce nel tempo, settimana dopo settimana. L'obiettivo dichiarato del video è dare a chiunque gli strumenti concettuali per costruire agent capaci di gestire interi reparti, dentro qualsiasi agent harness.
Chat contro agent: da domanda a risposta, da obiettivo a risultato
Il punto di partenza è una definizione pulita, perché la parola agent online ha perso significato. Un chat model funziona da domanda a risposta: si chiede qualcosa, l'AI risponde, poi il lavoro lo fa l'utente. Un agent funziona da obiettivo a risultato: gli si dà un task, lui lo pianifica, lo esegue e consegna l'output. L'immagine usata nel video è quella del ping-pong (chat) contro il dare un obiettivo e lasciare che il sistema ci si avvicini da solo (agent).
Quando si chiede a un agent di costruire un sito web, in quel passaggio succede qualcosa di preciso. Gaskill chiama questo processo l'agent loop, fatto di tre fasi: observe, think, act. L'agent riceve il prompt, controlla se ci sono file utili nel workspace, pensa al passo successivo, agisce, e poi rientra nel loop. Nell'esempio del sito per Greg, un agent senza context parte dal prompt, si rende conto di non sapere chi sia Greg, decide di fare ricerca, riporta i risultati nella fase di observe, scrive un piano, scrive il codice, e ripete il ciclo finché non conclude che il task è completo. Come capisce di aver finito dipende dai parametri fissati nel prompt: se il task è "raccogli dieci fonti e produci un report", una volta raccolte le fonti e prodotto il report il loop si chiude.
I quattro componenti di un agent e l'agent harness
Un agent si compone di quattro elementi. Il primo è l'LLM, il cervello (i modelli citati nel video come esempi sono Claude Opus, GPT e Gemini). Il secondo è il loop, che fa proseguire il lavoro senza fermarsi alla prima risposta e senza che l'utente debba fare da babysitter. Il terzo sono i tool collegati. Il quarto è il context. La piattaforma che fa girare questo loop si chiama agent harness, e tutte le piattaforme di agenti note sul mercato sono semplicemente agent harness: applicazioni dove quel loop viene fatto girare.
La dimostrazione gira in parallelo su tre cartelle demo, una per ciascun harness: Claude Code, Codex e Antigravity. A tutti e tre si dà lo stesso prompt, costruire un sito portfolio minimalista, e ciascuno lo pubblica in modalità preview. Il loop si vede in azione: Claude Code, collegato a Perplexity via MCP, lancia un sotto-agent per fare ricerca su Greg, poi scrive il codice, poi avvia il server locale, infine apre il sito e lo controlla con uno screenshot per concludere il task. Gaskill nota che Claude Code mostra il loop in modo più leggibile rispetto agli altri due, ma il processo sottostante è lo stesso. L'analogia proposta è quella della guida: si impara a guidare una volta (sterzo, freni, acceleratore) e poi si può salire su qualsiasi auto. Gli harness sono auto diverse, alcune con più accessori, ma una volta capiti i concetti si usano tutti.
Sicurezza e permessi: scoping di ciò a cui l'agent ha accesso
Sul fronte sicurezza, l'approccio descritto è lo scoping: limitare ciò a cui l'agent ha accesso. Per default Antigravity, Claude Code e Codex vengono descritti come molto sicuri: li sviluppano grandi aziende con molto in gioco sulla reputazione. La regola pratica riguarda quanto ci si sente a proprio agio nel concedere controllo: l'esempio citato è un agent costruito per gestire campagne pubblicitarie su Meta, una cosa rischiosa perché tocca budget. Si possono controllare privilegi e permessi sui tool, così che nel caso peggiore (un agent compromesso) il danno resti contenuto, per esempio concedendo accesso in sola lettura alle piattaforme più delicate. Open Claw viene descritto come il più simile a un far west tra gli harness, e per questo non il primo da cui partire.
Onboarding dell'agent: context engineering, agents.md e memory.md
Il cuore pratico del corso è la costruzione di un executive assistant dentro una cartella locale, partendo dall'idea che si costruisce un agent come si fa onboarding di un dipendente. Non si può pretendere che un assistente nuovo lavori bene senza prima spiegargli azienda, clienti e tool. Per questo serve un context file. Negli harness il file di context si chiama agents.md, oppure claude.md dentro Claude Code o gemini.md dentro Gemini, ma il concetto è identico: funziona come un system prompt, sempre presente, che contiene ruolo, contesto su chi sei e preferenze di lavoro. A ogni nuova sessione, prima di rispondere, l'agent carica quel context nella fase di observe. Senza, un prompt come "scrivimi una cold email" non produce nulla di utile; con il context caricato, lo stesso prompt banale restituisce un'email già contestualizzata.
È qui che entra in gioco lo spostamento da prompt engineering a context engineering: non conta più trovare il prompt perfetto, conta quanto bene si carica l'agent con le informazioni sulla propria attività. Per gestire molto context si può creare una cartella dedicata con file separati (brand voice, profilo cliente ideale) e istruire il claude.md a leggerla prima di ogni task, così da concatenare il context senza appesantire un singolo file. Alcuni collegano anche un vault di Obsidian come secondo cervello.
Resta un problema: l'agent non ricorda le preferenze tra una sessione e l'altra, a differenza dei chat model che hanno memoria automatica nel cloud (cosa che Gaskill considera un vantaggio degli agent, perché la memoria diventa controllabile e non mescola contesti diversi). La soluzione manuale è un file memory.md. Si aggiunge in cima al context file un'istruzione che dice all'agent di leggere memory.md, di aggiornarlo quando impara qualcosa di nuovo o viene corretto, e di tenerlo sempre allineato sostituendo le informazioni obsolete. Così nasce un self-improving loop: l'agent salva le preferenze, gli errori calano nel tempo e l'effetto si accumula su settimane e mesi. Sulla dimensione, la buona pratica citata per i file claude.md è restare entro circa 200 righe; se la memoria si riempie di correzioni minime, si può istruire l'agent a salvare solo quelle sostanziali. Alcuni harness, come Open Claw e Manus, integrano già un sistema di memoria che fa lo stesso lavoro in automatico.
MCP, skill e scheduled task: dove tutto inizia a comporsi
Per default gli harness hanno solo la web search integrata. Per collegare tool reali come Gmail, Google Calendar, Notion o Stripe serve MCP. La metafora usata nel video: prima di MCP un LLM doveva imparare la lingua di ogni tool (con sviluppo custom lungo), mentre MCP, creato da Anthropic, fa da traduttore standard tra agent e tool, senza dover sviluppare integrazioni custom per ciascuno. Negli harness collegare un tool è semplice, spesso bastano i connettori già pronti. Con i tool collegati, un task come "rivedi le note del meeting, prepara la proposta, crea il link di pagamento Stripe e imposta il progetto in Notion" gira da un unico posto, senza saltare tra app e copiare contesto a mano.
Le skill sono il livello successivo: SOP per l'AI, cioè standard operating procedure impacchettate. Si spiega un processo una volta, lo si salva in un file .skill (un file markdown che descrive il processo) e non lo si rispiega mai più. Due modi per crearle: descrivere a priori la skill che si vuole (per esempio caricando il transcript di un corso e chiedendo di trasformarlo in skill, sfruttando la skill creator skill già presente negli harness), oppure eseguire un processo manualmente una volta e poi chiedere di impacchettare in skill quello che si è appena fatto. L'esempio concreto è una skill di analisi degli annunci che, dato l'URL di una ad library, fa screenshot delle landing page, raccoglie tutti gli annunci di un brand (nel caso citato circa 220) e produce un report completo: un lavoro che manualmente avrebbe richiesto tre o quattro ore. Le skill possono essere globali (valide in ogni progetto) o a livello di progetto, esattamente come i file claude.md e gli MCP.
L'ultimo tassello sono gli scheduled task, cioè cron job: molti harness ora permettono di lanciare una skill su pianificazione, per esempio un daily brief che ogni mattina alle 9 riassume calendario, inbox e progetti. Le skill si possono anche concatenare: una morning brief skill che, se trova un meeting in agenda, richiama una skill di ricerca per preparare il profilo dell'ospite. Combinando context file, MCP, skill e scheduled task, e automatizzando da tre a cinque piccoli processi manuali a settimana, si arriva a far girare interi reparti in modo autonomo.
Da dove partire: quale harness e il percorso consigliato
Per i principianti, l'indicazione è chiara. Open Claw è tra i più difficili da imparare e configurare; Claude Code è indicato come il più semplice, con Perplexity Compute e Manus altrettanto accessibili. Il percorso suggerito è costruire prima tutti i processi e le skill dentro Claude Code, prendere confidenza, e solo quando tutto funziona bene valutare la migrazione verso un harness più autonomo come Open Claw. Il punto operativo per founder, builder e operator: si individuano i ruoli da delegare a un agent, si usa un chat model in stile intervista per costruire i context file, si collegano i tool necessari via MCP e si creano le skill nell'uso quotidiano, una alla volta, finché ogni processo ripetitivo della giornata è impacchettato e riutilizzabile.
Key takeaways
- →La differenza chiave tra chat e agent: un chat model va da domanda a risposta, un agent va da obiettivo a risultato. L'agent pianifica, esegue e consegna passando in loop tra tre fasi (observe, think, act) finché non conclude il task.
- →Un agent si compone di quattro elementi: l'LLM (il cervello), il loop che continua finché il task non è finito, i tool collegati e il context. La piattaforma che fa girare questo loop si chiama agent harness: Claude Code, Codex, Antigravity, Open Claw, Manus, Cowork sono tutte agent harness.
- →Si costruisce un agent come si fa onboarding di un dipendente: prima gli si spiega chi sei, cosa vende l'azienda, quali tool usi. Il context si carica in un file (agents.md, oppure claude.md o gemini.md a seconda dell'harness), letto in automatico a ogni nuova sessione.
- →Context engineering ha sostituito il prompt engineering. Con un context file ben fatto, il prompt può restare banale (scrivimi una cold email) e il risultato resta ottimo. Un file memory.md crea un self-improving loop: l'agent salva preferenze e correzioni e gli errori calano nel tempo.
- →Le skill sono SOP (Standard Operating Procedure) per l'AI: si spiega un processo una volta, si impacchetta in un file .skill e non lo si rispiega mai più. Combinate con MCP (per collegare i tool) e con gli scheduled task, le skill automatizzano un processo manuale alla volta finché interi reparti girano da soli.


