Il bot del professionista: non si addestra, si costruisce

In breve Molti professionisti vogliono un proprio assistente AI, un bot che parli al posto loro, e immaginano di doverlo «addestrare» sulle proprie informazioni. È la parte sbagliata del problema. L'intelligenza di un bot si prende in prestito da un modello già capace, mentre ciò che lo rende affidabile è un altro strato: la conoscenza verificabile di chi è quel professionista, dichiarata in modo esplicito e mantenuta nel tempo. Il RAG riempie la memoria di lavoro ma non fa conoscere nessuno in modo stabile; addestrare i pesi del modello promette più di quanto mantenga. Quello che decide la fedeltà del bot è un nucleo di conoscenza strutturato e citabile, che non è un servizio nuovo da inventare ma la composizione di ciò su cui lavoro da sempre.

Tutti vogliono un bot, pochi sanno cosa lo rende affidabile

Da qualche mese la richiesta torna quasi identica. Un professionista, un avvocato, un consulente, un architetto, vorrebbe un assistente AI che risponda alle domande dei clienti, riassuma le sue competenze, filtri le richieste, racconti come lavora. E quasi sempre la richiesta arriva con una parola già scelta: «addestrarlo». L'idea implicita è che esista un modello da istruire sui propri documenti finché non impara a essere noi.

È un istinto comprensibile, ma punta nel posto sbagliato. Il problema di un bot che rappresenta una persona non è quanto sia intelligente, perché i modelli di oggi lo sono già abbastanza. Il problema è quanto sia fedele: un assistente che inventa una competenza, cita male una sentenza o resta fermo a un anno fa non protegge la reputazione del professionista, la danneggia. E la fedeltà non si ottiene rendendo il modello più sveglio, ma costruendo bene ciò che il modello legge prima di parlare.

Cos'è il bot del professionista, e cosa non è

Il bot del professionista non è un chatbot generico con un'etichetta sopra, e non è un modello «che ha studiato te». È un modello capace, messo nelle condizioni di rispondere come quel professionista perché ha davanti, in forma leggibile, l'insieme strutturato e verificabile di chi è, cosa fa, con quali titoli, a quali condizioni e con quali prove.

La distinzione conta perché separa due lavori molto diversi. Uno è scegliere il motore, ed è la parte facile e in larga parte già risolta dal mercato. L'altro è costruire la conoscenza che quel motore deve usare, ed è la parte difficile, quella che decide se il bot sarà preciso o approssimativo. Il valore non sta nel motore, sta nel nucleo di conoscenza che gli dà identità.

L'intelligenza si prende in prestito, l'identità si costruisce

Per inquadrare il punto mi appoggio a una cornice che Andrej Karpathy ha messo a fuoco nell'ultimo anno, perché ha il pregio di ordinare le idee senza fanatismi. Karpathy distingue ciò che un modello sa per via dell'addestramento dalla sua capacità di ragionare, e osserva che la vera intelligenza generale dipende più dal «nucleo cognitivo», cioè dall'astrazione e dal problem solving, che dalla quantità di fatti memorizzati.

La conseguenza è liberatoria. Non devi costruire l'intelligenza del bot, quella esiste già nel modello e la prendi in prestito. Devi fornire l'identità: la conoscenza specifica del professionista, che nessun modello generale possiede e che nessuno si aspetta di trovare nei suoi pesi. Detto altrimenti, lo studente universitario capace lo laureano i laboratori; sei tu a trasformarlo nel professionista preciso, fornendogli i dati e il contesto giusti. Questa, sempre nelle parole di Karpathy, è proprio la funzione delle applicazioni costruite sopra i modelli: organizzare un generalista e animarlo in un professionista verticale.

Il RAG riempie la memoria di lavoro, non la conoscenza di te

Qui va sciolto un equivoco diffuso, senza cadere nell'eccesso opposto. Negli ultimi due anni il modo standard per dare a un modello dei documenti è stato il RAG, la generazione aumentata dal recupero: si cercano i testi pertinenti e li si infilano nel contesto al momento della domanda. Funziona, ed è utile. Ma va capito per quello che è.

Nella metafora che Karpathy usa per descrivere questi sistemi, i pesi del modello sono come la CPU, la finestra di contesto è come la RAM, e il prompt è il programma. Il RAG riempie la RAM: porta i documenti giusti per la durata di una risposta, poi la sessione si chiude e quella memoria svanisce. È prezioso per dare al bot i materiali su cui ragionare, ma non lo fa «conoscere» il professionista in modo stabile, e la sua qualità dipende interamente da quanto sono strutturate e affidabili le fonti che gli dai. Il RAG, insomma, è un componente del bot del professionista, non la sua identità.

Addestrare il modello: la tentazione che promette troppo

L'alternativa che molti immaginano è l'opposto: addestrare davvero il modello sui dati del professionista, modificandone i pesi con il fine-tuning. Anche qui serve una posizione misurata, perché il fine-tuning ha un uso legittimo, insegnare uno stile o un comportamento abituale, ma è la leva sbagliata per l'obiettivo di cui parliamo.

Tre ragioni, tutte pratiche. I pesi sono opachi: non puoi mostrare a un cliente perché il bot ha detto una certa cosa, e per chi fa della verificabilità il proprio marchio è un problema, non un dettaglio. Aggiornarli costa: ogni volta che cambia un servizio, una tariffa, una qualifica, dovresti rimettere mano all'addestramento. E soprattutto i modelli, oggi, non hanno apprendimento continuo. Karpathy lo descrive con un'immagine netta, l'amnesia anterograda: un LLM non consolida da solo nel tempo ciò che gli dici, non ha un «sonno» che trasformi il contesto in memoria duratura. Addestrare i pesi su una singola persona è quindi costoso, fragile e poco trasparente. Promette un bot «che ti ha imparato»; mantiene un bot difficile da ispezionare e da tenere aggiornato.

Lo strato mancante: una conoscenza esplicita e verificabile

Tra il RAG, che riempie la memoria di lavoro, e il fine-tuning, che modifica i pesi, c'è uno strato intermedio che è quello decisivo. È una conoscenza esplicita, leggibile e modificabile, che dichiara cosa è vero del professionista e con quali fonti lo si dimostra.

Karpathy ha proposto, come intuizione e non ancora come tecnica consolidata, l'idea di un «system prompt learning»: gran parte dell'apprendimento utile assomiglia più al riscrivere un proprio manuale esplicito che al cambiare i pesi, come se il modello scrivesse a sé stesso il libro di come affrontare un problem. La cito per quello che è, una direzione di ricerca, ma indica con precisione lo strato su cui conviene lavorare: una memoria dichiarata, in chiaro, che si può leggere, correggere e verificare. È esattamente lo strato che chi costruisce identità semantiche sa trattare, perché è fatto della stessa materia, decidere cosa affermare e ancorarlo a prove.

Un esempio: la competenza dichiarata come dato

Vale come per i valori di un'azienda. Se un dato resta solo nei testi scritti per gli umani, una macchina deve dedurlo; se lo dichiari nella struttura, lo tratta come fatto. La competenza di un professionista può essere scritta in una biografia, e allora un agente la interpreta, oppure può essere affermata in dati, e allora la legge senza ambiguità.

{
  "@type": "Person",
  "name": "...",
  "jobTitle": "Avvocato",
  "knowsAbout": ["diritto della concorrenza", "contrattualistica IT"],
  "hasCredential": {
    "@type": "EducationalOccupationalCredential",
    "name": "Iscrizione all'Ordine degli Avvocati"
  },
  "sameAs": ["https://www.wikidata.org/wiki/Q...", "https://www.linkedin.com/in/..."]
}

Un bot che attinge a una dichiarazione così non deve indovinare in cosa è competente il professionista, da dove viene la sua autorità o come verificarla: lo trova affermato, tipizzato e collegato a entità e registri controllabili. La biografia parla all'umano, la struttura dichiara alla macchina, e il bot risponde su fondamenta che si possono mostrare.

Il bot è l'entità resa interrogabile

Visto così, il bot del professionista non è un oggetto a parte rispetto al lavoro sull'identità digitale, ne è la naturale prosecuzione. In una nota precedente ho descritto il passaggio al Business to Agent, il mondo in cui il professionista deve diventare leggibile dagli agenti AI. Il bot è il passo successivo: da leggibile a interrogabile, da entità che un agente consulta a entità che dialoga.

E la sua costruzione non chiede di inventare un servizio nuovo. Chiede di mettere a sistema quattro cose che già faccio. I dati strutturati in JSON-LD danno la forma alla verità del professionista. Gli ancoraggi a entità verificate, su Wikidata e sui registri ufficiali, la rendono citabile e tolgono al bot la tentazione di inventare. Le basi di conoscenza interrogabili, i materiali del professionista riorganizzati perché il modello vi attinga, sono la memoria di lavoro ben costruita. E l'automazione semantica tiene vivo l'insieme, aggiornando i dati quando i contenuti cambiano e monitorando come il bot descrive il professionista nel tempo. Il bot è la composizione di questi strati, non un quinto pezzo isolato.

La fedeltà è manutenzione, non un'installazione

Da qui discende anche cosa è onesto promettere. Un bot fedele non si installa una volta e si dimentica. Poiché i modelli non hanno apprendimento continuo, lo strato di aggiornamento va tenuto vivo a mano: è il continual learning che la macchina non fa da sola e che diventa lavoro nostro. Questo non è un limite da nascondere, è il valore del servizio, perché rende la relazione ricorsiva invece che una vendita una tantum.

Allo stesso modo, non ha senso promettere un bot che non sbaglia mai. Ha senso promettere un bot le cui risposte sono ancorate a fonti dichiarate, in cui si può risalire a ciò che afferma e correggerlo dove serve. La fiducia, per una macchina, non è una percezione da suggerire, è una catena di affermazioni verificabili. È lì che si vince o si perde la credibilità di un assistente che porta il nome di una persona.

Perché conviene muoversi adesso

Si potrebbe pensare che tutto questo riguardi un domani lontano. Non è così, e nemmeno il contrario. Karpathy invita alla calma sui tempi, parla di un «decennio degli agenti» e non di un anno, perché molta strada è ancora da fare. Ma proprio per questo la finestra è ora: l'infrastruttura che permette ai modelli di collegarsi a dati e strumenti sta arrivando, mentre la conoscenza strutturata della maggior parte dei professionisti è ancora povera o assente.

C'è anche un dato che ridimensiona la paura tecnica. Karpathy ha mostrato con nanochat che oggi un piccolo modello conversazionale si addestra da zero con circa cento dollari in poche ore: la capacità di costruire motori non è più il collo di bottiglia, e proprio per questo il vantaggio competitivo si sposta a monte, sulla qualità della conoscenza che dai al modello. Chi dichiara presto la propria identità in modo verificabile sarà uno dei pochi riferimenti chiari quando i bot e gli agenti inizieranno a operare su larga scala. Una dichiarazione strutturata, a differenza di una campagna, non smette di lavorare quando smetti di pagarla: si deposita e si rinforza nel tempo.

Da dove si parte

Il primo passo è sempre lo stesso, ed è semplice. Chiedere ai principali sistemi AI cosa sanno oggi del professionista, e osservare cosa è corretto, cosa manca e cosa viene inventato. Quella fotografia dice quanto della propria identità professionale si sta già delegando alla macchina, e con quale fedeltà.

Da lì il lavoro è dichiarare ciò che deve essere trattato come fatto, competenze, titoli, ambiti, prove, collegandolo alle entità giuste e a fonti verificabili, e costruire sopra questa base il bot, invece di sperare che un modello impari da solo a essere noi. Non si addestra un cervello su una persona. Si costruisce il nucleo di conoscenza verificabile che fa parlare un'AI capace come quella persona, e lo si tiene vivo.

L'evoluzione verso gli agenti intelligenti rappresenta la nuova frontiera della GEO (Generative Engine Optimization), ridefinendo il modo in cui i brand dichiarano la propria identità e offerta alle macchine.

Riferimenti essenziali

Karpathy A., «2025 LLM Year in Review», dicembre 2025 - karpathy.bearblog.dev
Karpathy A., intervista con Dwarkesh Patel (decennio degli agenti, apprendimento continuo), ottobre 2025 - dwarkesh.com
Karpathy A., «Software 3.0», YC AI Startup School, giugno 2025 - youtube.com
Karpathy A., nota su «system prompt learning» come paradigma mancante, X, maggio 2025 - x.com/karpathy
Karpathy A., «nanochat», repository open source, 2025 - github.com/karpathy/nanochat
Lewis P. et al., «Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks», NeurIPS 2020 - arxiv.org/abs/2005.11401
Anthropic, «Introducing the Model Context Protocol», 2024 - anthropic.com