Il file llms.txt
è un proposto standard emergente, ideato per migliorare l’interazione dei modelli di linguaggio di grandi dimensioni (LLM), come ChatGPT o Google Gemini, con i contenuti dei siti web. Questo file, posizionato nella directory principale del sito come il robots.txt, dovrebbe fornire una panoramica strutturata e semplificata delle informazioni più rilevanti, facilitando l’accesso e la comprensione da parte dei sistemi di intelligenza artificiale.
Origine e Motivazione
Il concetto di llms.txt
è stato proposto da Jeremy Howard, co-fondatore di Answer.AI, per affrontare una sfida fondamentale nell’interazione tra intelligenza artificiale e contenuti web.
I moderni sistemi AI hanno una limitazione significativa: possono elaborare solo una quantità finita di contesto alla volta. Questo rende difficile per loro comprendere efficacemente siti web con documentazione estesa. Mentre le pratiche SEO tradizionali funzionano bene per i motori di ricerca, non sono ottimizzate per i sistemi AI che necessitano di ragionare sui contenuti.
Quando gli assistenti AI tentano di elaborare pagine web standard, devono affrontare elementi non essenziali come menu di navigazione, script e stili, che consumano spazio prezioso nel contesto senza contribuire alla comprensione effettiva del contenuto. llms.txt
offre una soluzione elegante: fornisce informazioni accuratamente selezionate in un formato che i sistemi AI possono elaborare e comprendere in modo efficiente.
Implementazione
Nel caso diventasse uno standard confermato, integrare un file llms.txt
nel tuo sito dovrebbe migliorare significativamente l’interazione dei modelli di linguaggio AI con i tuoi contenuti, offrendo agli utenti risposte più accurate e contestualizzate. Dato il crescente utilizzo di sistemi AI per l’accesso alle informazioni, adottare questo standard potrebbe rappresentare un vantaggio competitivo nel rendere il tuo sito più accessibile e comprensibile per queste tecnologie emergenti. Se venisse riconosciuto, chiaramente.
Attualmente, il file llms.txt è una solo una proposta e non esistono informazioni ufficiali che confermino la sua adozione diffusa da parte dei modelli di linguaggio di grandi dimensioni (LLM). Tuttavia, l’implementazione di questo file potrebbe rappresentare una strategia proattiva per prepararsi a future integrazioni, migliorando la comprensione e l’interazione degli LLM con i contenuti del tuo sito web. Se hai tempo da perdere potresti iniziare a strutturarlo, con l’idea di usarlo se dovesse diventare uno standard.
Differenze tra llms.txt
e robots.txt
- Scopo:
llms.txt
: Ottimizza la comprensione del contenuto da parte dei modelli di linguaggio AI.robots.txt
: Controlla l’accesso dei crawler dei motori di ricerca alle pagine del sito.
- Target:
llms.txt
: Destinato a sistemi AI basati su LLM.robots.txt
: Destinato ai bot dei motori di ricerca tradizionali.
Vantaggi dell’uso di llms.txt
Ipoteticamente, se gli LLM leggessero il file si avrebbero i seguenti vantaggi:
- Migliore comprensione del contenuto: Fornisce ai modelli AI una visione chiara e strutturata del tuo sito, migliorando la qualità delle risposte generate.
- Efficienza nell’elaborazione: Riduce la complessità per i modelli AI nell’interpretare il contenuto, poiché evita elementi come HTML complesso o JavaScript non necessario.
Implementazione di llms.txt
- Creazione del file: Utilizza il formato Markdown per creare una struttura chiara e leggibile sia per gli umani che per le macchine.
- Contenuto: Includi sezioni come il nome del progetto, una breve descrizione, link a documentazione rilevante ed esempi, con brevi descrizioni per ciascun link.
- Posizionamento: Salva il file come
llms.txt
nella directory principale del tuo sito web, rendendolo accessibile all’indirizzotuosito.com/llms.txt
.
Esempio di llms.txt
# Nome del Progetto
> Una breve descrizione del progetto che evidenzia gli aspetti principali e lo scopo del sito.
Informazioni aggiuntive sul progetto, come le tecnologie utilizzate, il pubblico target o altre note rilevanti.
## Documentazione Principale
- [Guida Introduttiva](https://esempio.com/guida-introduttiva): Una guida passo-passo per iniziare a utilizzare il nostro servizio.
- [Riferimento API](https://esempio.com/api): Documentazione completa delle nostre API con esempi.
## Esempi
- [Esempio Base](https://esempio.com/esempi/base): Un esempio semplice per mostrare l'uso fondamentale del nostro servizio.
- [Esempio Avanzato](https://esempio.com/esempi/avanzato): Un esempio più complesso che dimostra funzionalità avanzate.
## Opzionale
- [Blog](https://esempio.com/blog): Articoli e aggiornamenti sul nostro progetto e sul settore.
- [Changelog](https://esempio.com/changelog): Registro delle modifiche e degli aggiornamenti delle versioni.
Note:
- Il file inizia con un’intestazione di livello 1 (
#
) che indica il nome del progetto. - Segue una citazione (
>
) che fornisce una breve descrizione del progetto. - Sezioni aggiuntive possono includere informazioni dettagliate sul progetto.
- Le sezioni principali, come “Documentazione Principale” ed “Esempi”, sono introdotte da intestazioni di livello 2 (
##
). - Ogni voce all’interno delle sezioni è un elenco puntato che include un link e una breve descrizione.
- La sezione “Opzionale” può contenere risorse aggiuntive che non sono essenziali ma possono essere utili.
Questo formato strutturato in Markdown rende il file facilmente leggibile sia dagli esseri umani che dai modelli di linguaggio AI, facilitando l’accesso e la comprensione del contenuto del sito.
Struttura del file
Il file llms.txt è stato pensato per fornire ai modelli di linguaggio di grandi dimensioni (LLM) una panoramica strutturata e concisa del contenuto del tuo sito web. La sua struttura, in formato Markdown, facilita l’interpretazione da parte di questi modelli.
Ecco come dovrebbe essere organizzato:
- Intestazione principale (H1): Inizia con un’intestazione di livello 1 che indica il nome del progetto o del sito.
- Descrizione breve: Subito sotto l’intestazione, fornisci una breve descrizione del progetto utilizzando il blocco citazione (>).
- Sezioni principali (H2): Organizza le informazioni in sezioni tematiche, ciascuna introdotta da un’intestazione di livello 2. Esempi comuni includono “Documentazione”, “Esempi” e “Risorse Opzionali”.
- Elenchi di link: All’interno di ogni sezione, elenca le risorse pertinenti utilizzando elenchi puntati. Ogni voce dovrebbe includere: Un link al contenuto, una breve descrizione del contenuto del link.
- Sezione “Opzionale”: Includi una sezione “Opzionale” per risorse aggiuntive che non sono essenziali ma possono essere utili.
FAQ
Cosa devo inserire? Serve la spiegazione di ogni pagina del sito? Quante pagine devo includere?
Il file llms.txt è progettato per fornire una panoramica strutturata e concisa del contenuto del tuo sito web, facilitando la comprensione da parte dei modelli di linguaggio di grandi dimensioni (LLM). Non è necessario includere una spiegazione dettagliata di ogni pagina del sito. Invece, dovresti focalizzarti sulle sezioni e sulle pagine più rilevanti, offrendo descrizioni sintetiche e link diretti.
Non esiste un numero fisso di pagine da includere nel llms.txt. L’obiettivo è evidenziare le sezioni chiave e le pagine più importanti del tuo sito. Evita di elencare ogni singola pagina; concentra l’attenzione su quelle che offrono informazioni essenziali o che sono frequentemente consultate dagli utenti.
Devo aggiornare il file llms.txt?
Come ho premesso, al momento nessun LLM sta usando questo file. L’implementazione di llms.txt è ancora in una fase iniziale, e la sua adozione dipenderà dalla diffusione e dall’accettazione dello standard sia tra gli sviluppatori di LLM che tra i proprietari di siti web. Mantenersi aggiornati sulle evoluzioni di questo standard e sulle pratiche consigliate può aiutare a prepararsi per eventuali future integrazioni. Nel caso dovesse venire implementato in futuro, sarà consigliabile aggiornare il file llms.txt ogni volta che apporti modifiche significative al contenuto o alla struttura del tuo sito web. Questo assicura che i modelli di linguaggio di grandi dimensioni (LLM) abbiano accesso alle informazioni più recenti e pertinenti.
Considerazioni finali
Personalmente, sono piuttosto scettico riguardo all’attuale utilità di implementare il file llms.txt. Sebbene apprezzi il tentativo di Jeremy Howard di definire una strada per migliorare l’interazione tra i siti web e i modelli di linguaggio, ritengo che la creazione di un nuovo standard separato non sia necessariamente la soluzione ideale.
Se dovessero nascere direttive specifiche utili per gli LLM, sarebbe più efficiente integrarle in standard già esistenti e consolidati come il robots.txt. Questo file è già ampiamente implementato, compreso e rispettato nell’ecosistema web da decenni, e rappresenterebbe una base logica su cui costruire nuove funzionalità.
Apprezzo lo spirito innovativo dietro questa proposta, ma spero che l’evoluzione degli standard web proceda verso l’adattamento e l’estensione di quelli già esistenti, piuttosto che verso la proliferazione di nuovi file di configurazione che i webmaster dovrebbero gestire separatamente. L’adozione di questo approccio potrebbe garantire una transizione più fluida e una maggiore adesione da parte della comunità web.
Autore

Commenti |2
Lascia un commentoCiao Giovanni, i tuoi articoli sono sempre una fonte preziosa di informazioni. Mi ha incuriosito l’assenza del file llms.txt su evemilano.com, soprattutto dopo aver letto del suo potenziale vantaggio competitivo nel tuo post. Ci sono ragioni particolari dietro questa scelta?
Grazie mille.
Ciao Elena, grazie mille del commento e del supporto.
Non ho ancora creato il file llms.txt essenzialmente perché ho davvero poco tempo per lavorare su questo sito e attendo che si decida se farlo diventare standard o meno.
Se avessi 15 anni di meno ti assicuro che lo avrei già fatto :D
Buona serata!