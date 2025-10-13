[4] Sotto questo profilo (che coinvolge il rapporto con la base matematica dei modelli) la rappresentazione precedente di "manipolatori di segni" è vera ma incompleta. per spiegare sia pure atecnicamente, anche nei sistemi formali il pensiero si manifesta come manipolazione simbolica che preserva un'interpretazione; la differenza è che lì la preservazione è garantita dalle regole del sistema, mentre nei LLM è indotta empiricamente dall'addestramento (previsione di token su grandi corpora). Dunque, i modelli non garantiscono per costruzione l'aggancio al riferimento: lo approssimano quando i dati lo permettono. Il nodo sta nello spazio latente. Durante l'addestramento, il modello costruisce rappresentazioni interne che interpolano i casi osservati: non scelgono semplicemente "la parola successiva", ma collocano l'input in un manifold dove vicinanze geometriche riflettono somiglianze d'uso, regolarità sintattiche e, in parte, relazioni logico-pragmatiche. Questa interpolazione latente spiega perché i LLM producono risposte coerenti e spesso utili: si muovono dentro la regione di esperienza dei dati, ricomponendo schemi già visti in forme nuove ma plausibili. Tuttavia, l'interpolazione ha confini: fuori distribuzione (es. nel diritto: novità, aggiornamenti normativi, significati istituzionali puntuali) il modello può perdere il rapporto con il sistema di riferimento e "allucinare" un'asserzione verosimile ma falsa. Qui servono ancoraggi esterni (retrieval da fonti aggiornate, ontologie, strumenti deterministici) e vincoli d'uscita (grammar/JSON/ontologie) per mantenere l'allineamento semantico. Quanto a non-determinismo e riproducibilità: la variabilità dipende da campionamento, hardware e prompt. È mitigabile con decoding deterministico, seed fissati, template di prompt e version pinning e soluzioni progettuali tecniche; ma l'affidabilità, specie nei casi ad alto rischio, nasce da un sistema più ampio (che spiega in parte l'apparato normativo progettato dall'Ai Act: LLM + retrieval versionato + validator/grammar + tool deterministici + human-in-the-loop, più test metamorfici, red-teaming, monitoraggio in esercizio e logging). In breve: i LLM "pensano per segni" interpolando strutture utili; l'aggancio stabile ai riferimenti non si presume, si progetta.