Il contributo indaga il concetto di Spazio Latente (LS) come struttura semantica e matematica alla base delle tecnologie di intelligenza artificiale generativa, in particolare nei Large Multimodal Models (LMM). In una prospettiva genealogica, il LS emerge non solo come astrazione computazionale, ma come forma di rappresentazione della conoscenza, capace di tradurre dati tra diverse sostanze espressive (testo, immagine, audio, video, 3D). La tesi sostenuta è che il Disegno, e più in generale la rappresentazione dello spazio, siano oggi forme di traduzione intersemiotica artificiale, analoghe ai processi di èkphrasis operati dagli LMM. L’articolazione del LS nei modelli generativi – autoencoder, VAE, GAN, modelli di diffusione, Transformer – mostra come le immagini artificiali non siano semplici artefatti visivi, ma proiezioni geometriche e semantiche di dati in spazi matematici multidimensionali. La ricerca mostra inoltre come la rappresentazione latente dello spazio consenta nuove modalità di trasformazione e sintesi visiva: dalla segmentazione e reinterpretazione di opere pittoriche, alla loro ricostruzione in modelli 3D e immersivi, utilizzando tecnologie come Neural Radiance Fields (NeRF), Gaussian splatting e algoritmi di stima della profondità. In questo scenario, il concetto tradizionale di immagine si espande no a includere strutture latenti di significato, ridefinendo il ruolo del disegno e della rappresentazione nello studio della visione umana e artificiale.
Spazio latente della rappresentazione e rappresentazione dello spazio nell’epoca dell’èkphrasis artificiale
Gay, Fabrizio
;Cazzaro, Irene
2025-01-01
Abstract
Il contributo indaga il concetto di Spazio Latente (LS) come struttura semantica e matematica alla base delle tecnologie di intelligenza artificiale generativa, in particolare nei Large Multimodal Models (LMM). In una prospettiva genealogica, il LS emerge non solo come astrazione computazionale, ma come forma di rappresentazione della conoscenza, capace di tradurre dati tra diverse sostanze espressive (testo, immagine, audio, video, 3D). La tesi sostenuta è che il Disegno, e più in generale la rappresentazione dello spazio, siano oggi forme di traduzione intersemiotica artificiale, analoghe ai processi di èkphrasis operati dagli LMM. L’articolazione del LS nei modelli generativi – autoencoder, VAE, GAN, modelli di diffusione, Transformer – mostra come le immagini artificiali non siano semplici artefatti visivi, ma proiezioni geometriche e semantiche di dati in spazi matematici multidimensionali. La ricerca mostra inoltre come la rappresentazione latente dello spazio consenta nuove modalità di trasformazione e sintesi visiva: dalla segmentazione e reinterpretazione di opere pittoriche, alla loro ricostruzione in modelli 3D e immersivi, utilizzando tecnologie come Neural Radiance Fields (NeRF), Gaussian splatting e algoritmi di stima della profondità. In questo scenario, il concetto tradizionale di immagine si espande no a includere strutture latenti di significato, ridefinendo il ruolo del disegno e della rappresentazione nello studio della visione umana e artificiale.File | Dimensione | Formato | |
---|---|---|---|
gay_cazzaro_spazio latente.pdf
accesso aperto
Descrizione: gay_cazzaro_spazio latente
Tipologia:
Versione Editoriale
Licenza:
Creative commons
Dimensione
7.77 MB
Formato
Adobe PDF
|
7.77 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.