Il contributo indaga il concetto di Spazio Latente (LS) come struttura semantica e matematica alla base delle tecnologie di intelligenza artificiale generativa, in particolare nei Large Multimodal Models (LMM). In una prospettiva genealogica, il LS emerge non solo come astrazione computazionale, ma come forma di rappresentazione della conoscenza, capace di tradurre dati tra diverse sostanze espressive (testo, immagine, audio, video, 3D). La tesi sostenuta è che il Disegno, e più in generale la rappresentazione dello spazio, siano oggi forme di traduzione intersemiotica artificiale, analoghe ai processi di èkphrasis operati dagli LMM. L’articolazione del LS nei modelli generativi – autoencoder, VAE, GAN, modelli di diffusione, Transformer – mostra come le immagini artificiali non siano semplici artefatti visivi, ma proiezioni geometriche e semantiche di dati in spazi matematici multidimensionali. La ricerca mostra inoltre come la rappresentazione latente dello spazio consenta nuove modalità di trasformazione e sintesi visiva: dalla segmentazione e reinterpretazione di opere pittoriche, alla loro ricostruzione in modelli 3D e immersivi, utilizzando tecnologie come Neural Radiance Fields (NeRF), Gaussian splatting e algoritmi di stima della profondità. In questo scenario, il concetto tradizionale di immagine si espande no a includere strutture latenti di significato, ridefinendo il ruolo del disegno e della rappresentazione nello studio della visione umana e artificiale.

Spazio latente della rappresentazione e rappresentazione dello spazio nell’epoca dell’èkphrasis artificiale

Gay, Fabrizio
;
Cazzaro, Irene
2025-01-01

Abstract

Il contributo indaga il concetto di Spazio Latente (LS) come struttura semantica e matematica alla base delle tecnologie di intelligenza artificiale generativa, in particolare nei Large Multimodal Models (LMM). In una prospettiva genealogica, il LS emerge non solo come astrazione computazionale, ma come forma di rappresentazione della conoscenza, capace di tradurre dati tra diverse sostanze espressive (testo, immagine, audio, video, 3D). La tesi sostenuta è che il Disegno, e più in generale la rappresentazione dello spazio, siano oggi forme di traduzione intersemiotica artificiale, analoghe ai processi di èkphrasis operati dagli LMM. L’articolazione del LS nei modelli generativi – autoencoder, VAE, GAN, modelli di diffusione, Transformer – mostra come le immagini artificiali non siano semplici artefatti visivi, ma proiezioni geometriche e semantiche di dati in spazi matematici multidimensionali. La ricerca mostra inoltre come la rappresentazione latente dello spazio consenta nuove modalità di trasformazione e sintesi visiva: dalla segmentazione e reinterpretazione di opere pittoriche, alla loro ricostruzione in modelli 3D e immersivi, utilizzando tecnologie come Neural Radiance Fields (NeRF), Gaussian splatting e algoritmi di stima della profondità. In questo scenario, il concetto tradizionale di immagine si espande no a includere strutture latenti di significato, ridefinendo il ruolo del disegno e della rappresentazione nello studio della visione umana e artificiale.
2025
9788835182412
File in questo prodotto:
File Dimensione Formato  
gay_cazzaro_spazio latente.pdf

accesso aperto

Descrizione: gay_cazzaro_spazio latente
Tipologia: Versione Editoriale
Licenza: Creative commons
Dimensione 7.77 MB
Formato Adobe PDF
7.77 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11578/365789
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact