La nostra visione ESG

ESG vision

Crediamo che la trasformazione digitale sia la chiave per lo sviluppo sociale ed economico del nostro Paese e per la tutela del nostro territorio. Approfondisci

Il Metaverso intende offrire esperienze immersive interconnesse che abbracciano e, in un certo senso, fondono il mondo digitale e quello reale, creando ambienti e contenuti virtuali multiutente, persistenti ed interoperabili. Questo obiettivo, così semplice nella sua enunciazione, implica, in realtà, complessità tecnologiche significative, alcune delle quali ancora in fase di definizione e successiva sperimentazione.

Scarica il PDF

Down

Le tecnologie in gioco

443 KB

Le tecnologie di base

L’eXtended Reality (XR) in tutte le sue forme (realtà virtuale, aumentata e mista) è senza dubbio la base tecnologica su cui si fondano alcuni degli abilitatori principali del Metaverso, che però promette di andare ben oltre le attuali esperienze immersive. Caratteristiche fondamentali del Metaverso sono l’interazione tra gli utenti attraverso soluzioni collaborative multiplayer, in cui gli utenti stessi possano interagire tra loro e con i contenuti 3D in real-time, non solo come avviene già oggi con le tecnologie XR, ma in ambienti permanenti, interoperabili e “globalmente” accessibili che superino la singola soluzione verticale e permettano di utilizzare e condividere ovunque i propri digital twin. Per quanto riguarda il multiplayer, un engine molto diffuso è Photon [1], che fornisce un servizio cross-platform usato da piattaforme come AltSpaceVR [2], Meta e la stessa XR di TIM [3]. Sono sempre più numerose le piattaforme che consentono ad oggi l’accesso a Metaversi “proprietari” e non ancora interoperabili: quelle nate dal gaming e che hanno già ospitato sia eventi musicali che realizzazioni verticali per grandi marchi della moda, come Roblox [4] e Fortnite [5], quelle dei big player come Meta e Microsoft (rispettivamente con Horizon Worlds [6]/Workrooms [7] e Mesh [8]) e altre come Decentraland [9], Sandbox [10], VRChat [11], Spatial [12].
A livello software la tecnologia di riferimento è quella dello Spatial Computing che consente la digitalizzazione in 3D di oggetti, ambientazioni, persone e ne abilita le reciproche interazioni. In commercio esistono dei veri e propri ambienti di sviluppo 3D (Unity [13] e Unreal Engine [14] sono i più usati), che permettono sia di mostrare la geometria dei digital twin e le loro animazioni, la “gesture recognition”, lo “spatial mapping” e gli algoritmi di intelligenza artificiale a supporto, sia di creare applicazioni per PC, smartphone e caschetti VR. Un aspetto importante per lo sviluppo del Metaverso è la possibilità di realizzare i contenuti 3D con processi che consentano di automatizzare la creazione degli asset stessi, puntando a digitalizzare i flussi di progettazione e produzione delle aziende. Per permettere agli utenti la fruizione di esperienze immersive anche tramite browser, è stata sviluppata WebXR, che descrive il supporto per l'accesso a dispositivi di realtà aumentata e realtà virtuale. WebXR è un'interfaccia di programmazione per applicazioni web che mette a disposizione degli sviluppatori una serie di API specificate da W3C [15] [16], in cui big player internazionali come Google e Meta stanno partecipando attivamente alla standardizzazione. A supporto dello sviluppo di applicazioni WebXR sono nati dei framework come A-Frame [17] e Babylon.js [18] che utilizzano le API per creare e visualizzare grafica computerizzata 3D animata in un browser web. In questo modo il web diventa una piattaforma abilitante del Metaverso e d’altra parte ci si attende che il Metaverso stesso diventi la nuova Internet, fruibile anche in modalità immersiva.
L’accessibilità attraverso dispositivi utente di natura diversa è un aspetto molto importante per garantire l’ingresso nel Metaverso in qualsiasi momento, con facilità e immediatezza: gli utenti devono poter fruire di un’esperienza non solo da un visore 3D, ma anche da device tradizionali come smartphone, tablet e PC, sebbene con diversi gradi di immersività. I visori stanno diventando più leggeri e performanti, offrono risoluzioni sempre maggiori e possono contare su videocamere sofisticate che integrano soluzioni di intelligenza artificiale per il tracciamento del corpo, degli occhi e perfino delle espressioni del viso. Dai caschetti di realtà virtuale connessi via cavo ad un PC costoso e ad alte prestazioni, si è già passati a “device standalone” basati su piattaforme analoghe a quelle degli smartphone, che stanno evolvendo verso degli “smart glasses” ancora più leggeri, molto simili a dei semplici occhiali, permettendo di superare le attuali limitazioni di utilizzo dei visori per sessioni lunghe. Tra le interfacce uomomacchina (HCI – Human Computer Interface) che ci consentiranno di essere sempre più immersi e coinvolti nei nuovi mondi virtuali, stanno emergendo anche dispositivi wearable e interfacce aptiche: dai guanti aptici (che creano una percezione tattile, quindi fisica con i digital twin) fino alle tute indossabili, che possono captare ogni singolo movimento e trasmettere al corpo sensazioni (es. calore/freddo) e altri stimoli di tipo elettrico.

Avatar

La tecnologia immersiva sì è evoluta potenziando il senso di realtà fino a trasformare l’interazione umana da semplice cursore, come nel web tradizionale, a vera e propria figura umana in mondi digitali a tre dimensioni. Ma a che punto siamo e dove stiamo andando nella realizzazione degli avatar, che rappresentano il nostro “io digitale” nel Metaverso? Attraverso piattaforme come Ready Player Me [19] è possibile creare il proprio avatar verosimigliante in modalità “cartoon”, personalizzarne il look ed importarlo nel proprio Metaverso in formati standard (es. GLB, FBX). Ready Player Me consente di costruire avatar leggeri e portabili dal punto di vista software, a scapito tuttavia della definizione e della verosimiglianza con la persona reale.
MetaHuman di Unreal Engine [20], invece, è un framework sviluppato per realizzare avatar fotorealistici: la definizione, l’accuratezza ed il rendering di questi avatar è tale da insinuare il sospetto che si tratti di una persona reale. Sfruttando questa tecnologia, un designer 3D professionista è in grado di realizzare dei veri e propri “human digital twin”: gemelli digitali di soggetti reali. La potenza computazionale e grafica in gioco, le dimensioni delle mesh ed il rendering necessario per costruire un soggetto MetaHuman, fanno sì che ad oggi venga usata questa tecnologia soprattutto in ambito pubblicitario e cinematografico. Gli avatar possono essere animati attraverso movimenti precostituiti (ad esempio salvati all’interno del formato GLB), oppure possono riprodurre i movimenti del soggetto in tempo reale.
Il trasferimento del movimento umano all’avatar in tempo reale ha un grado di complessità in più ed è realizzabile con l’utilizzo di app specializzate nella motion capture. Negli Innovation LAB di TIM stiamo sperimentando sia soluzioni per la realizzazione di palcoscenici virtuali 3D con WebXR e avatar Ready Player Me, che avatar MetaHuman per servizi evoluti di video-comunicazione con motion capture in tempo reale (Fig.1).

Figura 1: Esempio di videocomunicazione evoluta con avatar MetaHuman

Clicca qui per ingrandire l'immagine

In particolare, sono stati realizzati dei PoC che utilizzano soluzioni innovative basate su iPhone di nuova generazione e algoritmi di intelligenza artificiale che, a partire dalla telecamera e dai sensori dello smartphone, sono in grado di rappresentare matematicamente la posizione e la rotazione nello spazio dei vari punti dello “scheletro digitale” e di determinare anche la profondità con una certa accuratezza. Un altro tipo di soluzione si basa su dispositivi wearable per la motion capture, in cui gli “attori” indossano tute con sensoristica integrata: Xsens [21] rappresenta un esempio di tuta indossabile in grado di leggere e restituire i movimenti del corpo e delle mani (Fig.2).

Figura 2: 3D motion capture con wearable Xsens

Clicca qui per ingrandire l'immagine

Video immersivi

Le esperienze 3D possono essere arricchite con video immersivi a 360 gradi che sono un valido strumento per far vivere al fruitore una nuova comunicazione più “avvolgente”, che se integrata nel Metaverso può fargli fare un salto tra il virtuale e il reale, o viceversa. La novità di questi video è che la scena non si svolge solo davanti allo spettatore, ma tutto intorno: l’utente viene catapultato al centro della scena, sentendosi protagonista dell’evento stesso, e potendo scegliere il suo punto di vista preferito semplicemente girandosi per apprezzare cosa accade attorno a lui. La produzione dei video 360, fruibili sia da visori 3D che da mobile e PC, comporta l’utilizzo di speciali fotocamere, in grado di acquisire immagini simultaneamente tutto intorno all’obiettivo.
Le telecamere amatoriali registrano video in 4K (3840 x 1920 60/30fps), mentre quelle professionali possono raggiungere risoluzioni fino a 11K (10560 x 5280 @30fps), 7 volte superiore al 4K. Attualmente nessuna telecamera a 360 gradi è dotata di zoom ottico: questa limitazione le rende ottime per riprendere paesaggi e ambientazioni, mentre la ripresa di soggetti è vincolata ad un posizionamento sufficientemente vicino al soggetto stesso. Recentemente nelle telecamere 360 professionali è stata anche introdotta la registrazione 3D, che contiene due canali video all’interno dello stesso contenitore, uno per l’occhio destro e uno per quello sinistro. Ogni occhio riceve una prospettiva leggermente diversa, dando allo spettatore un senso di profondità di campo, e separando gli oggetti dal primo piano allo sfondo. Poiché entrambi i canali sono memorizzati nello stesso “contenitore”, i video stereo 3D 360 dovrebbero essere consegnati al doppio della risoluzione del mono: con la tecnologia attuale si arriva al massimo a video 360 3D in 10K (9600 x 9600 @30fps).
Per quanto riguarda l’audio, il sistema ambisonico è uno dei più completi sistemi di registrazione e riproduzione sonora esistenti ed è il metodo utilizzato per registrare, mixare e riprodurre audio tridimensionali a 360 gradi. L’approccio di base è quello di trattare una scena audio come una sfera sonora completa, con quattro canali distinti in cui ognuno rappresenta una direzione attorno ad un punto centrale della sfera. Un software opportuno è in grado di mixare le diverse sorgenti audio e restituire un suono sferico a 360 gradi.

Infrastruttura tecnologica

L’infrastruttura tecnologica è essenziale per garantire i requisiti prestazionali delle esperienze immersive e gli alti livelli di realismo che ci si attende nella fruizione. La rete 5G e, in evoluzione il 6G, sono tra gli abilitatori principali in grado di supportare in real-time, con bassa latenza e alta banda, le connessioni sempre più persistenti e i multipli flussi XR. La capacità computazionale necessaria per calcolare le interazioni dovute alle leggi fisiche degli oggetti nel mondo 3D e il rendering complesso delle scene rendono necessarie schede grafiche con GPU di altissimo livello. Inoltre, per assicurare la fruizione anche su device tradizionali e a costi contenuti, senza rinunciare a risoluzioni elevate, l’Edge Cloud è essenziale in quanto abilita il rendering dei contenuti ai bordi della rete, anziché lato utente: le soluzioni di XR streaming (come NVIDIA Cloud XR [22] e Google Immersive Stream for XR [23]) sono in primo piano in questo ambito e sono in fase sperimentale tramite la realizzazione di diversi PoC innovativi di TIM [3].

Blockchain, criptovalute e NFT

Le tecnologie del Web3 e, in particolare, la blockchain, i Fungible Token (ovvero le criptovalute) ed i Non-Fungible Token (NFT) possono contribuire al soddisfacimento di alcuni dei requisiti fondamentali del Metaverso. Nel Metaverso le persone devono poter effettuare operazioni economiche. Ad esempio, esse devono essere remunerate per le attività ed i prodotti realizzati o devono, esse stesse, remunerare terzi. È necessario, quindi, disporre di valute digitali, nonché della possibilità di scambiarle fra di loro e con le valute tradizionali stampate dalle banche centrali. La blockchain ed i Fungible Token costituiscono una risposta concreta a questo requisito, offrendo un sistema di pagamento elettronico decentralizzato “trustless” (non richiede il supporto di un intermediario di fiducia) e “permissionless” (non ha un organo di governo). Bitcoin è la prima e la più famosa criptovaluta, seguita da Ethereum, ma già oggi esistono migliaia di criptovalute, supportate da diverse blockchain pubbliche e private. Il passo logico successivo nella nuova economia digitale del Metaverso è la gestione dei diritti e delle proprietà sia degli oggetti virtuali che di quelli reali. Gli “abitanti” del Metaverso devono poter creare, pubblicare, possedere, scambiare e comprare gli oggetti, esattamente come succede nella vita reale. La blockchain ed i Non-Fungible Token (NFT) sono le tecnologie abilitanti di riferimento, così come già avviene nelle “Decentralised Application” (DApp). Nella tecnologia blockchain un “token” è, sostanzialmente, un insieme di informazioni digitali registrate su un registro distribuito (blockchain, appunto) che rappresentano una forma di diritto: l’accesso a un servizio, la proprietà di un asset sia fisico che digitale, la ricevuta di un pagamento, le informazioni di identità e così via. In particolare, i token “non fungibili” (NFT), non sono interscambiabili, in quanto sono associati inseparabilmente a ciò che identificano [24]. In pratica, gli NFT sono dei certificati digitali volti a definire in modo univoco, insostituibile e non replicabile le forme di diritto relative agli oggetti a cui si riferiscono (es. musica, giochi e gadget, opere d’arte, proprietà intellettuali, identità digitale, etc.) [25] [26]. In Fig.3 un esempio di criptoarte relativo ad un’opera dell’artista Beeple, venduta nel 2021 per 69.3 milioni di dollari.

Figura 3: Esempio di NFT criptoarte: Everydays - The First 5000 days, dell’artista Beeple

Clicca qui per ingrandire l'immagine

Nel Metaverso un NFT può garantire al suo possessore il diritto di svolgere attività, ottenere servizi e contenuti esclusivi, partecipare a community private, conferenze ed esperienze uniche. FlyFish, ad esempio, sarà il primo ristorante accessibile solo previo acquisto del loro NFT [27]. A testimonianza del forte trend di sviluppo dell’economia degli NFT va citato lo studio di NonFungible [28], secondo il quale, il mercato dei NFT nel 2021 ha registrato scambi record con un valore pari a 17,6 miliardi di dollari contro gli 82 milioni di dollari del 2020 (incremento del 21000 per cento!). Gli NFT possono costituire una soluzione tecnologica anche per la gestione dell’identità digitale nel Metaverso, aspetto, questo, fondamentale per garantire la fiducia delle persone e la fruibilità dei servizi in esperienze diverse.
Un'identità digitale è un insieme di attributi relativi a un'entità, adottati o rivendicati nel cyberspazio da un individuo, un'organizzazione o un dispositivo elettronico. Un NFT, per sua natura, può certificare la proprietà ed i relativi diritti di una iden tità digitale. Se gli NFT resteranno oggetti chiusi nei loro mondi il valore degli oggetti a cui si riferiscono rischia di rimanere incatenato al successo della piattaforma per la quale sono stati creati [29]. Si pensi, al contrario, al valore di un NFT, associato ad una identità digitale, interoperante su più Metaversi: se ciò avvenisse, significherebbe che il possessore di tale identità digitale potrebbe trasferire ed utilizzare i propri attributi personali su più Metaversi, senza soluzione di continuità. E se il NFT fosse relativo ad un oggetto digitale o reale, la sua portabilità consentirebbe al proprietario di trasferire ed utilizzare l’oggetto in ciascun Metaverso visitato.

Conclusioni

Ad oggi il dibattito su quanti Metaversi esisteranno è aperto: è piuttosto improbabile che, in futuro, possa esistere un unico Metaverso mondiale, mentre risulta più plausibile l’ipotesi dell’esistenza di più Metaversi interoperanti. Ecco che diventa fondamentale il concetto di interoperabilità. Molti ritengono che l’affermazione del Metaverso richieda che esso sia basato su una piattaforma fortemente decentralizzata costruita principalmente su standard e protocolli basati sulla comunità e un sistema operativo "open source". Questo implica, ad esempio, la portabilità dei contenuti 3D, così come la necessità di rendere le blockchain e gli NFT interoperabili. Inoltre, per garantire un utilizzo diffuso dei servizi, l’evoluzione dei device immersivi diventa molto importante: usabilità ed ergonomia, risoluzione e costo saranno fattori determinanti per popolare il Metaverso.
La sfida tecnologica è dunque aperta.

Urlografia

  1. Photon, https://www.photonengine.com/
  2. AltSpaceVR, https://altvr.com/
  3. Notiziario Tecnico TIM n. 2-2022, https://www.gruppotim.it/it/newsroom/notiziario-tecnico-tim/2022/n2-2022/eXtended-Reality-Esperienze-Immersive-Comunicazione-Evoluta.html
  4. Roblox, https://www.roblox.com/
  5. Fortnite, https://www.epicgames.com/fortnite/it/home
  6. Meta Horizon Worlds, https://www.oculus.com/horizon-worlds/
  7. Meta Horizon Workrooms, https://www.oculus.com/experiences/quest/2514011888645651/
  8. Microsoft Mesh, https://www.microsoft.com/en-us/mesh
  9. Decentraland, https://decentraland.org/
  10. Sandbox, https://www.sandbox.game/en/
  11. VRChat, https://hello.vrchat.com/
  12. Spatial, https://spatial.io/
  13. Unity, https://unity.com/
  14. Unreal Engine, https://www.unrealengine.com/en-US
  15. W3C, https://www.w3.org/
  16. W3C WebXR Device API, https://www.w3.org/TR/webxr/
  17. A-Frame, https://aframe.io/
  18. Babylon.js, https://www.babylonjs.com/
  19. Ready Player Me, https://readyplayer.me/
  20. MetaHuman, https://www.unrealengine.com/en-US/metahuman
  21. Xsens, https://www.xsens.com/
  22. NVIDIA Cloud XR, https://developer.nvidia.com/nvidia-cloudxr-sdk
  23. Google Immersive Stream for XR, https://cloud.google.com/immersive-stream/xr
  24. Temera, “NFT: cosa sono e che ruolo hanno nel meatverso”, https://temera.it/it/news/blog/nft-cosa-sono-e-che-ruolo-hanno-nel-metaverso.html
  25. Ibicocca, “Cosa sono veramente gli NFT e come funzionano?”, https://ibicocca.unimib.it/cosa-sono-veramente-gli-nft-ecome-funzionano/
  26. Borsa Italiana, “NFT (Non-Fungible Token): cosa sono e come funzionano”, https://www.borsaitaliana.it/notizie/sotto-la-lente/nft-cosa-sono.htm
  27. Elledecor, “Il primo ristorante NFT aprirà a New York rivoluzionando il concetto moderno di club”, https://www.elledecor.com/it/viaggi/a38867687/primo-ristorante-nft-a-new-york/
  28. NonFungible, “NFT Market – Annual Report 2021”, https://nonfungible.com/news/corporate/yearly-nft-market-report-2021
  29. Il sole 24 Ore, “Mark Zuckerberg apre agli Nft su Instagram negli Usa. Ma il nodo è l’interoperabilità”, https://www.ilsole24ore.com/art/mark-zuckerberg-apre-nft-instagram-usa-ma-nodo-e-l-interoperabilita-AEWseuXB

Acronimi

API        Application Programming Interface

AR         Augmented Reality

DApp    Decentralised Application

FBX        FilmBoX Autodesk file format

FT          Fungible Token

GLB       GLTF binary format

GLTF     Graphics Language Transmission Format

GPU      Graphics Processing Unit

HCI        Human Computer Interface

NFT       Non-Fungible Token

PoC       Proof of Concept

VR         Virtual Reality

W3C      World Wide Web Consortium

XR          eXtended Reality