1. Acquisizione dei dati:raccolta della materia prima
* Immagini satellitari: Questo è il livello fondamentale. Le immagini satellitari ad alta risoluzione offrono una visione ampia e top-down del mondo. Queste immagini sono catturate dai satelliti orbitanti sulla Terra, fornendo una documentazione visiva completa. La risoluzione è migliorata in modo significativo nel corso degli anni, consentendo maggiori dettagli.
* Fotografia aerea: Gli aeroplani o i droni dotati di telecamere specializzate volano su aree specifiche, catturando immagini sovrapposte da diverse angolazioni. Ciò fornisce una risoluzione più elevata e più dettagli rispetto alle immagini satellitari.
* Street View Cars &Trekker: Questi veicoli equipaggiati con matrici di telecamere, sensori LIDAR (rilevamento della luce e gamma) e le unità GPS guidano lungo strade e percorsi, catturando panorami a 360 gradi e nuvole dettagliate di punti 3D di ambienti a livello di strada. Il Trekker è una versione dello zaino per le aree inaccessibili alle auto.
* FOTO SUBMATI UTENTE: In alcuni casi, Google sfrutta le foto congrimite dall'utente per colmare le lacune o migliorare la qualità dei modelli 3D, sebbene questi dati siano generalmente attentamente controllati e integrati.
2. Ricostruzione 3D:trasformare le immagini in modelli
* Fotogrammetria: Questa è la tecnica principale per la creazione di modelli 3D da immagini 2D.
* Rilevamento delle funzionalità: Il software identifica le caratteristiche chiave (angoli, bordi, trame) in immagini sovrapposte.
* Matching di funzionalità: Quindi corrisponde a queste funzionalità su più immagini, capendo come lo stesso punto nel mondo reale appare da diverse prospettive.
* Struttura dal movimento (SFM): Utilizzando le funzionalità abbinate e le posizioni della fotocamera note (da GPS e altri sensori), l'algoritmo ricostruisce la struttura 3D della scena, stimando la posizione e l'orientamento della fotocamera per ogni immagine. Questo crea una nuvola di punti sparsi che rappresenta la scena.
* Ricostruzione densa: La nuvola di punti sparsi viene quindi utilizzata come base per creare una nuvola di punti più densa e più dettagliata. Questo colma gli spazi vuoti e crea una rappresentazione 3D più completa.
* Generazione di mesh: Infine, la nuvola di punti viene convertita in una mesh 3D, che è una rete di triangoli interconnessi che formano la superficie del modello 3D.
* lidar (rilevamento della luce e range):
* Scansione laser: I sensori lidar emettono impulsi laser e misurano il tempo impiegato dalla luce. Ciò consente misurazioni altamente accurate della distanza dagli oggetti.
* Generazione di cloud point: I dati LIDAR vengono utilizzati per creare una densa nuvola di punti 3D che rappresenta l'ambiente. Ciò è particolarmente prezioso per creare modelli 3D accurati di terreno ed edifici ed è più preciso della fotogrammetria per forme complesse.
* Fusion with Imagery: I dati LIDAR sono spesso combinati con le immagini per aggiungere colore e consistenza ai modelli 3D, creando un aspetto più realistico.
* Machine Learning e AI: Google utilizza l'apprendimento automatico per:
* Migliora l'elaborazione delle immagini: Migliora la qualità dell'immagine, riduci il rumore e correggi per le distorsioni.
* Riconoscimento degli oggetti: Identificare e classificare gli oggetti nelle immagini (ad es. Alberi, edifici, automobili, persone). Ciò consente l'etichettatura automatizzata e l'annotazione dei modelli 3D.
* Riempimento gap: Compilare dati mancanti o aree in cui la ricostruzione 3D è incompleta.
* Miglioramento della trama: Genera trame e dettagli realistici per i modelli 3D.
* Generazione procedurale: Crea modelli 3D di oggetti che sono difficili da catturare direttamente (ad es. Alberi, vegetazione), usando algoritmi che generano rappresentazioni dall'aspetto realistico.
3. Elaborazione e ottimizzazione dei dati:
* Georeferencing: Tutti i dati sono precisamente georeferenziati, il che significa che sono allineati con un sistema di coordinate globali. Ciò garantisce che i modelli 3D siano posizionati accuratamente sulla terra.
* Fusion Data: I dati di diverse fonti (immagini satellitari, fotografia aerea, vista su strada, lidar) sono combinati e integrati per creare un modello 3D completo e coerente.
* Semplificazione e ottimizzazione: I modelli 3D sono spesso semplificati e ottimizzati per ridurre le dimensioni del file e migliorare le prestazioni, pur mantenendo un alto livello di dettaglio. Questo è cruciale per lo streaming in modo efficiente dei dati su Internet.
* Texturing: Le immagini vengono "proiettate" sulla mesh 3D per dargli colore e consistenza realistici.
4. Visualizza e visualizzazione:
* Rendering piastrellato: Il mondo 3D è diviso in piastrelle, consentendo uno streaming e rendering efficienti solo per le aree che sono attualmente visibili all'utente.
* Livello di dettaglio (LOD): Diversi livelli di dettaglio vengono utilizzati per gli oggetti a seconda della distanza dall'utente. Gli oggetti distanti sono resi con dettagli più bassi, mentre gli oggetti più vicini sono resi con dettagli più elevati. Questo aiuta a migliorare le prestazioni e ridurre la quantità di dati che devono essere trasmessi in streaming.
* Tecniche di rendering realistiche: Tecniche come ombreggiatura, illuminazione e ombre vengono utilizzate per creare un'esperienza più realistica e coinvolgente.
I progressi tecnologici chiave che consentono i mondi 3D di Google:
* Aumento della potenza di calcolo: L'enorme potenza di calcolo nei data center è cruciale per l'elaborazione delle grandi quantità di dati coinvolti nella ricostruzione 3D.
* Progressi nella visione informatica: Algoritmi migliorati per il rilevamento delle funzionalità, la corrispondenza e la ricostruzione 3D.
* Machine Learning: Elaborazione automatizzata delle immagini, riconoscimento degli oggetti e riempimento di gap.
* Sensori ad alta risoluzione: Le telecamere avanzate e i sensori lidar che acquisiscono dati più dettagliati e accurati.
* Archiviazione e streaming efficiente dei dati: Infrastruttura scalabile per la memorizzazione e lo streaming delle enormi quantità di dati 3D.
In sintesi, il mondo 3D di Google è il risultato di un processo complesso e sofisticato che combina tecnologie e tecniche avanzate, tra cui immagini satellitari, fotografia aerea, vista su strada, lidar, fotogrammetria, apprendimento automatico e elaborazione efficiente dei dati. È un processo continuo di raccolta, elaborazione e miglioramento dei dati, in costante evoluzione per fornire agli utenti la rappresentazione più accurata e dettagliata della Terra.