Non compresso
I dati non compressi vengono memorizzati esattamente come sono stati registrati o immessi. A causa di questa duplicazione bit per bit, i dati non compressi offrono la massima fedeltà dei dati al costo dei massimi requisiti di spazio di archiviazione e larghezza di banda.
I dati non compressi sono un residuo dei primi giorni dell'informatica:anche i set di dati più complessi erano inferiori di ordini di grandezza a causa dei limiti tecnologici.
Come funziona?
I dati non compressi di solito non implementano tecniche di codifica speciali. Piuttosto, ogni bit viene memorizzato esattamente come proviene dalla sorgente di input. Ciò riduce i requisiti di calcolo per il dispositivo di input/acquisizione scaricando la complessa attività di riproduzione o di accesso al dispositivo dell'utente finale.
I dati non compressi sono utili ai fini dell'archiviazione perché non buttano via alcuna informazione, ma i costi di archiviazione aumenteranno rapidamente.
Quindi cosa può offrire invece la compressione?
Codec
Perdita
I primi anni '90 videro le prime incarnazioni dei dati compressi. Forse il più noto di questi primi formati era MPEG-1 Audio Layer 1, rilasciato nel 1993. Questo framework avrebbe portato allo sviluppo del famoso codec audio MP3.
Gli MP3, insieme ai loro primi coetanei, sono stati i primi formati di file con perdita di dati. Quando questi formati hanno preso piede, l'industria ha coniato un nuovo termine per loro:"Codec" — abbreviazione di Compressor/De-Compressor o Coder/Decoder.
Come funziona?
I codec con perdita di dati eliminano una notevole quantità di informazioni contenute nel file sorgente o nel flusso di dati di input.
I codec con perdita di dati riducono notevolmente le dimensioni dei file rispetto ai set di dati non compressi. Questo viene in genere fatto prendendo il set di dati di input e riducendolo al valore digitale approssimativo più vicino. Codec diversi hanno profondità di bit diverse o il numero totale di possibili valori digitali disponibili per l'interpretazione dei dati di input grezzi.
I migliori codec con perdita di dati sono progettati attorno ai limiti percettivi degli esseri umani. La maggior parte dei dati non compressi contiene una grande quantità di informazioni che i nostri occhi e le nostre orecchie non sono in grado di percepire. Ciò significa che un codec con perdita di dati ben progettato può eliminare una grande quantità di informazioni totali contenute prima che qualsiasi essere umano possa accorgersene.
La natura leggera dei codec Lossy li rende ideali per lo streaming e altre applicazioni di trasmissione live.
I codec lossy sono il peggior formato possibile per scopi di archiviazione a causa del fatto che una quantità significativa di informazioni nel set di dati di origine scompare. Anche se gli esseri umani potrebbero non essere in grado di discernere una differenza tra i dati grezzi e la prima codifica con perdita di dati, poiché dalla codifica con perdita originale vengono create versioni più con perdita, le differenze percettive diventano sempre più evidenti.
Ora, entriamo nel 21° secolo.
Senza perdita
Il primo codec lossless è stato il "Fully Lossless Audio Codec", o FLAC, ed è stato rilasciato nel 2000.
Lo sviluppo di codec lossless ha segnato un cambiamento epocale nel mondo della compressione dei dati. I codec lossless affermano di offrire una qualità esatta o quasi uguale ai dati non compressi, ma con dimensioni dei file molto più vicine alla compressione con perdita di dati. Questo è il risultato della compressione dei dati di input in un modo specifico in modo che il decoder possa ricostruire in seguito il set di dati originale.
Comprendere la tecnologia alla base della compressione senza perdita di dati può farti girare la testa se vai abbastanza in profondità. Il caro tecnico di YouTube Linus fa un ottimo lavoro nell'abbattere le basi in questo video di Techquickie.
Nell'esempio fornito da Linus, la stringa “XXXOOXXX” è codificata in “3 O2 3”. Quando è necessario accedere nuovamente alla stringa, "3 O2 3" viene decodificato nuovamente in "XXX00XXX".
Grazie alla sua capacità di ricostruire un set di dati non compresso da uno compresso, la codifica lossless ha ampiamente eclissato i dati non compressi in quasi tutte le situazioni. La maggior parte dei codec video e audio di qualità master utilizza una qualche forma di compressione senza perdita di dati.
Il principale compromesso per la compressione senza perdita di dati è un tempo di codifica e decodifica leggermente più lungo, molto meglio degli svantaggi della compressione con perdita o non compressa.
I dati compressi senza perdita di dati sono il gold standard per tutta l'archiviazione dei dati. I file compressi possono essere archiviati e quindi decodificati una volta che è necessario accedervi nuovamente, preservando così tutti i dati e riducendo anche i costi di archiviazione.
Mentre tutti i tipi di compressione dei dati offrono alcuni vantaggi rispetto ad altri tipi, la compressione senza perdita offre i maggiori vantaggi con il minor numero di concessioni in termini di dimensioni, mobilità o qualità dei file.
I prossimi decenni porteranno probabilmente la tecnologia dei codec lossless a nuovi livelli, poiché i vecchi formati con perdita di dati termineranno la loro durata utile.