YUV Chroma Subsampling

Video

Un argomento che spesso risulta complicato è quello della riproduzione del colore. La complicazione risiede sopratutto in un differente spazio/metodo di colore tra foto e video e dalla difficile comprensione delle varie sigle (4.4.4, 4.2.2, 4.2.0 e così via) che identificano una maggiore o minore accuratezza della sua riproduzione.

Per comprendere bene la questione, è prima di tutto necessario fare un passo indietro ed analizzare nel dettaglio come un sensore digitale CMOS o CCD cattura ed interpreta l’informazione di luce e colore in digitale, convertendola in numeri.

Un sensore digitale è composto da una griglia di fotodiodi che catturano i diversi livelli di luce, (dal nero al bianco assoluto) convertendoli in opportuni segnali elettrici.

Tali valori di luce del bianco, del nero e delle diverse sfumature di grigio sono rappresentati da valori che spaziano da 0-255 (nero=0, bianco=255).

Fino a qui la cosa è semplice ma sottintende un concetto importante: ogni sensore digitale è in grado di registrare effettivamente, solo delle immagini in bianco e nero.

Per risolvere la questione del colore (crominanza dell’immagine), un ricercatore della Kodak di nome Bryce Bayer, propose di sovrapporre al sensore digitale una griglia composta da elementi verdi, rossi e blu.

Bryce Bayer, suddividendo i fotodiodi adiacenti in celle di quattro fotodiodi (due verdi, un rosso e un blu) secondo il suo schema e derivando matematicamente i colori e tutte le loro sfumature, mediante un algoritmo chiamato demosaicizzazione (che confronta i valori di luminanza registrati dai fotodiodi con il mosaico Bayer ad essi sovrapposto), risolse il problema della riproduzione del colore in digitale.

Pur non di semplicissima comprensione, il metodo funziona e a tutt’oggi è in uso nella maggior parte dei sensori digitali in commercio.

Una volta che le immagini sono state registrate dal sensore e il chip della macchina ha compiuto tutti i calcoli necessari, ad ogni pixel viene attribuita una combinazione dei singoli valori dei tre colori primari (Red, Gree, Blue).

Per esempio, se un dato pixel deve riprodurre il valore puro di Cyan (molto improbabile in natura ma assai utile ai fini esplicativi) i suoi valori RGB saranno: R=0, G=255, B=255.

I dati vengono poi disposti dello spazio di colore appropriato (AdobeRGB1998 nel caso delle foto) e viene salvata l’immagine.

YUV COLOR SPACE

Anche nel video vengono utilizzati i medesimi sensori digitali che vengono utilizzati in fotografia ed infatti, con fotocamere come la Canon Eos 5D Mark II si possono fare entrambe le cose.

Il sensore è quini lo stesso ma la rappresentazione del colore e i parametri che lo definiscono sono diversi nei due casi. Nel video infatti per la rappresentazione dei colori in ogni pixel dell’immagine si utilizzano tre componenti che funzionano diversamente rispetto all’RGB visto in precedenza.

Il singolo colore di un pixel è infatti identificato dalla combinazione di Y (il solo canale di luminanza che registra i valori tra bianco assoluto e nero assoluto, passando per tutte le sfumature intermedie del grigio) e dei due canali di crominanza U e V dalla cui differenza si derivano le sfumature di colore.

Questo spazio di colore si chiama appunto YUV (in analogico) o più propriamente YCbCr (in digitale) ma spesso le due denominazioni convergono e si confondono, finendo per indicare la stessa cosa ma anche contribuendo ad aumentare la confusione.

Questo spazio di colore è concepito per rispecchiare il comportamento della percezione umana, dove la crominanza ha una rilevanza più ridotta, rispetto alla luminanza dell’immagine percepita. Tutto chiaro fino a qui?

Adesso viene la parte facile di tutto il discorso. Se come abbiamo detto, ogni pixel contiene le informazioni della componente Y e delle componenti Cr eCb, prendendo in considerazione i primi 4 pixels (vedi fig.) della prima riga di un’immagine digitale (il frame di un video), avremo i valori di Y, U e V per ciascun pixel del gruppo di 4 pixels e quindi 4 volte Y, 4 volte Cb e 4 volte Cr., ossia 4.4.4.

Le tre sigle quindi stanno ad indicare una maggiore (4.4.4) o minore (4.2.0) quantità d’informazioni relative al colore e alla luminanza dell’immagine presa in considerazione.

A questo punto rimane soltanto da capire che genere di campionamento del colore viene utilizzato dalle fotocamere dslr e dalle altre apparecchiature video e quando viene richiesto un certo campionamento colore (una certa qualità e presenza delle sfumature) e per quale destinazioni d’uso.

4.4.4 Color Sampling/Campionamento Colore

Questo campionamento colore si trova nelle macchine cinematografiche che producono files di dimensioni davvero enormi per pochi minuti di ripresa.

La resa del colore è perfetta ed equivalente ad RGB. e anche le più lievi sfumature di colore vengono rese alla perfezione. In ciascun pixel dell’immagine sono contenuti tanto i valori di Y che di Cb e Cr

4.2.2 Color SubSampling/Sottocampionamento colore

Questo sotto campionamento del 444 dispone della metà di informazioni colore del precedente e quindi anche il peso dei files è ridotto della metà.

E’ la qualità colore richiesta per la trasmissione televisiva (qualità broadcasting) ed infatti le videocamere professionali dispongono tutte di questo tipo di campionamento del colore, oltre ad un alto bitrate (quantità di dati al secondo).

In questo caso il valore di Y è inalterato, mentre i valori di Cb e Cr sono dimezzati.

4.2.0 Color SubSampling/Sottocampionamento

E’ il tipo di campionamento utilizzato nelle fotocamere digitali dotate di funzioni video. Dispone di 1/4 delle informazioni del 4.4.4 e quindi i files risultano sufficientemente leggeri da poter essere scritti su una normale scheda CF o SD e gestiti su notebooks a disposizione dell’utente medio.

Il valore di Y rimane invariato anche in questo caso, mentre i valori di crominanza sono rappresentati dalla sola componente Cr. La componente Cb è del tutto assente.

Conclusioni

Certe fotocamere o videocamere dispongono o meno di un certo campionamento del colore in base alla destinazione d’uso che è stata pensata dalla casa madre.

In certi casi, come per esempio alle fotocamere, pur non disponendo di fabbrica di un campionamento colore adeguato alla produzione televisiva, possono essere connessi degli hdd esterni come il Ninja2 della Atomos per registrare il segnale non compresso direttamente dal sensore della fotocamera ed inviarlo via HDMI al videorecorder esterno, registrando il segnale con un campionamento colore 4.2.2 ed un bitrate molto elevato e codec Apple ProRes422 o Avid DNxHD in contenitore .MOV o .MXFCi sono molti sistemi per ovviare ai limiti imposti dai costruttori, sia operando in un certo modo in fase di ripresa e di settaggi della fotocamera, sia in fase di esportazione e conversione del video finito, sia mediante attrezzature appropriate; più spesso una combinazione di tutte queste cose.

Questi argomenti saranno certamente oggetto di un prossimo articolo su queste pagine. A presto e buon lavoro.