In fotografia, video e computer graphic, il simbolo
rappresenta un parametro numerico che descrive la non linearità dell'intensità
di riproduzione. Il gamma è un soggetto confuso e misterioso in quanto
esso coinvolge concetti da quattro discipline: la fisica, la percezione,
la fotografia e il video.
In questo articolo si spiega come il gamma è relazionato a ognuna di queste
discipline. Capire bene la teoria e la pratica del gamma vi permetterà di
ottenere buoni risultati quando create, processate o mostrate una immagine.
Questo articolo si focalizza sulla riproduzione elettronica delle immagini
usando tecniche e macchine video e di computer grafica. Tuttavia le discussioni
sulla percezione e sulla fotografia sono di interesse generale.
Di seguito verrà trattata principalmente la riproduzione dell'intensità
o come direbbe un fotografo "la scala dei toni". Questo è un punto molto
importante per raggiungere una buona riproduzione del colore.
La percezione non uniforme dell'intensità è il soggetto della prima sezione
di questo articolo.
La percezione umana dell'intensità è distintamente non uniforme: la
accuratezza di una sensazione visiva è grosso modo una funzione di potenza
di intensità. Questa caratteristica della visione deve essere rispettata
se si deve codificare un'immagine in modo che la visibilità del rumore
risulti minima e rendere efficace un limitato numero di bits per pixel.
L'origine del gamma nella fisica del tubo a raggi catodici (CRT) viene
spiegata nella seconda sezione di questo articolo. Il CRT (monitor) che
si trova ovunque come display di workstation e per l'uso televisivo è un
dispositivo non lineare: l'intensità della luce riprodotta sullo schermo
del CRT non è proporzionale al voltaggio in ingresso.
Da un punto di vista strettamente fisico il gamma correction può essere
immaginato come un processo di compensazione di questa non linearità allo
scopo di raggiungere una riproduzione esatta dell'intensità.
La terza sezione di questo articolo discute di come combinando questi due
concetti - uno della percezione e l'altro della fisica - si riveli una
strana coincidenza: la non linearità del CRT è molto simile all'inverso
della accuratezza della visione umana. Codificando l'intensità in un segnale
corretto per il gamma lo si massimalizza per la percezione di quel canale e
contemporaneamente lo si corregge per la funzione non lineare del CRT. Se
la correzione di gamma non fosse stata necessaria per ragioni fisiche del
CRT, avremmo dovuto invertirla per ragioni di percezione visiva umana.
La prossima sezione di questo articolo si occupa di un argomento completamente
differente: la fotografia. Anche la fotografia coinvolge un processo non
lineare di intensità di riproduzione. La non linearità del film viene
caratterizzata dal parametro gamma. Come vedete l'elettronica ha ereditato
il termine dalla fotografia!
Nel film l'effetto del gamma riguarda principalmente l'aspetto delle immagini
piuttosto che la riproduzione accurata dei valori di intensità. Qualche
aspetto del modo di apparire dell'immagine riferito al gamma per quanto
riguarda il film si applica anche al modo di apparire dell'immagine per
la televisione e per i computer.
Nella quinta sezione di questo articolo si descrive come il video trae
insegnamento da tutte queste aree per il suo modo di gestire il gamma:
notizie della fisica dei CRT, nozioni sulla non linearità della percezione
umana, condizioni di osservazione per la fotografia. Si parlerà anche di
ulteriori dettagli della funzione di trasferimento dei CRT che probabilmente
vorreste conoscere se volete calibrare un CRT o determinarne la non linearità.
Nella sezione finale di questo articolo trovate qualche commento riguardo
alla correzione di gamma per la computer grafica.
La luminanza
Il soggetto della colorimetria riguarda la relazione tra la sensazione di
colore e la potenza spettrale a diversa lunghezza d'onda nello spettro del
visibile. Discussioni dettagliate sulla colorimetria non sono lo scopo di
questo articolo con l'eccezione di un fatto che risulta importante: la
visione umana esegue un trattamento speciale della luminanza o parlando
grossolanamente, della "brillantezza".
La luminanza è una miscelazione pesata di energia spettrale ove i pesi sono
determinati dalla visione umana.
Approssimativamente la luminanza trae potenza per l'11% dalle regioni del
blu dello spettro, il 59% dal verde, il 30% dal rosso. I coefficienti di
questa somma pesata sono derivati dalla sensibilità della visione umana
alle lunghezze d'onda corrispondenti: un colore blu saturo è piuttosto scuro
in quanto ha una luminanza relativa dello 0,11 rispetto al bianco. Un
rosso saturo è considerevolmente più luminoso e un verde saturo ancora più
luminoso.
La Commission Internationale de l'Eclairage (CIE o International Commission
on Illumination) è l'organismo internazionale responsabile degli standards per
l'area della percezione del colore.
Il CIE ha standardizzato una funzione di misura/pesatura, definita numericamente,
che riferisce la potenza spettrale alla luminanza. Il simbolo utilizzato per la
luminanza è Y qualche volta enfatizzato come standard dal prefisso CIE.
Sfortunatamente nella pratica video il temine luminanza è diventato il segnale
video che rappresenta la luminaza senza pensare che il segnale video è soggetto
a una funzione di trasferimento non lineare.
Agli albori del video il segnale non lineare fu chiamato Y' ove il simbolo di '
(primo) stava ad indicare un trattamento non lineare. Ma negli ultimi quaranta
anni il simbolo di ' (primo) si è perso nell'uso e ora il termine luminanza e
il simbolo Y coincidono con il simbolo CIE il che rende il tutto molto ambiguo!
Questo ha creato una grande confusione come le istruzioni incorrette che si
possono comunemente trovare nella computer grafica o nei libri di testo sul
colore ove nello spazio colore YIQ o YUV il componente Y è la luminaza CIE.
Io uso il termine luminanza in accordo con la sua definizione standardizzata dal
CIE e uso il termine luma in riferimento al segnale video. Ma la mia convenzione
non è poi così diffusa e quindi nel frattempo dovreste osservare con cautela se
viene applicata una interpretazione lineare o non lineare alle parole e ai simboli.
Sino ad ora io ho usato il termine famigliare intensità ma da ora in poi userò il
termine luminanza in riferimento alla risposta, alla "brillantezza" della visione
umana. Continuerò ad usare il termine intensità per quantità lineari di rosso,
verde e blu. La luminanza è una quantità lineare di luce, tuttavia la sua
composizione spettrale viene definita secondo la visione umana. La "risposta"
del sistema di visone umana alla luminanza è il soggetto della prossima sezione.
La percezione
La visione umana è adatta a sopportare un'ampio raggio di intensità di livelli,
circa sette decine di dinamica in totale. Questo è illustrato dalla figura seguente.

Per circa due decine nella parte bassa dell'intensità vengono impiegate le
cellule fotorecettrici della retina chiamate rod. Siccome esiste un solo tipo
di cellule rod quella che viene, con termine ampio, chiamata "visione notturna"
non può discernere colori. L'adattamento di circa una decade viene fatto dal
diaframma; il resto dell'adattamento è dovuto a un processo fotochimico che
coinvolge la sostanza pigmento contenuta nelle cellule fotorecettrici.
L'adattamento è controllato dall'illuminazione totale della retina. L'adattamento
al buio a bassa intensità è lento: possono occorrere diversi minuti per adattarsi
dalla luce di una giornata soleggiata al buio di un interno tipo sala cinematografica.
L'adattamento al "chiaro" ovvero l'andare verso una luminosità più alta è più rapido
ma può essere doloroso come avrete provato uscendo da una sala cinematografica verso
l'esterno in una giornata di sole. Siccome l'adattarsi è controllato
dall'illuminazione totale della retina il vostro stato di adattamento è strettamente
legato all'intensità del "bianco" presente nel vostro campo visivo.
In un particolare stato di adattamento la visione umana può distinguere livelli
di luminanza diversi al di sotto dell'1% del bianco di picco. In altri termini
la nostra abilità di distinguere livelli di luminanza diversi si estende su uno
spettro di luminanza con rapporto 100:1. Esprimendosi in modo grossolano ,
intensità al di sotto dell'1% di quello che viene definito come bianco di
picco appare semplicemente come "nero". Differenze di valori di luminanza al
di sotto di questo livello di luminanza non sono distinguibili.
Si definisce Contrast Ratio (rapporto di contrasto) il rapporto tra gli elementi
più luminosi e gli elementi più scuri della scena. Il contrast ratio è il
determinante maggiore per la percezione di qualità di una immagine, cosi' tanto
che una immagine riprodotta con un alto contrast ratio può essere giudicata più
definita di un'altra immagine che possiede una risoluzione spaziale maggiore.
In un sistema d'immagine esistono molti fattori che cospirano per alzare la
luminanza dei neri e quindi abbassare il contrast ratio abbassando di
conseguenza la qualità percepita dell'immagine.
All'interno delle due decadi di range di luminanza nelle quali la visione può
distinguere livelli di luminanza, la visione umana ha una certa soglia di
discriminizzazione. Per la ragione che diventerà esplicita fra breve, risulta
conveniente esprimere la capacità di discriminare in termini di contrast
sensitivity che è il rapporto di luminanza tra due superfici di luminanza
simile.

Il disegno qui sopra mostra il cartello presentato all'osservatore in un
esperimento fatto per determinare la sensibilità umana al contrasto.
La maggior parte del campo visivo dell'osservatore viene riempito dal livello
di luminanza del contorno L0 per fissare lo stato di adattamento dell'osservatore.
Nell'area centrale del campo di visione vengono posizionati due superfici adiacenti
che hanno tra loro poca differenza di livello di luminanza, L e L+DL .
Lo sperimentatore presenta stimolazioni che hanno una grande scala di valori di
test in rispetto all'area circostante che è una grande rapporto di valori L/L0.
A ogni test di luminanza lo sperimentatore presenta all'osservatore un rapporto
di incremento di luminanza in rapporto allo stimolo di test che è un rapporto di
di valori di L+DL/L.
Il risultato del fare l'esperimento è mostrato nel grafico qui sotto.

Sensibilità al contrasto - le freccie indicano la frazione Weber-Fechner
Disegnando log DL/L come una funzione di log L si rivela un intervallo di
più di due decadi di luminanza tra circa 0 e +2.5 log millilamberts nel quale
la capacità di discriminare della visione è di circa 1% del livello di test
della luminanza. Questo porta alla conclusione che: per soglia di discriminazione
tra due superfici di luminanza molto vicina la capacità di discriminare è molto
vicina a una funzione logaritmica.
La funzione di sensibilità al contrasto comincia col rispondere alla domanda:
quale è il numero minimo di codici discreti necessari per rappresentare la
luminanza in un particolare scala?
In altre parole: quali codici di intensità possono essere ignorati senza che
l'osservatore se ne accorga?
Se i codici sono posizionati esattamente con l'intervallo dell'1% su una scala
da 100 a 1 il numero dei codici richiesti è log100/log1.01 ovvero 460.
Quindi si deduce che per coprire una dinamica di 100:1 sono necessari 460 codici
in un particolare stato di adattabilità (dell'osservatore) con una soglia del
discriminare dell'1%.
La relazione logaritmica è basata su misure di sensibilità al contrasto
rispetto a una soglia. Pertanto noi abbiamo misurato l'abilità del sistema
visivo umano di discriminare tra due valori di luminanza molto vicini. Su una
vasta scala di livelli di luminanza il restare ancorati a una codifica
logaritmica non risulta necessario per ragioni di percezione. Anche la capacità
di discriminare della visione umana degrada in presenza di ombre o grigi molto
neri, al di sotto di una percentuale minima del bianco di picco.
Nel 1976 il CIE ha standardizzato la funzione L* che è una funzione di potenza
della luminanza, modificata leggermente dall'introduzione di un segmento
lineare nelle vicinanze del nero.
Questa è la funzione standard che relaziona la luminanza fisica alla luminanza
(brillantezza) percepita.
Il CIE si riferisce a L* come la componente di brillantezza di uno spazio colore uniforme.
Il termine percettualmente lineare non è appropriato in quanto non pssiamo misurare
direttamente la quantità in questione, noi non possiamo assegnare ad essa le
proprietà di una linearità matematica.
Parlando in modo grossolano la brillantezza percepita è la radice cubica della luminanza.
Il gamma nella fisica
La fisica di un cannone elettronico di un CRT detta una relazione tra il
voltaggio in ingresso e la luce in uscita che i fisici chiamano five-halves
power law (legge della divisione per cinque): l'intensità della luce prodotta
sulla faccia dello schermo è proporzionale al voltaggio in ingresso ridotta
alla potenza di 5/2. In altre parole l'intensità è grosso modo tra il cubo e
il quadrato del voltaggio. Il valore numerico dell'esponente della funzione
di potenza è rappresentato dalla lettera greca g (gamma). I monitor con CRT
hanno voltaggio in ingresso che riflette la funzione di potenza e in pratica
il valore numerico del gamma è molto vicino al valore teorico di 2.5

Il disegno qui sopra mostra la funzione di potenza che si applica a un singolo
cannone elettronico, una scala di grigi per il CRT in bianco e nero o si
applica a ognuno dei tre cannoni per il rosso, il verde e il blu di un CRT
a colori.
Le funzioni associate con i tre cannoni di un CRT a colori sono molto simili
l'una all'altra ma non necessariamente identiche. La funzione viene dettata
dal cannone elettronico e non ha nulla a che fare con i fosfori del CRT.
Il processo di pre-compensazione per questa non-linearità, calcolando un voltaggio
del segnale da un valore di intensità, è noto come gamma correction.
La funzione richiesta è approssimativamente una funzione di potenza di 0.45 il
cui grafico è simile a quello di una funzione di radice quadrata.
In video il gamma correction si esegue per mezzo della circuitazione analogica
nella testa della telecamera.
In computer grafica il gamma correction si esegue incorporando la funzione
nella tavola di riferimento del frame buffer.
Il valore attuale del gamma per CRT particolari può variare da 2.3 a 2.6.
Operatori di computer grafica spesso richiedono che il gamma possa essere
variato di molto rispetto al volore di 2.5. Attualmente la causa della grande
quantità di sorgenti di variazione nella non linearità di un monitor è da
ricercarsi nelle regolazioni di black level e brightness del monitor. Assicuratevi
che il controllo di brightness del vostro monitor sia regolato in modo che gli
elementi neri dell'immagine siano riprodotti correttamente prima di dedicarsi
alla determinazione del gamma o di settare il vostro gamma.
Gli operatori di computer Apple Macintosh richiedono che i monitor a colori usati
con questi computer abbiano un valore di gamma considerevolmente al di sotto di 2.2
(dicono qualche cosa come 1.4 o 1.8). Ma questi valori sono una funzione della
relativa povera interpretazione che il software Apple's Quick Draw fa dei valori
RGB e non hanno una relazione diretta con i monitor usati con i computer Macintosh.
Una divertente coincidenza
La prima sezione di questo articolo descrive la risposta non lineare della
visione umana che relaziona la luminanza alla brillantezza percepita.
La seconda sezione descrive come la funzione di trasferimento non lineare di
un CRT relaziona il voltaggio del segnale alla intensità.
Qui accade una singolare coincidenza: la funzione di voltaggio/intensità è
molto vicina all'inverso della relazione luminanza/brillantezza della visione
umana. Questo significa che codificando un segnale di luminanza come un voltaggio,
il tornare a luminanza per mezzo di un CRT è molto vicino al mezzo di codifica
ottimale per minimizzare la percettibilità di rumore che viene introdotto nel
segnale. Il voltaggio del CRT è alla percezione molto uniforme.
Supponete di avere un valore di luminanza che viene determinato con sicurezza e
precisamente, ma dovete usare un canale che possiede solo 8 bit per convogliare
quel valore a un osservatore distante. Considerate una rappresentazione
lineare della luce con 8 bit ove il codice 0 rappresenti nero e il codice 255
rappresenti bianco.
Il codice di valore 100 rappresenta una ombra di grigio che è circa alla
soglia della percezione. Per codici sopra 100 la proporzione tra valori di
intensità di codici adiacenti è minore dell'1% e per codici al di sotto di
100 la proporzione tra valori di intensità di codici adiacenti ha valore
più grande dell'1%.
I codici di luminanza al di sotto di 100 soffrono di aumento di artifacts
(difetti) più il valore del codice si avvicina al nero a causa della visibilità
di differenza di luminanza tra codici adiacenti (2%) il che viene notato
dalla maggior parte degli osservatori. Questi artifacts si osservano specialmente
in immagini che hanno grandi aree di ombre che variano gradualmente.
I codici di luminanza al di sopra di 100 non soffrono di artifacst a causa
della visibilità dei salti tra i codici. Tuttavia all'aumentare del valore
del codice verso bianco i codici posseggono una utilità decrescente per la
percezione. Per esempio al codice 200 la proporzione tra intensità adiacenti
è di 1/2% , molto sotto alla soglia del visibile. Il codice 200 e il 201
sono virtualmente indistinguibili tra loro , il codice 201 non è utile alla
percezione e potrebbe quindi essere scaricato senza che questo venga notato.
Questo esempio mostra che la rappresentazione della luminanza in modo lineare
è una scelta sbagliata per un canale a 8 bit.
La sezione Percezione di questo articolo arriva alla conclusione che è
sufficiente a scopi di percezione visiva mantenere una proporzione dell'1%
tra codici adiacenti di luminanza. Questo può essere ottenuto codificando il
segnale in modo non lineare, come approssimativamente il logaritmo della
luminanza. Estendendo il concetto che la funzione logaritmica è un modello
accurato della funzione di sensibilità al contrasto, viene fatto un uso
dell'intera scala dei codici rispetto alla percezione (umana) nel suo intero.
Come detto nella sezione precedente , la codifica logaritmica rimane sull'assunto
che la funzione di soglia possa essere estesa sino a grandi proporzioni di
luminanza. La sperimentazione ha dimostrato che questo assunto non funziona
molto bene e è stata trovata una legge di codifica della potenza che meglio
risponde in modo approssimato alla risposta della luminanza, una legge migliore
della funzione logaritmica.
La sensazione di brillantezza può essere calcolata come una intensità elevata
approssimativamente alla terza potenza. Codificando un segnale di luminanza
in un segnale per mezzo di una legge di potenza con esponente tra 1/3 e 0.45
si ottiene una eccellente prestazione alla percezione.
In modo incidentale anche altri sensi si uniformano alla legge di potenza ,
come mostra seguente tabella.
| Loudness (udito) | Livello di pressione sonora = 0.67 |
| Saltiness (gusto) | Concentrazione di cloruro di sodio = 1.4 |
| Smell (odorato) | Concentrazione di molecole aromatiche = 0.6 |
| Heaviness (tatto) | Massa = 1.45 |
Il gamma nel film
Questa sezione descrive il gamma nel film fotografico. Fornirò qualche
nozione di base del processo fotografico che spiegano perchè la
rappresentazione fisicamente accurata della riproduzione dei valori di
luminanza non fornisce soggettivamente buoni risultati. I sistemi video
hanno ereditato questa "gemma del tempio" dalla fotografia. In modo
soggettivo è possibile ottenere buone immagini solo se vengono presi
accorgimenti appropriati rispetto alle condizioni di vista (di osservazione).
Quando il film fotografico viene esposto alla luce e poi sviluppato, l'immagine
luminosa della scena sul film causa un processo di alterazione/sviluppo di
piccoli grani di argento metallico. Questo processo intrinsecamente crea una
immagine negativa: dove esiste luce si crea la produzione di piccoli grani
d'argento, i piccoli grani d'argento assorbono la luce e appaiono scuri. Il
film colore comprende 3 strati di emulsione sensibili a lunghezze d'onda di
banda diversa, approssimativamente rosso, verde e blu. Il processo di sviluppo
converte l'argento contenuto in questi 3 strati in tinte che agiscono come
filtri colorati per assorbire la luce rossa, verde e blu.
Il film può essere caratterizzato da una funzione di trasferimento che relaziona
l'exposure (esposizione) della scena alla trasmittance (trasmittanza) del
film sviluppato. Il valore di esposizione su qualsiasi parte del film è
proporzionale alla luminanza del punto corrispondente della scena. Una alta
esposizione causa la produzione di più argento e quindi un maggior
assorbimento di luce da parte del negativo.
La trasmittance viene definita come l'unità diminuita della frazione di luce
assorbita dal film sviluppato.
La density (densità) viene definita come il negativo del logaritmo in base
10 della trasmittanza.
Un film pulito ha una density di 0; il film con una trasmittance di 0.1 ha
una densità di 1 e il film con una trasmittance di 0.01 ha una densità di
2. In pratica è difficile raggiungere una densità maggiore di 3 e pertanto
è difficile ottenere una proporzione di dinamica maggiore di 1000:1.
Il film ha qualche cosa di simile a una relazione non lineare tra esposizione
e trasmittanza, di solito si evidenzia disegnando la densità come una funzione
del logaritmo dell'esposizione questo D-log E curve (curva dell'esposizione
in base al logaritmo della densità) è stato introdotto per la prima volta da
Hurter e Driffield e pertanto è anche chiamato il H&D plot. In termini di
quantità fisiche dell'esposizione e trasmittanza un D-log E plot è
fondamentalmente in ambiente log-log.
Il H&D plot (la curva di H&D) di un tipico film reversal ha una forma a S
che comprime sia i bianchi che i neri con un segmento ragionevolmente dritto
nella parte centrale della curva. L'uso diffuso della curva D-log E nel lavoro
sul film (l'importanza della parte centrale lineare della curva determina la
corretta esposizione) porta molte persone alla errata conclusione che il film
abbia una risposta logaritmica alla luminanza in termini di quantità fisiche!
Ma l'andamento lineare della curva log-log è caratteristica di una funzione di
potenza non un logaritmo di per se stesso. In termini di quantità fisiche la
trasmittanza è una funzione di potenza dell'esposizione. L'andamento del
segmanto lineare della curva, in ambiente log-log, è l'esponente della funzione
di potenza. Il valore numerico dell'esponente della funzione di potenza, nella
regione della curva con andamento lineare, è noto come "gamma".
Siccome lo sviluppo del film produce un negativo si rende necessaria una seconda
operazione di processo, se necessaria, per produrre una immagine positiva. Questo
di solito significa una stampa positiva su carta o plastica dal film negativo.
(Detto per inciso, nel film reversal usato per le diapositive 35mm, l'argento
sviluppato viene rimosso da un processo di "sbianca", quindi l'argento
originario non esposto e non sviluppato latente che resta sul film viene
convertito in argento metallico per produrre una immagine positiva. Nel film
colore l'argento metallico viene quindi convertito in strati di colore.
Questo processo in cascata, che viene ripetuto due volte nella processazione
della maggior parte dei film cinematografici, rende importante che la funzione
individuale di potenza di ogni stadio venga mantenuta sotto stretto controllo,
sia nella progettazione che nello sviluppo del film. Come prima approssimazione
l'intenzione è quella di ottenere un gamma grosso modo unitario attraverso
l'intera cascata del processo. Step individuali possono distanziarsi dalla
linearità, di quel tanto che è possibile ricuperare approssimativamente sino
alla fine della catena di processo.
E ora una sorpresa! ...se un sistema di film viene progettato e processato
per produrre esattamente una riproduzione lineare dell'intensità, le stampe
lette per riflessione risultano buone. Ma se proiettato per trasparenza,
diapositive e film cinematografico, appaiono piatte e apparentemente mancanti
di contrasto. La ragione di questo coinvolge un altro aspetto della
percezione umana della visione.
Come spiegato nella sezione Percezione, la visione umana si adatta a un
campo molto largo di condizioni d'osservazione. Uno dei modi che la visione
umana usa per rendere possibile questo ampio spettro è quello di
incrementare la propria sensibilità a piccole variazioni di brillantezza
quando l'area di interesse è circondata da elementi brillanti.
Intuitivamente, la luce da un contorno brillante può essere pensata come
uno sparpagliamento di innesco/eccitazione in tutte le aree della visione,
compreso l'area di interesse, riducendone il contrasto apparente. Parlando
per similitudine, l'effetto è simile al "flare" (fiammeggio) (N.d.T. è un
fenomeno che si verifica nei dispositivi di rivelazione dell'immagine delle
telecamere e elettronica associata. Viene compensato elettronicamente con
apposite tarature e procedure sulla testa camera.) e il sistema visivo lo
compensa tirando il proprio limite di contrasto per incrementare la visibilità
degli elementi neri in presenza di un contorno brillante. Inversamente quando
la regione di interesse è circondata da un'area relativamente scura, la scala
del contrasto del sistema visivo diminuisce e quindi la nostra abilità di
discernere gli elementi neri della scena diminuisce.
L'effetto viene dimostrato nel disegno qui sotto.

L'effetto dovuto al contorno.
I tre quadrati grigi circondati dal bianco sono identici ai tre quadrati grigi
circondati dal nero, ma il contrasto della serie con contorno nero appare più
basso della serie con il contorno bianco.
Questo ha implicazioni per il dover mostrare immagini in aree e ambienti
scuri come un cinematografo, la proiezione di diapositive, il guardare la
TV in ambiente domestico. Se una immagine viene vista in ambiente "nero"
o "a luce abbassata" e l'intensità della scena riprodotta è fisicamente
corretta l'immagine apparirà mancante di contrasto.
I sistemi di film sono compensati per ovviare all'effetto del contorno. I
film intesi per essere osservati con un contorno nero sono progettati e
processati per avere un gamma maggiore dell'unità - circa 1.5 - in modo che
la scala del contrasto della scena venga espansa nel momento in cui il film
viene visto per proiezione (in ambiente buio).
I segnali video sono codificati in modo simile, si tiene conto di un contorno a
luce bassa dell'abiente di visione nel modo che descriverò tra un momento.
La conclusione importante da trarre da questa sezione è che la codifica
dell'immagine non è semplicemente relativa alla matematica, alla fisica,
alla chimica e all'elettronica; le considerazioni sulla percezione giocano
un ruolo essenziale nei sistemi d'immagine di successo.
Il gamma in video
In un sistema video il gamma correction viene applicato nella telecamera
per il duplice scopo di codificare in uno spazio di percezione uniforme
e di precompensare la non linearità del CRT.
La prima di queste due considerazioni fu importante nei primi tempi della
televisione per minimizzare il rumore introdotto dalla trasmissione via
etere in VHF. Tuttavia le stesse considerazioni di visibilità del rumore
si applicano alla registrazione analogica su nastro e anche per minimizzare
il rumore di quantizzazione che viene introdotto all'inizio del sistema
digitale quando il segnale che rappresenta l'intensità viene quantizzato
in un numero limitato di bits.
Di conseguenza i segnali video vengono sempre gestiti in forma di "gamma corrected".
Come spiegato precedentemente, quando si osserva una immagine sullo schermo
in un ambiente a luce ridotta è importante per ragioni di percezione
"tirare" (aumentare) la proporzione di contrasto dell'immagine riprodotta.
La condizione di contorno a luce ridotta è tipica del guardare la TV. Nel
video il "tirare" viene fatto nella telecamera, sottocompensando leggermente
la funzione attuale del CRT per ottenere una funzione di potenza finale con
un esponente di 1.1 o 1.2 . Questa tecnica produce immagini che sono molto
più soggettivamente piacevoli di quello prodotte con correzione matematica dei sistemi primitivi.
Gli standard video specificano un valore di gamma di 2.2 per scopi di
precorrezione: il prodotto dell'esponente 1/2.2 della camera e l'esponente 2.5
del monitor produce l'esponente finale desiderato di circa 1.13.
La funzione di trasferimento standardizzata per la TV ad alta definizione,
parte della Rec. CCIR 709 si basa su una funzione di potenza di 0.45. Tuttavia
una vera funzione di potenza richiede un guadagno infinito nella zona vicina
la nero che in una telecamera o in uno scanner potrebbe introdurre una grande
quantità di rumore nelle regioni del nero dell'immagine. La Rec. CCIR 709
introduce un segmento lineare vicino al nero per minimizzare l'effetto. La
curva di potenza ha l'intercettazione di Y spostato negativamente e il suo
guadagno aumentato in modo che il segmento lineare incontri la curva dove
i loro valori e inviluppi sono uguali. La mappatura dell'unità non viene turbata.
Dettagli della funzione di trasferimento dei CRT
Questa sezione fornisce informazioni tecniche riguardo la non linearità dei
CRT che è importante se volete determinare la funzione di trasferimento del
vostro CRT o calibrare il vostro monitor o capire l'nterfacciamento tra
voltaggio elettrico e un frame buffer di un computer e un monitor.
In un grafico precedente abbiamo gia visto la relazione tra segnale in
ingresso a un monitor rispetto alla luminanza prodotta sulla faccia dello
schermo. Le caratteristiche del grafico rispecchiano una scala di grigi o
ripettivamente uno dei tre segnali rosso verde e blu. L'asse X del grafico
mostra il livello del segnale in ingresso, dal nero di riferimento al bianco
di riferimento. Il segnale di ingresso può essere presentato come un codice
digitale o un voltaggio analogico. L'asse Y mostra l'intesità risultante.
Per segnali a voltaggio analogico sono in uso due standards. La scala da 54
mV a 714 mV viene usata in sistemi video che hanno il set-up (nero di riferimento)
al 7.5%, comprendendo il composito 525/59.94, sistemi come l'NTSC e video per
computer che si uniformano ai livelli dell'arcaico standard EIA-343-A. I frame
buffer dei computer, convertitori da digitale a analogico che usano il set-up
al 7.5%, universalmente posseggono una tolleranza piccola rispetto al voltaggio
analogico associato al nero di riferimento.
La tolleranza e' tipicamente di +/- 5% dell'intera scala. Questo porta a errori
di livello del nero che producono gravi errori nell'intensità riprodotta per il
nero. In assenza di una taratura del monitor perfetta potete compensare questo
errore regolando il black level o brightness del monitor.
L'accuratezza della riproduzione del livello del nero viene migliorata se si
usa uno standard video analogico che ha il set-up a 0. La scala di voltaggio
va da 0 a 700 mV ed e' associata a standard video 625/50 europeo (PAL) e allo
standard HDTV (alta definizione) come proposta.
Per l'RGB in componenti a 8 bit che si trova ovunque nei computer, il nero di
riferimento corrisponde al codice digitale 0 e il bianco di riferimento al
codice digitale 255. Lo standard CCIR Rec. 601, codifica per il video
digitale da studio, posiziona il nero al codice 16 e il bianco al codice 235.
Entrambi questi standard di codifica possono essere usati in associazione con
interfaccia analogica che abbia entrambi i set-up sia a 7.5% che a 0%. La
codifica di immagini con gamut colorimetrico esteso può posizionare i codici
di nero e di bianco ancora entro la scala da 0 a 255 per ragioni che hanno a
che fare con la riproduzione del colore che sono al di fuori degli scopi di questo articolo.
La non linearità nella funzione voltaggio rispetto a intensità di un CRT ha
origine dall'interazione elettrostatica tra il catodo e la griglia che
controlla la corrente del cannone elettronico. Al contrario di quanto viene
creduto normalmente, i fosfori del CRT per quanto riguarda essi stessi, sono
da ritenersi lineari sino a una intensità di circa gli 8/10 del bianco al
picco, zona nella quale comincia a farsi sentire la saturazione.
Sapendo che il CRT è intrinsecamente non lineare e che la sua risposta è basata
su una funzione di potenza, molti utilizzatori tentano di sommare la non
linearità del CRT in un singolo parametro numerico usando la relazione:
Questo modello mostra una grande variabilità nel valore del gamma dovuto
principalmente all'errore di black level che il modello non può risolvere
a causa del suo essere penalizzato verso lo zero. Il modello forza il
voltaggio zero a mappare l'intensità zero per qualsiasi valore di gamma. Errori
di black level che posizionano la funzione di trasferimento verso l'alto possono
solo essere sistemati scegliendo un valore di gamma che è molto piu' piccolo di 2.5.
Errori di black level che spostano la curva verso il basso possono essere aggiustati
solo con un valore di gamma piu' grande di 2.5.
In effetti il solo modo in cui un singolo parametro di gamma possa sistemare
una variazione di black level e' quello di alterare la curva della funzione. L'apparente
grande variabilita' del gamma sotto questo modello ha fornito al gamma una cattiva reputazione.
Un modello molto migliore si ottiene fissando l'esponente della funzione di
potenza a 2.5 e usando un singolo parametro per sistemare gli errori di black level:
Questo modello sistema la non linearità dell'osservatore in modo molto migliore della variabile del modello gamma.
|top|
Il gamma nella computer grafica
I software per i sistemi di computer grafica generalmente eseguono calcoli
per l'illuminazione, lo shading, la profondità di vista,anti aliasing
ecc... usando valori di intensita' che simulano un missaggio fisico della
luce. I valori di intensità memorizzati nel frame buffer sono corretti per
il gamma da tavole di riferimento dell'hardware (correzioni fatte al momento,
on the fly) nel momento in cui si mostra l'immagine.
La funzione di potenza del CRT agisce sui segnali di voltaggio corretti per
il gamma al fine di riprodurre i valori di intensità esatti sulla faccia dello
schermo. I sistemi di software di solito forniscono un valore di gamma di
partenza e qualche sistema per cambiare questo valore di partenza.
Siccome un monitor colore vuole voltaggi in ingresso per RGB la maggior parte
dei software per computer usa modelli a colore RGB.
Ogni componente colore (o canale) rosso, verde e blu, viene tipicamente
rappresentato in un alto livello del software per mezzo di un numero a virgola
mobile con scala da 0 a 1.
I software di librerie grafiche traducono di solito questo valore del numero
a virgola mobile in interi di 8 bit con scala da 0 a 255 per poter essere
utilizzato dall'hardware che gestisce la grafica. Sia nella rappresentazione
a virgola mobile che per interi il valore minimo nella componente rossa
significa "il nero più nero che puoi avere". Il valore massimo nella componente
rossa significa "il massimo del rosso che puoi avere" indifferentemente da
cosa il monitor mostri per il suo rosso, più o meno saturo di un altro
monitor. La caratterizzazione del colore da parte di un monitor è al di fuori
degli scopi di questo articolo.
Un sistema true color (colore vero) possiede componenti separati rosso,verde
e blu per ogni pixel dell'immagine (punto unitario dell'immagine) o nel frame
buffer. Nella maggio parte dei sistemi di computer ogni componente è
rappresentato da un byte di 8 bit e pertanto ogni pixel possiede una informazione
di colore di 24 bit.
È conveniente costruire un frame buffer o un sistema di memoria che consideri
ogni pixel completo e che ha un numero di bit che é potenza di 2. Di conseguenza
un frame buffer true color ha di solito 32 bit per pixel dove gli 8 bits
aggiuntivi sono usati per scopi diversi dalla rappresentazione del colore.
(per alfa channel, chiave, trasparenza N.d.T.)
I componenti RGB di ogni pixel in un sistema a 24 bit possono rappresentare
16.7 milioni di codice colore ma il numero dei colori che può essere distinto
è considerevolmente inferiore a questo. Con un colore a 24 bit è possibile
riprodurre immagini con qualità vicina al fotografico e gli oggetti geometrici
possono essere renderizzati (mostrati dopo il calcolo) con ombre/luci morbide (shading).
Un frame buffer true color è sempre invariabile e possiede 3 tavole di riferimento,
una per ogni componente colore.
Pseudocolor
Un sistema a pseudo color (o index color o color mapped) dedica diversi
bits - di solito 8 - a ogni pixel nell'immagine o nel frame buffer. Il
contenuto di ogni pixel viene usato come un indice in una tavola di
riferimento colore (CLUT o color map) che riporta i valori di rosso, verde,
blu per ogni pixel. Un frame buffer a 8 bit mostra al massimo 256 diversi
colori sullo schermo contemporaneamente. Una tipica tavola di riferimento
ha valori di 8 bit per ognuno dei valori di rosso, verde, blu in modo che
ogni pixel possa essere scelto da un possibile set (tavolozza) di 16.7
milioni di codici possibili. Come per i sistemi a 24 bit il numero di questi
colori che può realmente essere distinto è al di sotto di 16 milioni.
Di solito i sistemi pseudocolor hanno tavole di riferimento la cui uscita
produce un voltaggio per il monitor. Di conseguenza è convenzione , per le
applicazioni pseudocolor a 8 bit, fornire al sistema valori di RGB corretti
per il gamma rispetto a un monitor tipico. Di conseguenza una immagine
pseudocolor a codifica TIFF o GIF o file SUNRASTER è sempre invariabilmente
accompagnata da una mappa colore i cui valori RGB implicitamente incorporano
la correzione del gamma. Se questi valori RGB sono caricati in un frame
buffer a 24 bit la cui tavola di riferimento è modificata per compensazioni
di correzione del gamma, i valori pseudocolor saranno corretti per il gamma
due volte il che produrrà un severo sbiadimento apparente dei colori.
I limiti dell'intensità a 8 bit
Come detto nella sezione Gamma per la Computer Grafica, i sistemi di computer
grafica che producono immagini sintetiche di solito eseguono il calcolo in
ambiente a intensità alta e lineare.
Gli acceleratori grafici di solito eseguono lo shading "Gouraud" in
ambiente di intensità e memorizzano l'intensità per componenti a 8 bit nel
frame buffer. La rappresentazione per mezzo di intensità a 8 bit patisce di
artifacts (difetti) di contouring (bordature) dovuti alla insufficiente
prestazione percettiva delle intensità a 8 bit, in seguito alla soglia di
sensibilità al contrasto della visione umana che è stata descritta nella
sezione Percezione di questo articolo. La visibilità del contouring viene
evidenziata da un effetto percettivo chiamato Mach bands, pertanto l'artifact
viene qualche volta chiamato banding.
In un certo punto di intensità di codifica ove il codice è 0, il codice 100
è alla soglia della visibilità con un rapporto di cotrasto visibile dell'1%.
Il codice 50 rappresenta un grigio scuro che può essere riprodotto senza che
gli incrementi tra le zone di codici adiacenti vengano percepiti.
Io chiamo questo valore "il grigio migliore".
Io considero uno dei fattori determinanti della qualita' di una immagine
da computer grafica l'avere una proporzione di intensità tra il valore
più alto e il grigio migliore.
In un sistema a intensità lineare a 8 bit questa proporzione è di 2.55.
Se una immagine è compresa in questi limiti di proporzione essa non conterrà
banding ma la bassa proporzione di contrasto renderà piatta l'immagine.
Se una immagine ha una proporzione di contrasto maggiore di 2.5:1 è
possibile che contenga banding.
In un sistema di codifica di luce lineare a 12 bit la proporzione sale a
40:1 che risulta adeguata alla prestazione ma non si avvicina alla qualità
della riproduzione fotografica o del cinema.
I sistemi con software di alta qualità che non dipendono dall'accelerazione
dell'hardware di solito eseguono il calcolo di rendering in ambiente di
intensità e quindi mappano in ambiente corretto per il gamma per mezzo del
software e scrivono valori corretti per il gamma nel frame buffer. Questi
sistemi possono produrre immagini calcolate che risultano senza artifacts
di quantizzazione della rappresentazione a 8 bit.
Il futuro della correzzione gamma
I sistemi di gestione del colore dei PC e delle workstation presto
permetteranno una specifica del colore indifferentemente dal tipo di specifiche della macchina.
Gli utilizzatori e le applicazioni potranno specificare il colore su base
di indipendenza dal tipo di macchina con una forma basata sullo standard
internazionale CIE per il colore, senza implicazioni per quanto riguarda il
gamma. Questo rendera' facile ottenere una esatta riproduzione del colore
attraverso diversi sistemi di librerie e hardware diversi. Nel frattempo
potete seguire queste semplici istruzioni:
Fonte:la rete e i tecnici di Videostudio1
Via Rossini 2, 42010 Veggia di Casalgrande (RE) tel.0536/824704 fax 0536/824765