A Visão Humana & A Câmera Fotográfica

Como já havia mencionado no meu post anterior – “O Olho Humano” – tenho pesquisado bastante sobre a comparação entre o olho humano e o sistema ótico da câmera fotográfica. Esta pesquisa mais detalhada é necessária para a preparação e planejamento do meu próximo projeto fotográfico de narrativa.

Existem muitos estudos científicos sobre este assunto, realizados em universidades do mundo todo e publicados na internet; alguns fáceis de compreender, outros muito complexos. Não me interessei pela matemática envolvida porque, sinceramente, seria perda de tempo. Quando achei este artigo que resumia muito bem muitas das principais questões sobre o assunto, fiquei bastante satisfeito e decidi reproduzi-lo integralmente aqui no meu blog.

Este artigo é uma tradução comentada do artigo “The Câmera Versus The Eye”, de autoria de Roger Cicala, e publicado pelo site LensRentals/Blog, em 14/Mar/2009. Roger Cicala é fotógrafo e fundador da empresa Lens Rentals. O artigo original apresenta muitos links para fontes de referência, mas grande parte destes links não funcionam mais.

(*) As notas entre parênteses são de minha autoria.

A Visão Humana & A Câmera Fotográfica

Por Roger Cicala (Tradução e Comentários: Carlos Alexandre Pereira)

Eu comecei a pesquisar sobre a similaridade do olho humano com a câmera fotográfica após acompanhar uma discussão online, onde era debatido qual era a distância focal mais próxima a visão humana em uma câmera FF, 35mm ou 50mm, no que diz respeito ao campo de visão equivalente. Esta discussão logo mergulhou em uma análise dos dados técnicos da ótica da visão humana como se esta fosse uma câmera fotográfica – uma comparação válida, visto que o olho consiste de um elemento frontal (a córnea), um diafragma (a íris e a pupila), uma lente, e o sensor (a retina). Apesar de toda a impressionante matemática apresentada, a respeito dos dados técnicos da ótica da visão humana, a discussão não parecia levar a uma conclusão satisfatória. Portanto eu fiz uma porção de pesquisa sobre o assunto, a qual vou compartilhar com vocês.

Este artigo não vai oferecer nenhum benefício direto para a forma como você tira fotografias, mas você pode achá-lo interessante mesmo assim. Mas você também poderá achá-lo incrivelmente tediosos, então vou apresentar imediatamente as minhas conclusões, que podem ser traduzidas por duas citações de Garry Winogrand.

“Uma fotografia é a ilusão de uma descrição literal de como a câmera ‘viu’ um momento no tempo e no espaço.”

“A fotografia não é sobre a coisa sendo fotografada. É sobre como aquela coisa parece ao ser fotografada.”

Basicamente, ao fazer esta pesquisa sobre como o olho humano se parece como uma câmera, o que eu realmente aprendi é, como a visão humana NÃO se parece como uma fotografia. De um certo modo, isso explica porque eu tão frequentemente acho uma fotografia tão mais interessante do que eu achei a cena pessoalmente.

O olho como uma câmera fotográfica

Superficialmente, é bastante lógico comparar a câmera com o olho. Nós podemos medir a distância total do olho (aproximadamente 25mm da córnea até a retina), e o diâmetro da pupila (2mm contraída e 7 à 8mm dilatada) e, a partir destes números, calcular as ‘especificações técnicas’ como se fosse uma lente. Mesmo assim, você poderá encontrar alguns números divergentes, atribuídos a equivalência da distância focal do olho. Algumas deduções destas ‘especificações’ provém de medições físicas das estruturas anatômicas do olho, outras de cálculos opto métricos, e algumas ainda levam em consideração que o tamanho do olho varia devido a contração de vários músculos associados a sua estrutura, e consequentemente, as ‘especificações’ do olho também variam. Entretanto, para simplificar, a distância focal mais aceita para o olho é de 17mm; calculada a partir do valor da dioptria opto métrica. O valor mais comumente aceito, entretanto, é de 22 a 24mm; calculado a partir da refração física no olho. Em determinadas situações, a distância focal do olho pode ser até maior.

Visto que conhecemos a distância focal aproximada e o diâmetro da pupila, é relativamente fácil calcular a abertura (f-stop) do olho. Para a distância focal de 17mm e uma pupila com 8mm de diâmetro, o olho funcionaria como uma lente de abertura f2.1. Se usarmos a distância focal de 24mm e uma pupila com 8mm de diâmetro, seria f3.5. Existe um bom número de estudos feitos em astronomia para efetivamente medir a abertura (f-stop) do olho, e os números medidos ficam entre f3.2 e f3.5 (Middleton, 1958).

Neste ponto, todos vocês que leram até aqui devem provavelmente estar pensando: “Se a distância focal do olho é de 17 ou 24mm, porque está todo mundo discutindo qual lente, entre as de 35 ou 50mm, têm o mesmo campo de visão do olho humano?” A razão desta discrepância é que a distância focal ‘medida’ do olho não é o que determina o ângulo de visão humano. Eu vou entrar em detalhes nesta questão em breve, mas o ponto principal é que apenas parte da retina processa a imagem principal que enxergamos. A área de visão principal é chamada de cone de atenção visual e possui um ângulo de visão de 55 graus. Em uma câmera full-frame, uma lente com distância focal de 43mm permite um ângulo de visão com os mesmos 55 graus. Portanto a discussão original está encerrada, a verdadeira lente ‘normal’ em uma câmera full-frame não é nem a 35mm, e nem a 50mm; mas um meio termo entre estas duas, 43mm.

O olho NÃO é uma câmera

Tendo obtido a resposta para a discussão original, eu poderia ter deixado as coisas como estão, com mais uma informação trivial interessante para impressionar meus amigos. Mas nãããooo… Quando eu tenho uma quantidade considerável de trabalho para realizar, eu sempre escolho gastar mais um par de horas lendo artigos sobre a visão humana…

Você pode ter notado que o texto acima deixou de lado algumas analogias entre a câmera e o olho; porque uma vez que você completa as comparações óbvias de distância focal e abertura, as demais comparações não se encaixam tão bem. Considere a retina como sendo o sensor do olho. Ela, a retina, é quase do mesmo tamanho que um sensor full-frame, são 32mm de diâmetro, enquanto que o sensor full-frame tem uma largura de 35mm (35 x 24mm). E as semelhanças acabam aí.

A primeira diferença entre a retina e o sensor de uma câmera é bastante óbvia; a retina é curvada, acompanhando a superfície traseira do olho, e não plana, como um sensor de uma câmera fotográfica. (1) A curvatura oferece uma vantagem evidente: toda a superfície da retina está igualmente distante da pupila; enquanto que no sensor, as margens estão mais distantes da lente do que o centro do mesmo. Em teoria, a curvatura garante uma melhor nitidez nos cantos da imagem.

(1) Desde 2015 a Sony possui a patente de um sensor full-frame com curvatura, seguida pela Canon que obteve uma patente similar em 2016. Entretanto, nenhum fabricante lançou até agora uma câmera que utilize um sensor com curvatura. Uma grande dificuldade estratégica para o lançamento de um produto deste tipo é a compatibilidade. As lentes atuais, desenvolvidas para sensores planos, não funcionariam em câmeras com sensores com curvatura.

O olho possui muito mais ‘pixels’ do que qualquer câmera fotográfica disponível no mercado atualmente (2), aproximadamente 130 milhões de ‘pixels’. (3) Entretanto, apenas 6 milhões de ‘pixels’ do olho são cones, capazes de identificar as cores; os demais 124 milhões apenas enxergam em preto e branco, e são conhecidos como bastonetes. (4) Mesmo assim, esta é outra vantagem para a retina. Uma grande vantagem. Mas se olharmos adiante, as diferenças se tornam ainda mais pronunciadas.

(2) Em 2015, a Canon anunciou um novo modelo de câmera equipado com um sensor de 120M pixels. Este modelo ainda não foi lançado no mercado. A Hasselblad já possui modelos com sensores de 100M pixels, entretanto são sensores de médio formato, medindo 53 x 40mm.

(3) 130 milhões de células fotorreceptoras em cada olho! Então na verdade, são 260M pixels no total!

(4) Para maiores informações sobre a estrutura do olho, consulte o post anterior “O Olho Humano”.

Em uma câmera, cada pixel está organizado em um padrão definido. Cada milímetro quadrado da superfície de um sensor possui exatamente o mesmo número de pixels, organizados sempre da mesma forma*. Na retina existe uma pequena área central, de aproximadamente 6mm de diâmetro, denominada mácula, que contém a maior concentração de células fotorreceptoras do olho. A porção central da mácula, conhecida como fóvea, é densamente ocupada apenas por células fotorreceptoras do tipo cone, sensíveis às cores. O restante da mácula ao redor desta área central, exclusivamente sensitiva às cores, contém os dois tipos de células fotorreceptoras, cones e bastonetes. A mácula contém aproximadamente 150 mil ‘pixels’ – cones e bastonetes – em cada 1mm quadrado. Compare isso com os 24 milhões de pixels, de algumas das melhores câmeras disponíveis no mercado, espalhados por uma área de 24 x 35mm. A mácula é a responsável pela nossa visão central – o cone de atenção visual de 55 graus mencionado acima. Ou seja, a estrutura responsável pelo nosso campo de visão possui muito mais resolução do que as melhores câmeras do mercado atualmente.

O resto da retina possui muito menos ‘pixels’; muitos dos quais são bastonetes, que enxergam em preto e branco apenas. Estas células fotorreceptoras adicionais são responsáveis pelo que chamamos de visão periférica; as imagens que vemos pelos cantos dos olhos. Elas são mais sensíveis a objetos em movimento, mas não possuem definição suficiente para leitura, por exemplo. O campo total de visão do olho; ou seja, a área em que podemos perceber movimento; chega a 160 graus de abertura, mas fora do cone de atenção visual nós não podemos perceber detalhes, apenas formas e movimentos.

As vantagens do olho comparada com a câmera vão diminuindo quando saímos da retina e começamos a analisar a conexão com o cérebro. A câmera envia informações de todos os pixels existentes no sensor para o processador para que este faça a reconstrução da imagem digitalmente. O olho possui 130 milhões de células fotorreceptoras na retina, mas o nervo ótico que conduz as informações destas células para o cérebro possui apenas 1.2 milhões de fibras, isso quer dizer que menos de 10% das informações captadas pela retina é enviada para o cérebro. Isso acontece em parte, porque os fotorreceptores da retina precisam de um momento para ‘recarregar’ após serem estimulados; e em parte porque o cérebro não conseguiria processar a informação proveniente das 130 milhões de células fotorreceptoras, caso as recebesse de uma vez.

E claro, o cérebro processas as informações de uma forma muito diferente de como uma câmera fotográfica trabalha. Diferentemente do clique intermitente de uma câmera, o olho envia imagens continuamente para o cérebro, se assemelhando muito mais a um vídeo, do que as imagens do tipo still de uma câmera fotográfica. Uma parte subconsciente do cérebro (Lateral Geniculate Nucleus, em inglês) compara as informações recebidas pelos dois olhos, constrói uma imagem 3D, e envia a informação resultante para a parte consciente do cérebro para reconhecimento da imagem e processamento adicional. A parte subconsciente também envia sinais de comando para o olho, para mantê-lo em um movimento padrão de reconhecimento, de forma que a visão nítida da mácula se movimente pelo objeto de interesse. Em alguns milésimos de segundo o olho envia múltiplas informações ao cérebro, e este as processa transformando-as em uma imagem completa e detalhada.

A parte subconsciente do cérebro rejeita muita informação recebida do olho, enviando para a parte consciente apenas uma pequena fração desta. Você pode controlar isso até certo ponto; por exemplo, neste momento seu consciente está dizendo ao subconsciente “me envie informação apenas da visão central, concentre-se nas letras impressas no centro do campo de visão, mova-se da esquerda para a direita para que eu possa lê-las”. Pare de ler por um momento e sem mover seus olhos tente ver o que existe no campo de visão periférica. Um segundo atrás você não via os objetos à direita e à esquerda da sua tela porque as informações provenientes da sua visão periférica não estavam sendo repassadas para a parte consciente do cérebro. Se você se concentrar, mesmo sem mover seus olhos, você pode ao menos dizer que objetos estão lá. Mas você quiser vê-los claramente, você irá ter comandar seus olhos para mover o cone de atenção visual para aquele objeto. Perceba também que você não pode ler o texto e ao mesmo tempo enxergar os objetos periféricos. O cérebro não consegue processar toda essa informação.

O cérebro não acabou seu trabalho quando a imagem alcançou a parte consciente, chamada de córtex visual. Esta área se conecta fortemente com partes da memória, permitindo que você identifique os elementos da imagem. Todos nós experimentamos aquele momento em que vemos alguma coisa, mas não a reconhecemos por um instante; e depois fazemos a conexão e finalmente reconhecemos esta coisa. Isso acontece porque o cérebro demorou aquele exato instante para acessar a memória necessária para efetuar o reconhecimento.

Na realidade – e isto é bastante óbvio – a visão é uma forma de vídeo e não de fotografia. Mesmo quando estamos observando uma fotografia, o cérebro esta realizando múltiplos ‘snapshots’ ao mover o centro do foco sobre a fotografia, sobrepondo e recompondo estes ‘snapshots’ em uma imagem conforme a percebemos. Olhe para uma fotografia por alguns minutos e você irá perceber que, subconscientemente, seus olhos se moveram pela fotografia, realizando um reconhecimento geral da imagem, focando em detalhes aqui e ali, e após alguns segundos, notando detalhes que não ficaram evidentes no reconhecimento inicial.

Mas então Roger, qual o seu ponto? Você tem um ponto, certo?

Bem, eu tenho algumas observações, entretanto elas estão bem longe de ser do tipo “qual lente tem o campo de visão mais similar com a visão humana”. Este conhecimento me fez pensar sobre o que me faz gostar tanto de algumas fotografias, e nem tanto de outras. Eu não sei se alguma destas observações são verdadeiras, mas ao menos sei que são interessantes – para mim pelo menos. Todas elas são baseadas em um único fato: quando eu realmente gosto de uma fotografia, eu gasto um minuto ou dois observando-a, deixando minha visão analisá-la livremente, capturando os detalhes aparentes ou, apenas imaginando os detalhes que não estão visíveis.

Fotografias tiradas em um ângulo de visão ‘normal’ – 35 a 50mm – parecem reter seu apelo independentemente do tamanho da ampliação ou impressão. Mesmo em imagens formatadas para web, quando tiradas com esta distância focal, mantêm a essência da captura. A imagem abaixo, tirada com uma distância focal de 35mm, tem muito mais detalhes quando vista em uma impressão de grande formato, mas a essência é evidente mesmo quando vista em um tamanho menor. Talvez o cérebro fique mais confortável para processar uma imagem quando vista em um campo de visão normal. Talvez seja porque nós fotógrafos, subconscientemente, tendemos a enfatizar o assunto e a composição em um ângulo de visão normal.

Chinese Food

Carlos Alexandre Pereira, Samosa, Londres, 2013 (5)

(5) Esta não é a imagem utilizada na versão original deste artigo. Esta imagem é de minha autoria e também foi feita com uma distância focal de 35mm, entretanto o sensor é do tipo APS-C. Esta é a versão sem edições desta fotografia; a versão final – editada – pode ser conferida aqui.

A fotografia acima demonstra algo a mais sobre o qual eu sempre pensei – será que a nossa fascinação por imagens em preto e branco existe porque é uma das poucas formas em que a grande massa de fotorreceptores de cores em nossos olhos (cones) são forçados a enviar uma imagem em escala de cinza para o nosso cérebro? Talvez nosso cérebro goste de olhar para apenas tons e texturas, sem a informação da cor entupir os estreitos canais de ligação entre os olhos e o cérebro.

Como em fotografias tiradas em ângulos normais, as imagens capturadas com lentes do tipo telefoto ou macro também costumam parecer boas em pequenas impressões ou na web. Eu tenho uma impressão no tamanho de 8×10″ da imagem do olho de um elefante, e uma impressão em tamanho similar de uma imagem macro de uma aranha, ambas na parede do meu escritório, que mesmo de longe parecem muito boas. Não se tratam de grandes composições ou há qualquer outro fator que as torne interessantes – pelo menos para mim – mas eu as acho incríveis mesmo assim. Talvez porque mesmo em tamanhos pequenos, minha visão humana pode perceber detalhes nas fotografias, os quais eu nunca teria percebido olhando para o elefante, ou para a aranha, ao vivo e à olho nu.

Por outro lado, quando eu consigo uma bela imagem de paisagem ou grande angular, eu dificilmente me dou ao trabalho de postar na web ou fazer uma impressão pequena. Eu sempre imprimo a imagem em tamanho bem grande. Eu acho que talvez, dessa forma, minha visão humana pode analisar a imagem captando todos os pequenos detalhes que seriam totalmente perdidos em uma versão menor da impressão. E toda vez que faço uma grande impressão, mesmo de uma paisagem a qual já estive dúzias de vezes, eu percebo coisas na fotografia que nunca havia percebido pessoalmente. Talvez o ‘vídeo’ que me cérebro está produzindo enquanto observo a impressão fornece muito mais detalhes do que caso a impressão fosse reduzida, ou quando eu estava presente na cena.

E talvez, a análise subconsciente que meu cérebro faz da imagem impressa seja uma das razões pela qual a regra dos terços ou foco seletivo, atraem meu olhar para determinados detalhes da imagem. Talvez, nós fotógrafos, simplesmente deduzimos como o cérebro trabalha através de experiências práticas, e tiramos vantagem disso, sem saber toda a ciência por trás desta lógica.

Mas eu acho que minha única real conclusão é esta: a fotografia não é exatamente o que meu olho e cérebro viram no momento da captura da imagem. Quando consigo uma grande imagem. é algo diferente e melhor do que a coisa real. Como nas duas citações de Winogrand acima, e também nesta outra:

“Você vê algo acontecendo e você captura a imagem. Ou você consegue o que viu, ou você consegue alguma outra coisa – e o que for melhor, você imprime.” (6)

(6) Particularmente não entendi a citação. Entendo quando ele fala que existe duas possibilidades: você conseguir captar exatamente o que viu; ou algo diferente, que não transmita exatamente a essência do acontecimento que você presenciou. Mas as duas situações são possibilidades diferentes para uma única imagem – a imagem que você capturou no momento. Você tem apenas uma imagem em mãos, e somente essa imagem você pode imprimir. Ela pode ser uma coisa ou outra, mas não pode ser as duas coisas.

(7) Bom, esse artigo adiciona muitas informações a questão da comparação entre a visão humana e a ótica do equipamento fotográfico, mas nem de longo esgota o assunto. Vou deixar abaixo o link para dois outros artigos muito interessantes que trazem informações mais técnicas e práticas sobre esta questão.

Roger Cicala (Tradução e Comentários: Carlos Alexandre Pereira)

DEIXE UM COMENTARIO - LEAVE A REPLAY

This site uses Akismet to reduce spam. Learn how your comment data is processed.