trabalho computação gráfica - thiago ferreira

Processamento Digital de Imagens: Resolução de exercícios

Thiago Ferreira1Curso de Ciências da Computação – Faculdades Anglo-Americano (FAA)

Foz do Iguaçu – PR – Brasil

[email protected]

Abstract. This article aims to resolve some of the selected exercises in the book Digital Image Processing Author Gonzales and Woods, the exercises are among the Chapters 2 and 9. This project is part of the medium used for the evaluation system of discipline bimonthly Image Processing and Computer Graphics, taught by Prof. Miguel Diogenes Matrakas.

Resumo. Este artigo tem como objetivo resolver alguns dos exercícios selecionados no livroProcessamento Digital de Imagens do autorGonzales e Woods, os exercícios se encontram entre os capítulos 2 e 9. Este projeto faz parte do meio utilizado para o sistema de avaliação bimestral da disciplina de Processamento de Imagens e Computação Gráfica, ministrada pelo Prof. Miguel DiogenesMatrakas.

1. Introdução

2. Respostas às Questões do Capítulo 2

Questão 2.1

ENUNCIADO: Utilizando as informações apresentadas na Seção 2.1 e pensando puramente em termos geométricos. estime o diâmetro do menor ponto impresso que o olho é capaz de discernir se a página na qual o ponto foi impresso estiver a 0,2 metros de distância dos olhos. Suponha, para fins de simplificação, que o sistema visual deixe de detectar o ponto quando a imagem do ponto na fóvea ficar menor do que o diâmetro de um receptor (cone) nessa área da retina. Suponha também que a fóvea possa ser modelada em um arranjo matricial quadrado de dimensões 1.5 mm x 1,5 mm e que os cones e espaços entre eles sejam distribuídos uniformemente ao longo desse arranjo.

RESPOSTA:

O tamanho de cada elemento e de cada espaço é, então, s = [(1,5 mm) /1159] = 1,3 × 6

10-6m. Se o tamanho (sobre a fóvea) do ponto digitalizado for menor que o tamanho deum elemento de resolução única, assume-se que o ponto será invisível a olho nu. Em outras palavras, oolho não irá detectar um ponto se o seu diâmetro, d, for tal que 0,085 (d) <1,3 × 6 10-6m, ou d < 15,3 ×6 10-6m.

Questão 2.5

ENUNCIADO: Um chip de câmera CCD de Dimensões 7 x 7 mm contém 1.024 x 1.024 elementos e se concentra em uma área plana e quadrada, localizada a 0,5 m de distância. Quantos pares de linha por mm essa câmera será capaz de resolver? A câmera está equipada com lentes de 35 mm (Dica: modele o processo de aquisição de imagens como na Figura 2.3, com a distância focal das lemes da câmera substituindo a distância focal do olho.)

RESPOSTA:

7mm/35mm = z/500mmz = 100 mm

Então o tamanho do lado é de 100 mm.1 linha é 1024/100 = 10 elementos/mm aproximadamente.Descobrindo o numero de elementos é só dividir 10/2 e teremos 5 pares de linha/mm.

Questão 2.9

ENUNCIADO: Uma medida comum de transmissão de dados digitais é o baud rate, definido como o número de bits transmitidos por segundo. Em geral, a transmissão é feita em pacotes consistindo em um bit de início (start bit. que marca o início da transmissão), um byte (8 bits) de informação e um bit de parada (stop bit, que inclica o fim da transmissão). Dados esses fatos, responda as seguintes perguntas:

(a) Quantos minutos levaria para transmitir uma imagem de 1.024 x 1.024 com 256 níveis de cinza utilizando um modem de 56K bauds?

(b) Quanto tempo levaria em 3.000K bauds, uma velocidade representativa de uma linha telefônica do tipo DSL (Digital SubscriberLine)?

RESPOSTA:

(a) A quantidade total de dados (incluindo o início e um bit de parada), em um de 8 bits, imagem de 1024 x 1024, é (1024)² x [8 + 2] bits. O tempo total requerido para transmitir essa imagem através de um link de transmissão é de 56K baud (1024)² x [8 + 2] / 56000 = 187,25 segundos ou cerca de 3,1 minutos.

(b) Em 3000K este tempo cai para cerca de 3,5 segundos.

Questão 2.10

ENUNCIADO: Uma televisão de alta definição (HDTV) gera imagens com 1.125 linhas horizontais de TV entrelaçadas (onde o campo das linhas pares e das linhas ímpares

são pintados alternadamente na entrada do tubo, e cada campo tem 1/60 segundos de duração). A proporção largura por altura da imagem (razão de aspecto ) é de 16:9. O fato de o número de linhas horizontais ser fixo determina a resolução vertical das imagens. Uma empresa projetou um sistema de captura de imagens que gera imagens digitais a partir de imagens de HDTVs. A resolução de cada linha da TV (horizontal) nesse sistema é proporcional à resolução vertical, com a proporção sendo a razão de aspecto das imagens. Cada pixel na imagem colorida tem 24 bits de resolução de intensidade, 8 bits para cada imagem componente de cor: vermelha, verde e azul. Essas três imagens "primárias" formam uma imagem colorida. Quantos bits seriam necessários para armazenar um filme de 2 horas em HDTV?

RESPOSTA:

(1125)x(16/9) = 2000 pixels por linha, então temos 1125x2000.8bits para cada imagem é 1/30 segundos para cada componente.2 horas = 7200 segundos

(1125)x(2000)x(8)x(30)x(3)x(7200) = 1,166x10¹³ bits, ou 1,458x10¹² bytes

Questão 2.11

ENUNCIADO: Considere os dois subconjuntos de imagens, S, e S2 mostrados na figura a seguir. Para V= {1}, determine se esses dois subconjuntos são (a) adjacentes-4, (b) adjacentes-8 ou (c) adjacentes-m.

RESPOSTA:

(a) S1 e S2 não são -4; porque q não está no conjunto N4 (p);

(b) S1 e S2 são -8; porque q está no conjunto N8(p);

(c) S1 e S2 são –m, porque (i) q está em ND(p), e (ii) o conjunto N4(p)∩N4(q) está vazio.

Questão 2.12

ENUNCIADO: Desenvolva um algoritmo para converter um caminho -8 de 1 pixel de espessura em um caminho-4.

RESPOSTA:

A solução deste problema consiste em definir todas as formas possíveis de vizinhança para ir dosegmento diagonal para um segmento correspondente -4.O algoritmosimplesmente procura a combinação apropriada cada vez que um segmento diagonal é encontrado nafronteira.

Questão 2.13

ENUNCIADO: Desenvolva um algoritmo para converter um caminho-m de l pixel de espessura em um carninho-4.

RESPOSTA:

Questão 2.15

ENUNCIADO: Considere o segmento de imagem mostrado. (a) Se V={0,1},calcule os comprimentos dos caminhos -4, -8 e –m mais curtos entre p e q. Se um caminho específico não existir entre esses dois pontos, explique o por quê.

(b) Faça o mesmo para V={1,2}

RESPOSTA:

(a) Quando V = {0,1}, o caminho -4 não existe entre p e q porque é impossível ir de p a q, passando ao longo de pontos que são adjacentes -4 e que também têm valores de V.O menor traçado -8 é comprimento é de 4. O comprimento do traçado -m mais curto (indicado pelo tracejado) é 5. Ambos os traçados mais curtos são únicos neste caso.

(b) Quando V= {1,2}, o caminho -4 e -8 são possíveis. O traçado -4 tem comprimento 7 com possibilidade de 2 caminhos, já o traçado -8 possui comprimento 5.

Questão 2.16

ENUNCIADO: (a) Defina a(s) condição(ões) sob as quais a distância D4 entre dois pontos p e q é igual ao caminho-4 mais curto entre esses pontos.

(b) Esse caminho é único?

RESPOSTA:

Questão 2.17

ENUNCIADO: Repita o Exercício 2.16 para a distância D8.

RESPOSTA:

Questão 2.18

ENUNCIADO: No próximo capítulo, abordaremos dois operadores cuja função é calcular a soma dos valores de pixels em uma pequena área de subimagem, S. Demonstre que estes são operadores lineares.

RESPOSTA:

Questão 2.19

ENUNCIADO: A mediana, , de um conjunto de números é tal que a metade dos valores

do conjunto está abaixo de e a outra metade está acima dela. Por exemplo, a mediana do conjunto de valores {2, 3, 8, 20, 21, 25, 31} é 20. Demonstre que um operador que calcula a mediana de uma área de subimagem, S, é não linear.

RESPOSTA:

Questão 2.21

ENUNCIADO: Considere duas imagens de 8 bits cujos níveis de cinza cobrem todo o intervalo de 0 a 255.

(a) Discuta o efeito limitador de subtrair repetidamente a imagem(2) da imagem(1). Suponha que o resultado também seja representado em 8 bits.

(b) Inverter a ordem das imagens levaria a um resultado diferente?

RESPOSTA:

Questão 2.22

ENUNCIADO: A subtração de imagens costuma ser utilizada em aplicações industriais para detectar componentes faltantes na montagem de um produto. A metodologia e armazenar uma imagem "ótima" que corresponda à montagem correta; essa imagem é então subtraída das imagens do mesmo produto. Teoricamente, as diferenças serão zero se os novos produtos forem montados corretamente. As imagens da diferença para os produtos com componentes faltantes seriam diferentes de zero na área onde diferem da imagem ótima. Quais condições você acha que deveriam ser atendidas na prática para esse método funcionar?

RESPOSTA:

Questão 2.23

ENUNCIADO: (a) Consultando a Figura 2.31, esboce o conjunto (A ∩ B) (A B)∪ ∪ c.

(b) Dê as expressões para os conjuntos mostrados em cinza na figura a seguir em termos dos conjuntos A, B e C. As áreas em cinza em cada figura constituem um conjunto, de forma que cada uma das três figuras deve ter uma expressão correspondente.

RESPOSTA:

Questão 2.27

ENUNCIADO: Uma fábrica produz uma linha de quadrados de polímeros miniaturizados e translúcidos. Rigorosos padrões de qualidade requerem 100% de inspeção visual e a gerente da fábrica percebe que a utilização de inspetores humanos é cada vez mais dispendiosa. A inspeção é semiautomatizada. Em cada estação de inspeção, um mecanismo robótico posiciona cada quadrado de polímero sobre uma luz localizada abaixo de um sistema ótico que produz uma imagem ampliada do quadrado. A imagem preenche completamente o monitor de imagem, de dimensões 80 x 80 mm. Os defeitos aparecem como borrões circulares escuros e o trabalho do inspetor é olhar para a tela e rejeitar qualquer amostra que tenha um ou mais desses borrões escuros com diâmetro igual ou maior do que 0,8 mm, de acordo com a medida de uma régua na tela. A gerente acredita que, se conseguir encontrar uma maneira de automatizar completamente o processo, ela aumentará os lucros em 50%. Ela também acredita que o sucesso desse projeto a ajudará a subir na pirâmide corporativa da empresa. Depois de muita investigação, a gerente decide que a forma de solucionar o problema é visualizar cada tela de inspeção com uma câmera CCD de TV e alimentar a saída da câmera com um sistema de processamento de imagens capaz de detectar os borrões, medir seu diâmetro e ativar os botões aceitar/rejeitar que antes eram operados por um inspetor. Ela consegue encontrar um sistema capaz de realizar o trabalho, contanto que o menor defeito ocupe uma área de pelo menos 2 x 2 pixels na imagem digital. A gerente contrata você para ajudá-lo a escolher o sistema de câmera e lentes, mas requer que você utilize componentes que já estão fora de linha. Para as lentes, presuma que essa restrição implique qualquer múltiplo inteiro de 25 mm ou 35 mm, até 200 mm. Para as câmeras, a limitação significa resoluções de 512 x 512, 1.024 x 1.024 ou 2.048 x 2.048 pixels. Os elementos individuais de aquisição de imagens dessas câmeras são quadrados medindo 8 x 8 pro e os espaços entre os elementos são de 2 fim. Para essa aplicação, as câmeras custam muito mais do que as lentes, de forma que o problema deve ser solucionado com a câmera de menor resolução possível, com base na escolha das lentes. Como consultor, você deve fornecer uma recomendação por escrito, demonstrando com razoável nível de detalhes a análise que levou à sua conclusão. Utilize a mesma geometria de aquisição de imagens sugerida no Exercício 2.5.

RESPOSTA:


Questão 3.1

ENUNCIADO: Elabore uma função de transformação de intensidade para distribuir (expandir) as intensidades de uma imagem de forma que a menor intensidade seja 0, e a menor seja L -1.

RESPOSTA:

Seja f a imagem original. Primeiro subtraímos o valor mínimo de f (fmin) de f para obter uma função cujo valor mínimo é 0.

g1 = f − f min

Depois dividimos g1 pelo seu valor máximo para fornecer uma função de alcance [0,1] e multiplicamos o resultado por L -1 para fornecer uma função com valores de alcance [0,L-1]

lembrando que fmin é uma escalar e f é uma imagem.

Questão 3.3

ENUNCIADO: (a) Elabore uma função contínua para implementar a transformação de alargamento de contraste mostrada na Figura 3.2(a). Além de m, sua função deve incluir um parâmetro, E, para controlar a inclinação da função à medida que ela faz a transição de valores de intensidade baixa para alta. Sua função deve ser normalizada, de forma que seus valores mínimo e máximo sejam O e l, respectivamente.

(b) Esboce uma família de transformações como uma função do parâmetro E, para um valor fixo m = L/2, sendo L o número de níveis de intensidade da imagem.

(c) Qual é o menor valor de E que fará com que sua função tenha um desempenho efetivamente igual ao da função da Figura 3.2(b)? Em outras palavras, sua função não precisa ser idêntica à Figura 3.2(b). Ela só precisa gerar o mesmo resultado na produção de uma imagem binária. Considere que você esteja trabalhando com imagens de 8 bits e façam= 128. Faça com que C seja o menor número positivo representável no computador que está sendo utilizado.

RESPOSTA:

(a)

(b) Resolução através da figura abaixo:

(c) Precisamos que s seja 0 para r < m, e s seja 1 para valores de r > m, s = ½. Mas, sendo os valores de r inteiros, o comportamento que queremos é dado pelo seguinte sistema:

A questão no enunciado do problema é achar o menor valor de E que irá limitar o comportamento da equação acima. Quando r = m, nós vemos na equação (a) que s = 0.5, indiferente ao valor de E. Se C for o menor número positivo representável no computador, e continuar com a ideia de que s é positivo, então qualquer valor de s menor que C/2 será considerado 0 pelo computador. Para encontrar o menor valor de E para que isso aconteça, simplesmente resolvemos a seguinte equação para E, usando o valor dado de m = 128:

Porque a função é simétrica sobre m, a resultante do valor de E será dada por s = 1 para r ≥ m+1.

Questão 3.4

ENUNCIADO: Proponha um conjunto de transformações de fatiamento de intensidade capazes de produzir todos os planos de bits individuais de uma imagem monocromática de 8 bits. (Por exemplo, uma função de transformação com a propriedade T(r) =O para r no intervalo [0, 127], e T(r) = 255 para r no intervalo [1 28, 255] produz urna imagem do oitavo plano de bits em uma imagem de 8 bits.)

RESPOSTA:

As transformações necessárias para produzir os planos de bits individuais são nada mais que mapeamentos da tabela verdade para oito variáveis binárias. Na tabela verdade os valores do oitavo bit é 0 para valores de byte de 0 a 127, e 1 para valores de byte de 128 a 255, dando assim a transformação mencionada no enunciado do problema. Note-se que os valores dados transformados de 0 ou 255 indica simplesmente uma imagem binária para o plano de 8 bits. Quaisquer outros dois valores seriam igualmente válidos, embora menos convencional.

Continuando com o conceito da tabela verdade, a transformação necessária para produzir uma imagem do plano de 7 bits gera um 0 para valores de bytes no intervalo [0,63], um 1 para valores de bytes no intervalo [64, 127], um 0 para valores de bytes no intervalo [128, 191], e um 1 para valores de byte no intervalo [192, 255]. Da mesma forma, a transformação para o plano seguinte de 6 bits alterna entre oito faixas de valores de byte, a transformação para o plano seguinte de 5 bits alterna entre 16 faixas, e assim por diante. Finalmente, a saída da transformação para o plano de bits mais baixa ordem alterna entre 0 e 255, dependendo se os valores de byte é par ou ímpar. Assim, esta transformação alterna entre 128 faixas de valores de byte, o que explica por que uma imagem deste plano de bits é geralmente "mais ocupada" em relação as imagens de outros planos de bit.

Questão 3.5

ENUNCIADO: (a) Qual seria o efeito geral no histograma de uma imagem de zerar todos os planos de bits de baixa ordem?

(b) Qual seria o efeito sobre o histograma se zerássemos os planos de bits de alta ordem?

RESPOSTA:

(a) O número de pixels com valores de nível de intensidade diferentes diminuiria, fazendo assim com que o número de componentes no histograma para diminuísse também. Por não causar mudança no número de pixels, isto faria com que a altura de alguns dos picos do histograma restantes aumentasse de um modo geral. Tipicamente, a menor variabilidade em valores de nível de intensidade reduz o contraste.

(b) O efeito mais visível seria o significativamente escurecimento da imagem. Por exemplo, deixar cair o bit mais alto limitaria o nível mais brilhante em uma imagem de 8 bits para 127. Como o número de pixels permanece constante, a altura de alguns dos picos do histograma aumenta. A forma geral do histograma seria agora mais alto e mais estreito, sem componentes de histograma sendo localizados no 127.

Questão 3.6

ENUNCIADO: Explique por que a técnica de equalização de histograma discreto não resulta, em geral, em um histograma uniforme.

RESPOSTA:

Toda a equalização de histograma realiza um remapeamento dos componentes do histograma conforme a escala de intensidade. Para obter um histograma uniforme (flat) se exige, em geral, que a intensidade de pixels seja, na verdade, redistribuída de modo que existam grupos L de n/L pixels com a mesma intensidade, onde L é o número de níveis de intensidade discreta permitidos e n = MN é o número total de pixels na imagem de entrada. O método de equalização do histograma não tem provisões para este tipo (artificial) de processo de redistribuição de intensidade.

Questão 3.8

ENUNCIADO: Em algumas aplicações é útil modelar o histograma das imagens de entrada como funções de densidade de probabilidade gaussiana na forma:

onde m e r são a média e o desvio padrão da função de densidade de probabilidade gaussiana. A metodologia é fazer com que m e cr sejam medidas da intensidade média e contraste de uma determinada imagem. Qual é a função de transformação que você utilizaria para a equalização de histograma?

Resposta:

O histrograma genérico da função de transformação equalizadora é

Questão 3.11

ENUNCIADO: Uma imagem com intensidades no intervalo [0, 1] tem a PDF (função densidade de probabilidade) pz(r) mostrada no diagrama a seguir. Deseja-se transformar os níveis de intensidade dessa imagem de forma que eles tenham o pz(Z)

especificado mostrado na figura. Considere quantidades contínuas e descubra a transformação (em termos de r e z) que realizará isso.

Resposta:

Questão 3.13

ENUNCIADO: Duas imagens, f(x, y) e g(x, y), têm histogramas h1 e h2. Dê as condições nas quais é possível obter os histogramas de

(a) f(x, y) + g(x, y)

(b) f(x, y) - g(x, y)

(c) f(x, y) x g(x, y)

(d) f(x, y) / g(x, y)

em termos de h1 e h2. Explique como obter o histograma em cada caso.

Resposta:

Questão 3.14

ENUNCIADO: As imagens mostradas a seguir são bastante diferentes, mas seus histogramas são idênticos. Suponha que cada imagem seja borrada com um filtro de média 3 x 3.

(a) Os histogramas das imagens borradas continuariam iguais? Explique.

(b) Se sua resposta for não, esboce os dois histogramas.

Resposta:

Questão 3.15

ENUNCIADO: A implementação de filtros espaciais lineares requer o procedimento de mover o centro de uma máscara pela imagem e, em cada posição, calcular a soma dos produtos dos coeficientes da máscara com os pixels correspondentes nessa posição (veja a Seção 3.4). Um filtro passa-baixa pode ser implementado definindo todos os coeficientes como 1, permitindo a utilização do algoritmo filtro retangular ou de média móvel, que consiste em atualizar apenas a parte do cálculo que muda de uma posição à seguinte.

(a) Formule um algoritmo como esse para um filtro n x n, mostrando a natureza dos cálculos envolvidos e a sequência de varredura utilizada para mover a máscara por toda a imagem.

(b) A razão entre o número de cálculos realizados por uma implementação de força bruta e o número de cálculos realizados pelo algoritmo filtro retangular é chamada de vantagem computacional. Obtenha a vantagem computacional neste caso pilotando-a como uma função de n para n > 1. O fator de escala 1/n2 é comum aos dois métodos, de forma que você não precisa levá-lo em consideração no cálculo da vantagem computacional. Considere que a imagem tenha uma borda externa de zeros grande o suficiente para permitir que os efeitos de borda sejam ignorados em sua análise.

Resposta:

Questão 3.19

ENUNCIADO: (a) Desenvolva um procedimento para calcular a mediana de uma vizinhança n x n.

(b) Proponha uma técnica para atualizar o valor da mediana à medida que o centro da vizinhança se move de um pixel ao outro.

Resposta:

(a) Classifique numericamente os valores de n². A mediana éζ = [(2n + 1) / 2] o maior valor.(b) Uma vez que os valores tenham sido classificados, simplesmente excluímos os da extremidadefinal da vizinhança e os inserimos na borda inicial, nos locais apropriados da matriz ordenada.

Questão 3.20

ENUNCIADO: a) Em um aplicativo de reconhecimento de caracteres, páginas de texto são reduzidas à forma binária utilizando uma função de transformação de limiarização da forma mostrada na Figura 3.2(b). Isso é seguido de um procedimento que reduz os caracteres até que eles se tornem sequências de ls binários sobre um fundo de Os. Em razão do ruído, os processos de binarização e redução resultarm em sequências interrompidas de caracteres, com lacunas variando de l a 3 pixels. Uma forma de “reparar” as lacunas é aplicar uma máscara de media sobre a imagem binária para borrá-la e, assim criar junções de pixels diferentes de zero entre as lacunas. Calcule o tamanho (ímpar) da menor máscara de média capaz de realizar essa tarefa.

(b) Depois de preencher as lacunas, deseja-se limiarizar a imagem para convertê-la de volta à forma binária. Para sua resposta em (a), qual é o valor mínimo do limiar necessário para fazer isso, sem provocar novas interrupções dos segmentos?

RESPOSTA:

(a) O caso mais extremo é quando a máscara é posicionada sobre o pixel central à uma distância de 3 pixels, ao longo de um segmento fino, caso em que uma máscara 3 × 3 engloba um campo completamente branco. Uma vez que este é conhecido por ser o maior espaço, a próxima máscara de aumento (ímpar) é garantida para abranger alguns dos pixels do segmento. Assim, a menor máscara que irá fazer o trabalho é uma máscara mediana de 5 × 5.

(b) O menor valor médio produzido pela máscara é quando ele engloba apenas dois pixels do segmento. Este valor médio é um valor na escala de cinza, não binária, tal como o resto dos pixels do segmento. Denotam o menor valor médio por Amin, e os valores dos pixels binários no segmento fino por B. Claramente, Amin é menor que B. Em seguida, a definição do limite binarização ligeiramente menor do que Amin criará um pixel binário de valor B no centro da máscara.

Questão 3.21

ENUNCIADO: As três imagens mostradas aqui foram borradas utilizando máscaras de média quadradas de tamanhos n = 23, 25 e 45, respectivamente. As barras verticais na pane inferior esquerda de (a) e (c) estão borradas, mas há uma clara separação entre elas. Contudo, as barras na imagem (b) acabaram se mesclando, apesar do fato de a máscara que produziu essa imagem ser significativamente menor do que a máscara que produziu a imagem (c). Explique por que isso acontece.

RESPOSTA:

Da Figura 3.33 sabemos que as faixas verticais têm 5 pixels de largura, 100 pixels de altura, e a suaseparação é de 20 pixels. O fenômeno em questão está relacionado com a separação horizontal entre asfaixas; para que possamos simplificar o problema, considerando uma única linha de varredura dasfaixas da imagem. A chave para responder a esta questão reside no fato de a distância (em pixels) entreo início de um faixa e o início da próxima (por exemplo, à sua direita) ser de 25 pixels.Considere a linha de varredura mostrada na Figura 3.21. Também foi mostrada uma seção transversalde uma máscara de 25 × 25. A resposta da máscara é a média dos pixels que ela abrange. Observamosque quando a máscara move um pixel para a direita, perde um valor da faixa vertical à esquerda, masobtém um valor idêntico à direita, então a reação não se altera. Na verdade, o número de pixelspertencentes às faixas verticais e contidas dentro da máscara não alteram, independentemente de ondea máscara estiver localizada (contanto que esteja dentro das faixas, e não perto das bordas do conjuntode faixas).O fato de o número de pixels sob a faixa não alterar se deve à separação peculiar entre elas e aextensão das linhas em relação à extensão de 25 pixels da máscara. Esta resposta constante é a razãode não serem vistos espaços em branco na imagem mostrada no enunciado do problema. Note que estaresposta constante não acontece com máscaras de 23 × 23 ou 45 × 45 porque elas não estão‘sincronizadas’ com a extensão das faixas e sua separação.

Questão 3.30

ENUNCIADO: Uma câmera de TV do tipo CCD é utilizada para realizar um estudo de longo prazo observando a mesma área 24 horas por dia, durante 30 dias. Imagens digitais são capturadas e transmitidas a uma central a cada 5 minutos. A iluminação da cena varia entre a luz diurna natural e iluminação artificial. Em momento algum a cena fica sem iluminação, de forma que é sempre possível obter uma imagem. Como a variação da iluminação é tal que se mantém sempre na faixa linear de operação da

câmera, decide-se não empregar nenhum mecanismo de compensação na própria câmera. Em vez disso, foi decidido utilizar técnicas de processamento de imagens para o pós-processamento, normalizando as imagens ao equivalente de uma iluminação constante. Proponha um método para fazer isso. Você pode utilizar qualquer método que quiser, mas explique claramente todos as considerações feitas para chegar a seu objetivo.

RESPOSTA:


Questão 5.1

ENUNCIADO: Nas basrras brancas no padrão de teste mostrado têm 7 pixels de largura e 210 pixels de altura. A separação entre as barras tem 17 pixels. Qual seria o aspecto da imagem após a aplicação de

(a) Um filtro de média aritmética 3x3?

(b) Um filtro de média aritmética 7x7?

(c) Um filtro de média aritmética 9x9?

RESPOSTA:

As soluções para as questões (a), (b) e (c) são observadas na figura abaixo, da esquerda para a direita.

Questão 5.3

ENUNCIADO: Repita o Exercício 5.1 utilizando um filtro de média harmônica.

RESPOSTA:


Questão 5.6

ENUNCIADO: Repita o Exercício 5.1 utilizando um filtro de mediana.

RESPOSTA:


Questão 5.7

ENUNCIADO: Repita o Exercício 5.1 utilizando um filtro de máximo.

RESPOSTA:


Questão 5.9

ENUNCIADO: Repita o Exercício 5.1 utilizando um filtro de ponto médio.

RESPOSTA:



Questão 9.2(a)

ENUNCIADO: Desenvolva um algoritmo morfológico para converter urna fronteira binária 8-conectada em uma fronteira m-conectada (ver Seção 2.5.2). Você pode assumir que a fronteira está totalmente conectada e que possui espessura de um pixel.

RESPOSTA:

Converter um grade retangular para uma grade hexagonal basicamente requer que as linhas pares e ímpares sejam deslocadas horizontalmente uma em relação a outra por metade da distância horizontal entre os pixels adjacentes.

Uma vez que em uma grade retangular não existem valores de pixel definidos em novos locais, uma regra deve ser especificada para sua criação. Uma abordagem simples é dobrar a resolução da imagem em ambas as dimensões por interpolação. Em seguida os seis pontos de conexão são escolhidos a partir da matriz expeandida. A resolução da imagem será a mesma que a original (mas a primeira deve ser um pouco turva devido a interpolação). Verificando a abaixo vemos que os pontos pretos são os pixels originais e os brancos são os pontos novos criados pela interpolação. Os quadrados são os pontos da imagem escolhidos para o arranjo de grade hexagonal.

Questão 9.5

ENUNCIADO: Com referência à imagem mostrada, encontre o elemento estruturante e a(s) operação(ões) morfológica(s) que produziu(ram) cada um dos resultados mostrados nas imagens (a) até (d) . Mostre claramente a origem de cada elemento estruturante. As linhas tracejadas mostram a fronteira do conjunto original e foram incluídas apenas para referência. Repare que em (d) todos os cantos são arredondados.

RESPOSTA:

(a) A erosão é definida pela intersecção. A intersecção de dois conjuntos convexos é convexa também. Observando a figura abaixo podemos resolver as demais questões. Os conjuntos digitais da questão são os pontos negros maiores. As linhas são mostradas por conveniência para visualizar a quais conjuntos pertenceriam. Em (b) o resultado da dilatação não é convexo, porque o ponto central não está no conjunto. Em (c), vemos

que o ponto inferior direito não está ligado aos outros. Em (d), é evidente que os dois pontos interiores não estão no conjunto.

Questão 9.6

ENUNCIADO: Considere que A seja o conjunto sombreado mostrado na figura a seguir. Utilize os elementos estruturantes exibidos (os pontos pretos mostram a origem). Estabeleça o resultado das seguintes operações morfológicas:

(a) (A B⊝ 4) B⊕ 2

(b) (A B⊝ 1) B⊕ 3

(c) (A B⊕ 1) B⊝ 3

(d) (A B⊕ 3) B⊝ 2

RESPOSTA:

Referente a próxima figura, o centro de cada elemento estruturante é mostrado como um ponto negro. A solução (a) foi obtida pela erosão do conjunto original (linha tracejada) com o elemento estruturante mostrado. A solução (b) foi obtida erodindo o conjunto original com um elemento estruturante de altura retangular. A solução (c) foi obtida pela erosão da imagem mostrada abaixo para duas linhas verticais utilizando o elemento estruturante retangular, este resultado foi então dilatado com um elemento estruturante circular. A solução (d) foi obtida pela primeira dilatando o conjunto original com formato de um grande disco. Então a imagem dilatada foi erodida com um disco de metade do diâmetro do primeiro disco. Veja:

Questão 9.7

ENUNCIADO: (a) Qual é o efeito limitante de dilatar repetidamente uma imagem? Suponha que um elemento estruturante trivial (um ponto) não seja utilizado.

(b) Qual é a menor imagem a partir da qual você pode começar para que sua resposta na parte (a) permaneça válida?

RESPOSTA:

A figura abaixo responde as questões de (a) a (b)

Questão 9.15

ENUNCIADO: Prove a validade das expressões a seguir:

(a) A B é um subconjunto (subimagem) de A.∘

(b) Se C é um subconjunto de D, então C B é um subconjunto de D • B.∘

(c) (A B) B = A B.∘ ∘ ∘

RESPOSTA:

(a) A erosão de um conjunto A por B é definida como um conjunto de todos os valores de tradução, z, de B, assim como (B)z está contido em A. Se a origem de B está contida em B, então o conjunto de pontos que descrevem a erosão é simplesmente todos os possíveis locais de origem de B, assim como (B)z está contido em A. Desta forma sugere a interpretação (e também definição de erosão) que a erosão de A por B é um subgrupo de A. Similarmente, a dilatação do conjunto C por B é o conjunto de todas as origens de B, assim como a intersecção de C e (B)z não é vazia. Se a origem de B está contida em B, isto implica que C é um subgrupo da dilatação de C por B. Agora, para a equação (9.3-1), sabemos que A B=(A B) B. Veja que C denota a erosão de A por B.∘ ⊝ ⊕ Já estava definido que C é um subgrupo de A. Para continuar a discussão, sabemos que C é um subgrupo de dilatação de C por B. Mas C é um subgrupo de A, portanto a abertura de A por B (ou seja, a erosão de A por B seguida da dilatação do resultado) é um subgrupo de A.

(b) Equação 9.3-3

C B = {B)z | (B)z C }∘ ∪ ⊆

e

D B = {B)z | (B)z D }∘ ∪ ⊆

Portanto, se C D, significa que C B D B.⊆ ∘ ⊆ ∘

(c) Partindo de (a), ( A B ) B ( A B ). É originário da abertura: ∘ ∘ ⊆ ∘

( A B ) B ∘ ∘ = {(A B) B} B∘ ⊝ ⊕

= {[(A B) B] B} B⊝ ⊕ ⊝ ⊕

= {(A B) ● B } B⊝ ⊕

⊇ (A B) B⊝ ⊕

⊇ (A B) ∘

Porém, a única forma de ( A B ) B ( A B ) e ( A B ) B ( A B )∘ ∘ ⊆ ∘ ∘ ∘ ⊇ ∘ se manter é se ( A B ) B = ( A B ). Do próximo para o último passo nesta∘ ∘ ∘ sequência de procedimentos parte do fato da proximidade de um grupo para o outro conter o grupo original.

Questão 9.18

ENUNCIADO: Considere as três imagens binárias mostradas na figura a seguir. A imagem à esquerda está composta por quadrados com lados de tamanhos 1, 3, 5, 7, 9 e 15 pixels. A imagem no meio foi gerada pela erosão da imagem da esquerda com um elemento estruturante quadrado de 1s, de tamanho 13 x 13 pixels, com o objetivo de eliminar todos os quadrados, exceto os maiores. Finalmente, a imagem da direita é o resultado da dilatação da imagem no centro com o mesmo elemento estruturante, com o objetivo de restaurar os quadrados maiores. Você sabe que a erosão seguida da dilatação é a abertura de uma imagem, e sabe também que a abertura geralmente não restaura os objetos à sua forma original. Explique porque a reconstrução total dos quadrados grandes foi possível neste caso.

RESPOSTA:

É possível reconstruir os 3 quadrados grandes para o seu tamanho original, porque eles não foram completamente erodidos e a geometria dos objetos e do elemento estruturante

foi a mesma (isto é, eles eram quadrados) Isso também seria verdade se os objetos e elementos estruturantes fossem retangulares. No entanto, uma reconstrução completa, por exemplo, através da dilatação de um retângulo que foi parcialmente erodido por um circulo não seria possível.

6. Conclusões

Referências

GONZALES, R; WOODS, R.Processamento digital de imagens. 3. ed. Tradução de Cristina Yamagami e Leonardo Piamonte. São Paulo:Pearson Prentice Hall, 2010.

trabalho computação gráfica - thiago ferreira

Documents

o para r

que o dimetro

para valores

para encontrar o menor

estime o dimetro

se que o ponto ser invisvel

se o tamanho sobre

e para que isso acontea