2010bEquipe03
PROCESSAMENTO DE IMAGENS TEXTUAIS
Orientação: Prof. Dra. Leyza Elmeri Baldo Dorini
Equipe: Igor Rodrigues Pessoa, Liria Grockotzki Goularte, Murilo Soares Alves
Tabela de conteúdo |
Resumo
Este trabalho consiste primariamente no aprofundamento do estudo de processamento de imagens, as áreas em que atua em conjunto, os métodos e ferramentas para tratar imagens, sensores ópticos para capturar imagens, dentre outros. O desenvolvimento de um software capaz de receber imagens textuais como entrada e digitalizá-las com a finalidade de tratá-las vem logo em seguida. Este tratamento baseia-se no uso de algoritmos que mapeiem, reconheçam e filtrem os possíveis defeitos à que se deseja corrigir, com finalidade de melhoria da visualização. A utilização da segmentação de imagens se fará presente em maior escala, devido ao que se deseja trabalhar, ou seja, com caracteres, e será citada e revista com importância durante o projeto.
Tema
Recuperação de textos digitais através do processamento de imagens.
Métodos
Apresentamos aqui alguns algoritmos utilizados para o processamento de imagens. Antes, uma breve explicação de uma expressão que será utilizada:
Tresholding - é um método simples de segmentação de imagens, utilizada na criação de imagens binárias, por níveis de cinza. Vários pixels são selecionados e tratados como objetos, atribuindo-se valores para cada de acordo com os níveis de cinza, separando o que é o 'fundo' e o objeto pixel de interesse. Existem vários algoritmos Tresholding, dependendo da finalidade:
1) Otsu: O algoritmo proposto por Nobuyuki Otsu baseia-se na distribuição de tons da imagem, armazenadas em um histograma. Este procura diferenciar os níveis de cinza (brilho) de uma imagem, através da segmentação de elementos à que se deseja trabalhar. É tido como um método não-paramétrico, ou seja, os testes feitos seguem a seguinte linha:
(i) são formuladas as 'hipóteses' a serem verificadas (ii) com dados pré selecionados e embutidos, são aplicados valores a cada observação dos pixels segmentados (iii) atingindo um certo valor limite a cada análise dos pixels, seleciona-se o que foi reconhecido e aceito ou rejeita-se aquela área (não será portanto tratada)
2) Niblack: Descricao do algoritmo: Temos uma imagem F em escala de cinza e queremos criar uma nova imagem binaria T. O threshold no pixel T(x, y) da imagem binaria e decidido pela expressao
T(x, y) = m(x,y) + k*s(x, y)
onde m(x, y) e s(x, y) sao a media de uma janela local tamanho a ser definido e o desvio padrao correspondente. O valor k e uma constante. Se T(x, y) > F(x,y) o valor desse pixel se torna 0 (preto). Caso contrario torna-se 1 (branco). O valor de k, assim como o tamanho da janela a ser definido dependem da qualidade desejada para a binarizacao.
3) Sauvola: O algoritmo Sauvola e uma modificacao do Niblack, proporcionando um melhor desempenho em documentos em que o fundo contem textura leve, e iluminacao desigual. Nesse algoritmo, o threshold e calculado com uma variacao dinamica do desvio padrao, R, usando a equacao
T(x, y) = m(x, y) * [1 + k*(s(x,y)/R-1)]
Onde m e s sao novamente a media e o desvio padrao da janela e k uma constante.
Relatório de Atividades
Link - Relatório de Atividades
Referências
http://www.a-a-r-s.org/acrs/proceeding/ACRS1999/Papers/PS599-1.htm
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5344078