2010bEquipe03
Murilo S.A. (disc | contribs) (→Objetivos) |
Murilo S.A. (disc | contribs) (→Objetivos) |
||
Linha 42: | Linha 42: | ||
• Melhoria da qualidade do resultado da imagem final, escolhidas devidamente as pré-condições da imagem a ser tratada | • Melhoria da qualidade do resultado da imagem final, escolhidas devidamente as pré-condições da imagem a ser tratada | ||
+ | |||
• Eficiência na restauração de documentos com baixo custo, em função da disponibilidade de instruções sobre como operacionalizar esses métodos e do software em desenvolvimento | • Eficiência na restauração de documentos com baixo custo, em função da disponibilidade de instruções sobre como operacionalizar esses métodos e do software em desenvolvimento | ||
+ | |||
• Adaptação dos algoritimos conhecidos para suprirem deficiências existentes | • Adaptação dos algoritimos conhecidos para suprirem deficiências existentes | ||
Edição de 03h40min de 16 de outubro de 2010
PROCESSAMENTO DE IMAGENS TEXTUAIS
Orientação: Prof. Dra. Leyza Elmeri Baldo Dorini
Equipe: Igor Rodrigues Pessoa, Liria Grockotzki Goularte, Murilo Soares Alves
Tabela de conteúdo |
Resumo
Este projeto consiste na implementação e posterior adaptação de algoritmos voltados para o processamento de imagens digitais, focados no reconhecimento de caracteres, fazendo uso de métodos-base anteriormente conhecidos. Estes métodos se utilizam da binarização das imagens textuais, para fins da recuperação dos documentos provindos da própria universidade. É denominado processamento de imagens digitais o método de análise, manipulação e modificação tendo como entrada e como saída uma imagem.
Tema
Processamento de Imagens Textuais.
Delimitação do Tema
Análise, implementação e adaptação de algoritmos em imagens de texto.
Introdução
A análise e reconhecimento de imagens é uma área em alta nos dias de hoje por ter uma infinidade de aplicações. Porém, dependendo de que tipo de utilização se pretende fazer dela, é necessário soluções computacionais específicas, requisitando assim uma maior quantidade de estudo. Para se resolver qualquer problema envolvendo processamento de imagens, há uma série de passos:
- Aquisição e digitalização de imagens: consiste em transformar documentos em imagens digitais sob a forma de tabelas e valores chamdos pixels;
- Pré-Processamento: deve permitir o tratamento de problemas de inclinação, fundos ruidosos, rabiscos, dados subscritos, dados sublinhados, dentr outros;
- Segmentação: consiste em localizar automaticamente os campos relevantes do documento;
- Interpretação: representa a parte "inteligente" e deve permitir o reconhecimento automático do conteúdo de cada um desses campos;
Objetivos
Objetivos gerais
Implementação e adaptação de algoritimos de reconhecimento voltados ao processamento de imagens textuais, viabilizando uma melhor captação de informações compartilhadas por estes documentos.
Objetivos específicos
• Melhoria da qualidade do resultado da imagem final, escolhidas devidamente as pré-condições da imagem a ser tratada
• Eficiência na restauração de documentos com baixo custo, em função da disponibilidade de instruções sobre como operacionalizar esses métodos e do software em desenvolvimento
• Adaptação dos algoritimos conhecidos para suprirem deficiências existentes
Métodos
Apresentamos aqui alguns algoritmos utilizados para o processamento de imagens. Antes, uma breve explicação de uma expressão que será utilizada:
Tresholding - é um método simples de segmentação de imagens, utilizada na criação de imagens binárias, por níveis de cinza. Vários pixels são selecionados e tratados como objetos, atribuindo-se valores para cada de acordo com os níveis de cinza, separando o que é o 'fundo' e o objeto pixel de interesse, ou seja, binarizando a imagem (preto e branco). Existem vários algoritmos Tresholding, dependendo da finalidade:
1) Otsu: O algoritmo proposto por Nobuyuki Otsu baseia-se na distribuição de tons da imagem, armazenadas em um histograma. Este procura diferenciar os níveis de cinza (brilho) de uma imagem, através da segmentação de elementos à que se deseja trabalhar. É tido como um método não-paramétrico, ou seja, os testes feitos seguem a seguinte linha:
(i) são formuladas as 'hipóteses' a serem verificadas (ii) com dados pré selecionados e embutidos, são aplicados valores a cada observação dos pixels segmentados (iii) atingindo um certo valor limite a cada análise dos pixels, seleciona-se o que foi reconhecido e aceito ou rejeita-se aquela área (não será portanto tratada)
2) Niblack: Descricao do algoritmo: Temos uma imagem F em escala de cinza e queremos criar uma nova imagem binaria T. O threshold no pixel T(x, y) da imagem binaria e decidido pela expressao
T(x, y) = m(x,y) + k*s(x, y)
onde m(x, y) e s(x, y) sao a media de uma janela local tamanho a ser definido e o desvio padrao correspondente. O valor k e uma constante. Se T(x, y) > F(x,y) o valor desse pixel se torna 0 (preto). Caso contrario torna-se 1 (branco). O valor de k, assim como o tamanho da janela a ser definido dependem da qualidade desejada para a binarizacao.
3) Sauvola: O algoritmo Sauvola e uma modificacao do Niblack, proporcionando um melhor desempenho em documentos em que o fundo contem textura leve, e iluminacao desigual. Nesse algoritmo, o threshold e calculado com uma variacao dinamica do desvio padrao, R, usando a equacao
T(x, y) = m(x, y) * [1 + k*(1 - s(x,y)/R)]
Onde m e s sao novamente a media e o desvio padrao da janela e k uma constante.
Relatório de Atividades
Link - Relatório de Atividades
Referências
http://www.a-a-r-s.org/acrs/proceeding/ACRS1999/Papers/PS599-1.htm
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5344078