2010bEquipe03

De Wiki DAINF
(Diferença entre revisões)
(Objetivos)
(Objetivos)
Linha 42: Linha 42:
  
 
• Melhoria da qualidade do resultado da imagem final, escolhidas devidamente as pré-condições da imagem a ser tratada
 
• Melhoria da qualidade do resultado da imagem final, escolhidas devidamente as pré-condições da imagem a ser tratada
 +
 
• Eficiência na restauração de documentos com baixo custo, em função da disponibilidade de instruções sobre como operacionalizar esses métodos e do software em desenvolvimento
 
• Eficiência na restauração de documentos com baixo custo, em função da disponibilidade de instruções sobre como operacionalizar esses métodos e do software em desenvolvimento
 +
 
• Adaptação dos algoritimos conhecidos para suprirem deficiências existentes
 
• Adaptação dos algoritimos conhecidos para suprirem deficiências existentes
  

Edição de 03h40min de 16 de outubro de 2010

PROCESSAMENTO DE IMAGENS TEXTUAIS


Orientação: Prof. Dra. Leyza Elmeri Baldo Dorini

Equipe: Igor Rodrigues Pessoa, Liria Grockotzki Goularte, Murilo Soares Alves


Tabela de conteúdo

Resumo

Este projeto consiste na implementação e posterior adaptação de algoritmos voltados para o processamento de imagens digitais, focados no reconhecimento de caracteres, fazendo uso de métodos-base anteriormente conhecidos. Estes métodos se utilizam da binarização das imagens textuais, para fins da recuperação dos documentos provindos da própria universidade. É denominado processamento de imagens digitais o método de análise, manipulação e modificação tendo como entrada e como saída uma imagem.

Tema

Processamento de Imagens Textuais.

Delimitação do Tema

Análise, implementação e adaptação de algoritmos em imagens de texto.


Introdução

A análise e reconhecimento de imagens é uma área em alta nos dias de hoje por ter uma infinidade de aplicações. Porém, dependendo de que tipo de utilização se pretende fazer dela, é necessário soluções computacionais específicas, requisitando assim uma maior quantidade de estudo. Para se resolver qualquer problema envolvendo processamento de imagens, há uma série de passos:

  • Aquisição e digitalização de imagens: consiste em transformar documentos em imagens digitais sob a forma de tabelas e valores chamdos pixels;
  • Pré-Processamento: deve permitir o tratamento de problemas de inclinação, fundos ruidosos, rabiscos, dados subscritos, dados sublinhados, dentr outros;
  • Segmentação: consiste em localizar automaticamente os campos relevantes do documento;
  • Interpretação: representa a parte "inteligente" e deve permitir o reconhecimento automático do conteúdo de cada um desses campos;

Objetivos

Objetivos gerais

Implementação e adaptação de algoritimos de reconhecimento voltados ao processamento de imagens textuais, viabilizando uma melhor captação de informações compartilhadas por estes documentos.

Objetivos específicos

• Melhoria da qualidade do resultado da imagem final, escolhidas devidamente as pré-condições da imagem a ser tratada

• Eficiência na restauração de documentos com baixo custo, em função da disponibilidade de instruções sobre como operacionalizar esses métodos e do software em desenvolvimento

• Adaptação dos algoritimos conhecidos para suprirem deficiências existentes

Métodos

Apresentamos aqui alguns algoritmos utilizados para o processamento de imagens. Antes, uma breve explicação de uma expressão que será utilizada:

Tresholding - é um método simples de segmentação de imagens, utilizada na criação de imagens binárias, por níveis de cinza. Vários pixels são selecionados e tratados como objetos, atribuindo-se valores para cada de acordo com os níveis de cinza, separando o que é o 'fundo' e o objeto pixel de interesse, ou seja, binarizando a imagem (preto e branco). Existem vários algoritmos Tresholding, dependendo da finalidade:

1) Otsu: O algoritmo proposto por Nobuyuki Otsu baseia-se na distribuição de tons da imagem, armazenadas em um histograma. Este procura diferenciar os níveis de cinza (brilho) de uma imagem, através da segmentação de elementos à que se deseja trabalhar. É tido como um método não-paramétrico, ou seja, os testes feitos seguem a seguinte linha:

  (i) são formuladas as 'hipóteses' a serem verificadas
  (ii) com dados pré selecionados e embutidos, são aplicados valores a cada observação dos pixels segmentados
  (iii) atingindo um certo valor limite a cada análise dos pixels, seleciona-se o que foi reconhecido e aceito ou rejeita-se aquela área (não será portanto tratada)

2) Niblack: Descricao do algoritmo: Temos uma imagem F em escala de cinza e queremos criar uma nova imagem binaria T. O threshold no pixel T(x, y) da imagem binaria e decidido pela expressao

  T(x, y) = m(x,y) + k*s(x, y)

onde m(x, y) e s(x, y) sao a media de uma janela local tamanho a ser definido e o desvio padrao correspondente. O valor k e uma constante. Se T(x, y) > F(x,y) o valor desse pixel se torna 0 (preto). Caso contrario torna-se 1 (branco). O valor de k, assim como o tamanho da janela a ser definido dependem da qualidade desejada para a binarizacao.

3) Sauvola: O algoritmo Sauvola e uma modificacao do Niblack, proporcionando um melhor desempenho em documentos em que o fundo contem textura leve, e iluminacao desigual. Nesse algoritmo, o threshold e calculado com uma variacao dinamica do desvio padrao, R, usando a equacao

  T(x, y) = m(x, y) * [1 + k*(1 - s(x,y)/R)]

Onde m e s sao novamente a media e o desvio padrao da janela e k uma constante.

Relatório de Atividades

Link - Relatório de Atividades

Referências

http://www.a-a-r-s.org/acrs/proceeding/ACRS1999/Papers/PS599-1.htm

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=5344078

Ferramentas pessoais