Mudanças entre as edições de "Projeto - Desenvolvimento de uma base de imagens de placas de sinalização"

De MediaWiki do Campus São José
Ir para navegação Ir para pesquisar
Linha 26: Linha 26:
 
* Velocidade de aproximação - Dependendo a velocidade do veículo, a placa pode ser borrada;
 
* Velocidade de aproximação - Dependendo a velocidade do veículo, a placa pode ser borrada;
 
* Quantidade de placas capturadas;
 
* Quantidade de placas capturadas;
* Placas de advertência - Não capturar apenas placas regulatórias, placas de advertência também podem ser úteis em sistemas automáticos.
+
* Placas de advertência - Não capturar apenas as regulatórias, placas de advertência também podem ser úteis em sistemas automáticos.
  
  

Edição das 15h03min de 10 de junho de 2018

Esta é a página do projeto Desenvolvimento de uma base de imagens de placas de sinalização de trânsito para sistemas de reconhecimento automático. O projeto foi submetido e aprovado na Chamada interna nº 13/2018 do campus São José.

Equipe
  • Coordenador: Diego da Silva de Medeiros <diegomedeiros@ifsc.edu.br>
  • Membro: Deise Monquelate Arndt <deise.arndt@ifsc.edu.br>
  • Membro: Mathias Silva da Rosa <mathiassilva4@gmail.com>
  • Aluno bolsista: Guilherme Fleiger Felipe <guilhermefliegerfelipe@gmail.com>
  • Aluno voluntário: Augusto Gil de Oliveira <augusto.o@aluno.ifsc.edu.br>

Referência para o projeto como um todo

Trabalho de Conclusão de Curso - Mathias Silva da Rosa

Brainstorm parâmetros da base de dados

  • Ângulo da câmera - Câmeras podem fazer a captura próximo da placa, com um ângulo íngreme que impediria o sistema de reconhecer as placas;
  • Resolução da imagem - Variação que ocorre na vida real, dependendo a câmera usada em sistemas;
  • Hora do dia;
  • Ação do farol nas placas de transito - Algumas placas podem ter sua tinta refletiva nova ou antiga, mudando a captura;
  • Condições climáticas - Chuva influencia muito na qualidade da captura;
  • Placas degradadas e sujas - É uma boa prática considerar as placas que são praticamente irreconhecíveis;
  • Objetos de cor e formato semelhantes na mesma imagem - Evita "confusão" nos sistemas;
  • Distância - Possibilita que os sistemas sejam capazes de reconhecer placas distantes;
  • Velocidade de aproximação - Dependendo a velocidade do veículo, a placa pode ser borrada;
  • Quantidade de placas capturadas;
  • Placas de advertência - Não capturar apenas as regulatórias, placas de advertência também podem ser úteis em sistemas automáticos.


  • Uma possibilidade é publicar um vídeo também, visando testes em tempo real;
  • Publicar duas versões das imagens, demarcadas e sem demarcação nas placas;

Material de referência para o banco de imagens

Exemplos de bancos de imagens

Banco de imagens com caixas delimitadoras e anotações para definição da posição e reconhecimento de diversos objetos. (Conferir a aba "extra" no site, lá é mostrado alguns projetos que utilizaram a base de dados)

Lista extensa de datasets e seus links de redirecionamento, que são usados para o propósito de machine learning, bases de qualquer tipo: músicas, imagens, rostos, etc. Estas podem ser usadas para estudo, principalmente a caltech256, uma base de imagens que classifica 30607 imagens em 256 categorias diferentes. Um também interessante, mais próximo do projeto, é o Labelled Faces in the Wild, uma coletânea de rostos humanos e seus nomes.

Dataset de placas de transito belgas. Pode ser utilizado como exemplo para o nosso. No site há referência de dois materiais que parecem interessantes: Combining Traffic Sign Detection with 3D Tracking Towards Better Driver Assistance; Integrating Object Detection with 3D Tracking Towards a Better Driver Assistance System

Um trabalho sobre reconhecimento de placas de trânsito usando TensorFlow, uma biblioteca de software para machine learning. Na página, há um redirecionamento para um dataset de placas, também belgas, e explica trechos do código em Python que o autor usou.

Uma competição similar à que gerou o GTSDB, porém nela já são dados dois datasets de placas sob a aba 'data', um para o teste e um para o treinamento dos sistemas.

Trabalho da Universidade de Linköping, na Suécia, uma base com mais de 20000 imagens de 3488 placas, com um aquivo do matlab para o parsing das descrições das imagens, onde 20% das images têm uma.

Identificação e marcação de placas

Serviço online colaborativo de marcação de bounding boxes e anotações para imagens, vídeos, palavras etc. Pode ser útil para o treinamento da IA, já que após as marcações é possível baixar um Json com essas informações.

Locais para publicação do artigo