Este projeto foca na segmentação de objetos em imagens utilizando redes neurais profundas, com ênfase na preparação de dados e no treinamento do modelo Mask R-CNN. O objetivo principal é a segmentação automática da silhueta dorsal de bovinos, permitindo a remoção do fundo da imagem para análises subsequentes de características anatômicas relevantes, associadas a padrões de mercado e produtividade animal.
- Explorar as etapas de desenvolvimento de modelos de segmentação de imagens.
- Focar na preparação do conjunto de dados, especificamente na demarcação dos polígonos que compõem as máscaras de segmentação.
- Configurar e treinar o modelo Mask R-CNN para a segmentação automática de objetos.
- Segmentar a silhueta dorsal de bovinos para remover o fundo da imagem e facilitar análises anatômicas.
- Mask R-CNN: Modelo de rede neural profunda pré-treinado no conjunto de dados COCO, utilizando uma arquitetura ResNet-50 integrada a uma Feature Pyramid Network (FPN) para extração multiescalar de características.
- Detectron2: Biblioteca desenvolvida pelo Facebook AI Research (FAIR) que fornece implementações otimizadas para tarefas de detecção e segmentação.
- LabelMe: Ferramenta utilizada para anotação manual das imagens, delimitando ponto a ponto a silhueta de cada objeto de interesse para gerar máscaras poligonais.
O desempenho do modelo de segmentação foi avaliado utilizando a métrica Intersection Over Union (IoU), que quantifica a sobreposição entre as máscaras previstas e as máscaras reais. A IoU serve como base para métricas derivadas como:
- Average Precision (AP) : Mede a previsões corretas
- Average Recall (AR): Mede a abrangência das regiões corretamente identificadas.