Skip to content

Commit 21eb907

Browse files
authored
Update modeloEscolhido.md
Atualização da documentação da escolha dos modelos para a versão mais atual.
1 parent cbce4b9 commit 21eb907

File tree

1 file changed

+43
-66
lines changed

1 file changed

+43
-66
lines changed

modeloEscolhido.md

Lines changed: 43 additions & 66 deletions
Original file line numberDiff line numberDiff line change
@@ -1,91 +1,68 @@
1-
# Modelos de IQA (Image Quality Assessment) Testados e Escolhido para Avaliação de Imagens de Lesões de Pele
1+
# Modelos de Machine Learning Testados e Escolhidos
22

3-
A avaliação da qualidade de imagem (IQA) é uma etapa crucial em diversas aplicações de processamento de imagem, e sua importância é particularmente acentuada no campo da imagiologia médica, como na análise de lesões de pele. A qualidade de uma imagem dermatológica ou dermatoscópica pode impactar diretamente a precisão diagnóstica, seja por um especialista humano ou por um sistema de inteligência artificial. Imagens de baixa qualidade podem obscurecer características vitais da lesão, levando a interpretações equivocadas. Neste contexto, foram avaliados modelos de IQA, com foco em sua aplicabilidade para garantir que apenas imagens de qualidade adequada sejam utilizadas para análise subsequente.
3+
A avaliação da qualidade de imagens é essencial em aplicações de diagnóstico médico, especialmente na análise de lesões de pele. Imagens de baixa qualidade podem comprometer a precisão diagnóstica, seja por especialistas humanos ou por sistemas de inteligência artificial. Neste contexto, decidimos avaliar três modelos distintos:
44

5-
## Modelo de Classificação de Qualidade de Imagem NIQE (Natural Image Quality Evaluator)
5+
- **BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator)**
66

7-
O NIQE é um algoritmo de Avaliação de Qualidade de Imagem Sem Referência (No-Reference Image Quality Assessment - NR-IQA), também conhecido como "blind IQA" (avaliação cega). Isso significa que ele estima a qualidade de uma imagem sem a necessidade de compará-la com uma imagem original "perfeita" ou "sem distorções".
7+
- **Conn-Cerberus/Soma_Skin_Cancer_Classifier**
88

9-
### Princípio Fundamental do NIQE
10-
A ideia central do NIQE é que imagens naturais e de alta qualidade possuem certas regularidades estatísticas que podem ser modeladas. Distorções em uma imagem (como ruído, desfoque, artefatos de compressão, etc.) tendem a perturbar essas estatísticas "naturais". O NIQE quantifica a qualidade de uma imagem medindo o quão distante suas características estatísticas estão de um modelo de "naturalidade" aprendido a partir de um corpus de imagens pristine (sem distorções).
9+
- **Anwarkh1/Skin_Cancer-Image_Classification**
1110

12-
### Como o NIQE Funciona:
11+
## BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator)
12+
O BRISQUE é um modelo de avaliação de qualidade de imagem sem referência (No-Reference Image Quality Assessment - NR-IQA) que opera no domínio espacial. Ele analisa estatísticas naturais de cenas (Natural Scene Statistics - NSS) para quantificar a "naturalidade" de uma imagem, utilizando coeficientes de luminância localmente normalizados. Um modelo de regressão por vetores de suporte (SVR) é treinado para prever a qualidade da imagem com base nessas estatísticas.
1313

14-
1. **Estatísticas de Cenas Naturais (Natural Scene Statistics - NSS):** O NIQE baseia-se fortemente em modelos de NSS. Estes modelos descrevem as propriedades estatísticas observadas em imagens que retratam cenas naturais. Uma característica comum utilizada são os coeficientes MSCN (Mean Subtracted Contrast Normalized - Média Subtraída e Contraste Normalizado). Os coeficientes MSCN de imagens naturais tendem a seguir distribuições específicas (por exemplo, uma distribuição Gaussiana Generalizada).
15-
2. **Construção do Modelo de "Qualidade":**
16-
* Um conjunto de imagens de alta qualidade e sem distorções (imagens "pristine" de cenas naturais) é usado para construir um modelo de referência.
17-
* Para cada imagem nesse conjunto, são extraídas características baseadas em NSS.
18-
* Essas características são então modeladas, tipicamente como uma Distribuição Gaussiana Multivariada (MVG). Essa MVG representa o "espaço" das características de imagens naturais de alta qualidade.
19-
3. **Avaliação de uma Imagem de Teste:**
20-
* Para uma nova imagem cuja qualidade se deseja avaliar, as mesmas características NSS são extraídas.
21-
* A "distância" entre o vetor de características da imagem de teste e o modelo MVG é calculada. Essa distância é a pontuação NIQE.
22-
* **Interpretação da Pontuação:** Uma pontuação NIQE **menor** geralmente indica melhor qualidade perceptual, significando que as estatísticas da imagem de teste estão mais próximas das estatísticas de imagens naturais. Pontuações mais altas indicam um desvio maior da "naturalidade" e, portanto, uma qualidade inferior.
14+
- **Vantagens:**
2315

24-
### Características Utilizadas:
25-
O NIQE utiliza um conjunto de características derivadas dos coeficientes MSCN no domínio espacial, incluindo parâmetros de ajuste de distribuições GGD e AGGD a esses coeficientes e seus produtos parciais. Ao todo, são tipicamente 36 características.
16+
- Sem necessidade de imagem de referência: Avalia a qualidade da imagem sem requerer uma imagem original "perfeita".
2617

27-
### Vantagens do NIQE:
18+
- Eficiência computacional: Requer menos recursos computacionais em comparação com modelos baseados em aprendizado profundo.
2819

29-
* **Totalmente Sem Referência (Blind).**
30-
* **Não Supervisionado por Opinião Humana (Opinion Unaware):** Não requer scores de qualidade humanos para treinamento, aprendendo apenas com estatísticas de imagens "naturais".
31-
* **Generalidade para Distorções Comuns.**
32-
* **Computacionalmente Mais Leve** que modelos de deep learning.
20+
- Aplicabilidade geral: Pode ser utilizado em diversas aplicações de avaliação de qualidade de imagem.
3321

34-
### Desvantagens e Limitações do NIQE:
22+
- **Limitações:**
3523

36-
* **Correlação com Percepção Humana:** Pode não se correlacionar fortemente com a percepção humana, especialmente para qualidade estética ou tarefas específicas.
37-
* **Foco na "Naturalidade":** Imagens estilizadas ou com conteúdo não fotográfico podem ser mal avaliadas.
38-
* **Sensibilidade ao Conteúdo.**
39-
* **Não Captura Aspectos Estéticos Complexos.**
24+
- Dependência de estatísticas de cenas naturais: Pode não ser ideal para imagens médicas, como lesões de pele, que possuem características estatísticas distintas das cenas naturais.
4025

41-
### Casos de Uso Comuns e Aplicabilidade em Lesões de Pele:
26+
- Sensibilidade a distorções específicas: Pode não capturar adequadamente distorções relevantes para diagnósticos médicos.
4227

43-
* Monitoramento em tempo real da qualidade de vídeo ou imagem.
44-
* Avaliação automática da qualidade em grandes bancos de dados de imagens genéricas.
45-
* Benchmarking de algoritmos de processamento de imagem.
46-
* **No contexto de lesões de pele:**
47-
* O NIQE padrão, treinado em cenas naturais, pode ter aplicabilidade limitada, pois as estatísticas de imagens dermatológicas (especialmente dermatoscópicas, com suas texturas e padrões específicos) diferem significativamente das cenas naturais. Uma imagem de lesão de pele pode ser "não natural" segundo o NIQE, mas clinicamente excelente.
48-
* Poderia, teoricamente, ser usado para detectar distorções muito grosseiras (desfoque extremo, ruído excessivo) que tornariam qualquer imagem inutilizável.
49-
* Uma adaptação do NIQE, treinando-o com um corpus de imagens de lesões de pele de **alta qualidade clínica** como referência de "naturalidade específica do domínio", poderia ser mais relevante, mas isso foge da sua formulação padrão e propósito original.
28+
- Necessidade de adaptação: Para melhor desempenho em imagens médicas, seria necessário treinar o modelo com um conjunto de dados específico desse domínio.
5029

51-
Em resumo, para imagens genéricas, o NIQE é uma ferramenta valiosa pela sua natureza não supervisionada. Contudo, para domínios específicos como imagens de lesões de pele, onde a "qualidade" é definida por critérios diagnósticos e não apenas por "naturalidade" estatística geral, suas limitações se tornam mais evidentes.
30+
## Conn-Cerberus/Soma_Skin_Cancer_Classifier
31+
Este modelo, disponível no Hugging Face, é especializado na classificação de imagens de lesões de pele. Ele utiliza técnicas de aprendizado profundo para identificar e classificar diferentes tipos de lesões cutâneas.
5232

53-
## Modelo de Classificação de Qualidade de Imagem NIMA (Neural Image Assessment)
33+
- **Desempenho:**
5434

55-
O NIMA (Neural Image Assessment) é um modelo de aprendizado profundo projetado para prever a qualidade de imagens de uma forma que se correlaciona fortemente com a percepção humana. Diferentemente dos métodos tradicionais que frequentemente fornecem uma única pontuação média, o NIMA prevê uma **distribuição de pontuações de opinião humana**. Isso significa que ele não apenas avalia a qualidade técnica (ausência de ruído, desfoque, etc.), mas também pode ser treinado para avaliar a qualidade estética ou, crucialmente para o nosso cenário, a **adequação diagnóstica** de uma imagem.
35+
- Acurácia: 89% na classificação de imagens de lesões de pele.
5636

57-
### Como o NIMA Funciona?
37+
- **Vantagens:**
5838

59-
O NIMA utiliza Redes Neurais Convolucionais (CNNs):
39+
- Especialização: Projetado especificamente para análise de lesões de pele.
6040

61-
1. **Arquitetura da CNN:** Emprega arquiteturas pré-treinadas (VGG, Inception, MobileNet) como extratores de características.
62-
2. **Camada de Saída Modificada:** Substituída por uma camada que produz uma distribuição de pontuações (e.g., 10 neurônios para uma escala de 1 a 10).
63-
3. **Função de Perda (Loss Function):** Comumente a Earth Mover's Distance (EMD), que compara a distribuição prevista com a distribuição real das classificações humanas (ou de especialistas).
64-
4. **Treinamento:** Ajustado (fine-tuned) usando conjuntos de dados de qualidade de imagem com classificações humanas/especialistas. Para lesões de pele, isso envolveria dermatologistas classificando a qualidade das imagens para fins diagnósticos (e.g., nitidez de bordas, visibilidade de estruturas dermatoscópicas, ausência de brilho excessivo).
41+
- Capacidade de generalização: Pode identificar uma variedade de lesões com boa precisão.
6542

66-
### Considerações e Limitações do NIMA:
43+
- **Limitações:**
6744

68-
* **Necessidade de Dados Rotulados:** Requer conjuntos de dados com classificações de qualidade, que no caso de lesões de pele, idealmente viriam de dermatologistas.
69-
* **Custo Computacional:** Modelos de aprendizado profundo podem ser mais intensivos.
70-
* **Natureza de "Caixa Preta":** Entender o porquê de uma decisão pode ser menos transparente.
45+
- Acurácia inferior a modelos mais recentes: Embora eficaz, apresenta desempenho inferior ao modelo Anwarkh1/Skin_Cancer-Image_Classification.
7146

72-
## Conclusão da Avaliação: Por que Escolhemos o NIMA em Detrimento do NIQE para Imagens de Lesões de Pele?
47+
- Possível necessidade de refinamento: Pode se beneficiar de ajustes adicionais ou treinamento com conjuntos de dados mais abrangentes.
7348

74-
Embora o NIQE seja útil por sua simplicidade e natureza não supervisionada para imagens genéricas, o **NIMA oferece vantagens decisivas para a avaliação da qualidade de imagens de lesões de pele**, um cenário onde a correlação com a percepção de especialistas e a relevância diagnóstica são primordiais:
49+
## Anwarkh1/Skin_Cancer-Image_Classification
50+
Também disponível no Hugging Face, este modelo utiliza a arquitetura Vision Transformer (ViT) para classificar imagens de lesões de pele em várias categorias, incluindo melanoma, carcinoma basocelular, entre outras.
7551

76-
1. **Aprendizagem Direta da Percepção (do Especialista):**
77-
* **NIMA:** Pode ser treinado diretamente com imagens de lesões de pele classificadas por dermatologistas quanto à sua qualidade para diagnóstico. Ele aprende a identificar características visuais que os especialistas consideram cruciais (e.g., nitidez das bordas da lesão, visibilidade de redes pigmentares, ausência de reflexos especulares que obscureçam detalhes, fidelidade de cores).
78-
* **NIQE:** Baseia-se na premissa de "naturalidade" estatística derivada de cenas fotográficas gerais. Imagens dermatoscópicas, por exemplo, possuem características estatísticas próprias que podem ser consideradas "não naturais" pelo NIQE padrão, mesmo que a imagem seja de excelente qualidade diagnóstica. A "naturalidade" do NIQE não se traduz diretamente em utilidade clínica para este tipo de imagem.
79-
2. **Previsão de Distribuição de Pontuações:**
80-
* **NIMA:** Fornece uma distribuição de pontuações. No contexto de lesões de pele, isso pode refletir não apenas uma média de qualidade, mas também o consenso ou a variabilidade na avaliação dos especialistas sobre a adequação diagnóstica de uma imagem. Uma imagem com alta variância pode indicar que sua qualidade é ambígua para diagnóstico.
81-
* **NIQE:** Produz uma única pontuação escalar, que não captura essa nuance subjetiva ou a complexidade da avaliação de qualidade para fins médicos.
82-
3. **Maior Correlação com Scores Humanos (de Especialistas):**
83-
* **NIMA:** Quando treinado com dados de especialistas (dermatologistas), demonstra correlação significativamente maior com os julgamentos de qualidade relevantes para o diagnóstico em comparação com o NIQE. Se o objetivo é um sistema que filtre imagens conforme a avaliação de um médico, NIMA é superior.
84-
* **NIQE:** Sua correlação com a percepção de "qualidade diagnóstica" em imagens médicas especializadas é geralmente baixa, pois não foi projetado para essa finalidade.
85-
4. **Capacidade de Avaliar Qualidade Técnica e Relevância Diagnóstica Específica:**
86-
* **NIMA:** Pode ser ajustado para focar em critérios de qualidade que impactam diretamente a análise de lesões de pele. Por exemplo, pode aprender a penalizar fortemente imagens com reflexos de luz que escondem partes da lesão, ou com desfoque que impede a visualização de estruturas finas.
87-
* **NIQE:** Avalia distorções gerais, mas não tem a capacidade de discernir quais características são especificamente importantes para a dermatologia ou dermatoscopia.
88-
5. **Aproveitamento de Modelos Pré-treinados (Transfer Learning):**
89-
* **NIMA:** Beneficia-se do transfer learning, adaptando poderosas CNNs para a tarefa específica de avaliar a qualidade de imagens de lesões de pele com um conjunto de dados de treinamento relativamente menor do que seria necessário para treinar do zero.
52+
- **Desempenho:**
9053

91-
Portanto, para o cenário de avaliação da qualidade de imagens de lesões de pele, o **NIMA** foi escolhido por sua capacidade de aprender com a expertise de dermatologistas, resultando em uma métrica de qualidade que é muito mais alinhada com os requisitos diagnósticos e a percepção de especialistas do que uma métrica genérica de "naturalidade" como o **NIQE**. O objetivo é garantir que as imagens subsequente para análise clínica ou por IA sejam de qualidade suficiente para não comprometer a precisão diagnóstica, e o **NIMA** se mostra mais adequado para essa tarefa específica. O **NIQE** ainda pode ter um papel secundário, talvez como um filtro inicial muito rápido para imagens com degradação extrema, mas para uma avaliação de qualidade fina e clinicamente relevante, o **NIMA** é a abordagem preferida.
54+
- Acurácia: 96% na classificação de imagens de lesões de pele.
55+
56+
- **Vantagens:**
57+
58+
- Alta precisão: Desempenho superior na classificação de diferentes tipos de lesões.
59+
60+
- Uso de arquitetura moderna: A utilização de ViT permite capturar características complexas das imagens.
61+
62+
- Treinamento com dados específicos: Foi treinado com um conjunto de dados abrangente de imagens de lesões de pele.
63+
64+
- **Limitações:**
65+
66+
- Requisitos computacionais: Pode demandar mais recursos computacionais devido à complexidade da arquitetura.
67+
68+
- Necessidade de adaptação para novos dados: Pode requerer ajustes ao ser aplicado em conjuntos de dados diferentes dos utilizados no treinamento original.

0 commit comments

Comments
 (0)