
O avanço da visão computacional tem permitido que computadores e sistemas embarcados interpretem o mundo visual de maneira cada vez mais próxima à percepção humana. Entre as técnicas modernas, o uso de redes neurais convolucionais (CNNs) e arquiteturas de detecção de objetos e segmentação tem se mostrado essencial para aplicações em segurança, veículos autônomos, análise de imagens médicas e robótica.
Neste trabalho, será apresentado o uso do Detectron2, uma biblioteca desenvolvida pelo Facebook AI Research (FAIR), que oferece modelos pré-treinados de última geração para detecção de objetos, segmentação de instâncias e reconhecimento de imagens. Utilizando a linguagem Python e a infraestrutura do Google Colab, será demonstrado como aplicar o modelo Mask R-CNN pré-treinado no conjunto de dados COCO, capaz de identificar e segmentar múltiplos objetos em imagens reais.
A proposta é fornecer um exemplo prático e didático, no qual uma imagem é baixada da internet, processada e submetida ao modelo, que retorna não apenas os objetos detectados, mas também as suas máscaras, caixas delimitadoras, classes e níveis de confiança. Dessa forma, o leitor terá uma visão clara de como configurar, executar e interpretar os resultados de um pipeline completo de reconhecimento de imagens com Detectron2.
Número de páginas | 109 |
Edición | 1 (2025) |
Formato | A5 (148x210) |
Acabado | Tapa blanda (con solapas) |
Tipo de papel | Coated Silk 90g |
Idioma | Portugués |
¿Tienes alguna queja sobre ese libro? Envía un correo electrónico a [email protected]
Haz el inicio de sesión deja tu comentario sobre el libro.