
Neste trabalho, apresentamos uma aplicação prática de aprendizado de máquina voltada para a detecção de mensagens de spam utilizando algoritmos de classificação e técnicas modernas de explicabilidade. O foco está na construção de um classificador eficiente em Python, treinado com dados de mensagens reais rotuladas como spam ou ham (não spam), e na interpretação das decisões desse modelo por meio do método SHAP (SHapley Additive exPlanations).
A proposta parte do pré-processamento linguístico de mensagens em português, utilizando stemming com o NLTK, vetorização com TF-IDF e classificação com regressão logística. Em seguida, o modelo treinado é avaliado quanto à sua acurácia e capacidade de generalização. No entanto, mais do que prever, é essencial compreender o motivo por trás de cada decisão. Para isso, adotamos o SHAP como ferramenta de explicabilidade, permitindo identificar quais palavras ou termos mais influenciam a classificação de uma mensagem como spam ou não.
Number of pages | 111 |
Edition | 1 (2025) |
Format | A5 (148x210) |
Binding | Paperback w/ flaps |
Paper type | Coated Silk 90g |
Language | Portuguese |
Have a complaint about this book? Send an email to [email protected]
login Review the book.