Neste trabalho, apresentamos uma aplicação prática de aprendizado de máquina voltada para a detecção de mensagens de spam utilizando algoritmos de classificação e técnicas modernas de explicabilidade. O foco está na construção de um classificador eficiente em Python, treinado com dados de mensagens reais rotuladas como spam ou ham (não spam), e na interpretação das decisões desse modelo por meio do método SHAP (SHapley Additive exPlanations).
A proposta parte do pré-processamento linguístico de mensagens em português, utilizando stemming com o NLTK, vetorização com TF-IDF e classificação com regressão logística. Em seguida, o modelo treinado é avaliado quanto à sua acurácia e capacidade de generalização. No entanto, mais do que prever, é essencial compreender o motivo por trás de cada decisão. Para isso, adotamos o SHAP como ferramenta de explicabilidade, permitindo identificar quais palavras ou termos mais influenciam a classificação de uma mensagem como spam ou não.
| Number of Pages | 111 |
| Edition | 1 (2025) |
| Format | A5 (148x210) |
| Binding | Paperback with Flaps |
| Paper Type | Coated Silk 90g |
| Language | Portuguese |
Do you have complaints about this book? Send an email to [email protected]
Click Login to leave your comment on the book.