实现的目标
本项目使用Transformer模型对邮件进行垃圾邮件(spam)和正常邮件(ham)的分类。
数据集来源
数据集来自 SpamAssassin公共语料库
项目结构
data_processor.py
: 处理数据加载和处理data_preprocessor.py
: 为模型准备数据model.py
: 定义Transformer模型trainer.py
: 包含模型训练逻辑evaluator.py
: 评估训练好的模型main.py
: 协调整个处理过程environment.yml
: 定义Conda环境