垃圾邮件分类器——使用Transformer模型微调实现
实现的目标 本项目使用Transformer模型对邮件进行垃圾邮件(spam)和正常邮件(ham)的分类。 数据集来源 数据集来自 SpamAssassin公共语料库 项目结构 data_processor.py: 处理数据加载和处理 data_preprocessor.py: 为模型准备数据 model.py: 定义Transformer模型 trainer.py: 包含模型训练逻辑 evaluator.py: 评估训练好的模型 main.py: 协调整个处理过程 environment.yml: 定义Conda环境