垃圾邮件分类器——使用Transformer模型微调实现

记录一次完整的模型训练的过程，比较简单

October 5, 2024 · 1 min · 20 words · sirius1y

实现的目标

本项目使用Transformer模型对邮件进行垃圾邮件（spam）和正常邮件（ham）的分类。

数据集来源

数据集来自 SpamAssassin公共语料库

项目结构

data_processor.py: 处理数据加载和处理
data_preprocessor.py: 为模型准备数据
model.py: 定义Transformer模型
trainer.py: 包含模型训练逻辑
evaluator.py: 评估训练好的模型
main.py: 协调整个处理过程
environment.yml: 定义Conda环境