title: "垃圾邮件分类器——使用Transformer模型微调实现"
date: 2024-10-05
tags:
- pytorch
- Transformer
categories:
- mechine-learning
description: "记录一次完整的模型训练的过程,比较简单"
draft: false
实现的目标
本项目使用Transformer模型对邮件进行垃圾邮件(spam)和正常邮件(ham)的分类。
数据集来源
数据集来自 SpamAssassin公共语料库
项目结构
data_processor.py
: 处理数据加载和处理data_preprocessor.py
: 为模型准备数据model.py
: 定义Transformer模型trainer.py
: 包含模型训练逻辑evaluator.py
: 评估训练好的模型main.py
: 协调整个处理过程environment.yml
: 定义Conda环境