title: "垃圾邮件分类器——使用Transformer模型微调实现"
date: 2024-10-05
tags:
  - pytorch
  - Transformer
categories:
  - mechine-learning
description: "记录一次完整的模型训练的过程,比较简单"
draft: false

实现的目标

本项目使用Transformer模型对邮件进行垃圾邮件(spam)和正常邮件(ham)的分类。

数据集来源

数据集来自 SpamAssassin公共语料库

项目结构

  • data_processor.py: 处理数据加载和处理
  • data_preprocessor.py: 为模型准备数据
  • model.py: 定义Transformer模型
  • trainer.py: 包含模型训练逻辑
  • evaluator.py: 评估训练好的模型
  • main.py: 协调整个处理过程
  • environment.yml: 定义Conda环境