首页手记 Qwen2大模型微调入门实战（完整代码）

Qwen2大模型微调入门实战（完整代码）

标签：

杂七杂八

导言

在大模型的时代，微调技术已成为提升模型性能的关键手段。本文通过阿里云通义千问团队研发的开源大语言模型Qwen2，以指令微调方法进行文本分类任务，为文本分类任务的入门者提供了一条高效路径。我们将详细介绍如何在复旦中文新闻（zh_cls_fudan-news）数据集上进行Qwen2大模型微调，并利用SwanLab进行训练过程可视化和效果评估。通过全面的系统要求、环境配置、数据集准备、模型加载与微调，以及代码实现的详细步骤，本文旨在为读者提供一次完整的微调体验，从数据集转换到数据预处理、预测函数构建，直至实验训练与评估的实践指南。

系统要求与环境配置

系统与硬件需求

操作系统：确保Python 3.8或更高版本运行在您的系统上。
显卡与显存：推荐使用英伟达显卡，至少配备10GB显存。
必需安装的库：swanlab、modelscope、transformers、datasets、peft、accelerate和pandas。

一键安装命令

pip install swanlab modelscope transformers datasets peft pandas accelerate

选择modelscope的最新版本（modelscope1.14.0）、transformers库（4.41.2版本）、datasets（2.18.0版本）、peft（0.11.1版本）和accelerate（0.30.1版本）以确保最佳兼容性和性能。

数据集准备

数据集选择与下载

数据集：复旦中文新闻（zh_cls_fudan-news）
下载方式：通过魔搭社区下载train.jsonl和test.jsonl文件。

数据集包含：

text：文本内容
category：文本的多个可能类别
output：文本的唯一真实类别

数据集示例

{
  "text": "第四届全国大企业足球赛复赛结束新华社郑州５月３日电（实习生田兆运）上海大隆机器厂队昨天在洛阳进行的第四届牡丹杯全国大企业足球赛复赛中，以５：４力克成都冶金实验厂队，进入前四名。",
  "category": ["Sports", "Politics"],
  "output": "Sports"
}

模型加载与微调

模型选择与加载

模型：Qwen2-1.5B-Instruct
加载方式：通过modelscope下载，加载到Transformers中进行训练。

集成SwanLab与Transformers

使用SwanLab来监控训练过程和效果评估，提升训练可视化能力。

完整代码示例与实验日志

`train.py`文件结构

数据集转换函数：dataset_jsonl_transfer
数据预处理函数：process_func
预测函数：predict
实验训练代码整合与目录结构说明

`dataset_jsonl_transfer`示例代码

def dataset_jsonl_transfer(origin_path, new_path):
    messages = []
    with open(origin_path, "r") as file:
        for line in file:
            data = json.loads(line)
            text, category, output = data["text"], data["category"], data["output"]
            prompt = "你是一个文本分类领域的专家，你会接收到一段文本和几个潜在的分类选项，请输出文本内容的正确类型\n文本:{}\n类别选项:{}\n输出:".format(text, category)
            messages.append({"instruction": prompt, "input": text, "output": output})
    with open(new_path, "w") as file:
        for message in messages:
            file.write(json.dumps(message, ensure_ascii=False) + "\n")

`process_func`示例代码

def process_func(examples):
    input_ids, attention_mask, labels = [], [], []
    for example in examples:
        text = example["text"]
        instruction, input_text, output_text = example["instruction"], example["input"], example["output"]
        input_ids.append(tokenizer.encode(instruction, text, add_special_tokens=True))
        attention_mask.append([1] * len(input_ids[-1]))
        labels.append(tokenizer.encode(output_text, add_special_tokens=True))
    return {"input_ids": input_ids, "attention_mask": attention_mask, "labels": labels}

`predict`示例代码

def predict(model, tokenizer, text):
    inputs = tokenizer([text], return_tensors="pt")
    outputs = model.generate(inputs["input_ids"], max_length=100)
    return tokenizer.decode(outputs[0])

训练与评估整合代码

model = Qwen2ForCausalLM.from_pretrained("qwen/Qwen2-1.5B-Instruct")
tokenizer = AutoTokenizer.from_pretrained("qwen/Qwen2-1.5B-Instruct")
train_dataset = dataset_jsonl_transfer("train.jsonl", "new_train.jsonl")
eval_dataset = dataset_jsonl_transfer("test.jsonl", "new_test.jsonl")
data_collator = DataCollatorForSeq2Seq(tokenizer)
training_args = TrainingArguments(output_dir="./results/qwen2-finetune", evaluation_strategy="epoch")
trainer = Trainer(
    model=model,
    tokenizer=tokenizer,
    args=training_args,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    data_collator=data_collator,
    callbacks=[SwanLabCallback()],
)
trainer.train()
trainer.evaluate()

实验日志与可视化

训练可视化：通过SwanLab查看训练过程中的loss与accuracy指标。
效果评估：基于test.jsonl测试模型性能，计算准确率、F1分数等。

结果演示与推理

微调结果：利用模型预测test.jsonl中的文本分类结果，对比原始标签与预测标签，评估微调效果。
推理代码：

def inference(model, tokenizer, text):
    input_ids = tokenizer.encode("你是一个文本分类领域的专家，你会接收到一段文本和几个潜在的分类选项，请输出文本内容的正确类型\n文本:{}\n输出:".format(text), return_tensors="pt")
    outputs = model.generate(input_ids)
    return tokenizer.decode(outputs[0])

总结与展望

通过指令微调Qwen2模型并在复旦中文新闻数据集上进行训练，我们展示了微调在文本分类任务中的高效性与实用性。SwanLab的集成应用不仅增强了训练过程的可视化，还帮助我们深入理解模型的学习过程与性能表现。未来，随着大模型技术的不断发展，微调将成为构建个性化、高效率语言模型的核心手段之一，为自然语言处理领域带来更大的创新与突破。

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

繁花不似锦

手记
篇

粉丝

50

获赞与收藏

241

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 30583 343

网络编程入门教程

20个小节 12561 237

Pandas 入门教程

25个小节 18499 337

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空