介绍本文章主要记录Git基本知识,内容包括:
Git的基本配置
暂存和提交
分支和合并
rebase用法
远程库的操作
子模块的用法
Git的基础用法Git的基础配置创建一个本地Git版本库,可以使用以下命令:
12git init 让当前文件夹变成 git 仓库(创建 .git 文件夹)git init folder 创建一个名为"folder"新的文件夹并初始化为 git 仓库
进行Git账号配置,若添加global的话则是本地创建的所有版本库都会遵循这个配置,若想单独配置则需要在项目文件夹里输入同时不加--global。
12git config --global user.name "你的用户名"git config --global user.email "你的邮箱"
可以用以下命令查看配置:
1git config --list
Git的暂存首先对文件夹内进行修改,比如在文件夹中加入file.txt文件,并且里面写入一些内容,随后可以使用以下命令加入到暂存区:
123git add file.txt或者git ...
介绍在本教程中,记录使用Huggingface Transformers库在自己选择的数据集上对BERT(和其他 Transformer 模型)进行文本分类微调的示例。原文本文采用的微调数据集为The 20 newsgroups text dataset.
微调与预训练的区别
预训练(Pre-training):代码中从零开始训练一个BERT模型,使用的是cc_news数据集,并进行了掩码语言模型(MLM)的训练任务。这属于预训练,因为是在通用数据集上训练模型,以学习语言的基本表示。
微调(Fine-tuning):如果使用一个已经预训练好的BERT模型,然后在特定任务的数据集(例如文本分类、命名实体识别等)上进行进一步的训练,这就是微调。微调通常是在预训练的基础上进行的,目标是让模型适应特定的下游任务。
模型训练代码导入必要的库12345678import torch from transformers.file_utils import is_tf_available, is_torch_availablefrom transformers import BertTokenize ...