Update README

This commit is contained in:
三洋三洋
2024-05-07 07:28:16 +00:00
parent ff1872d067
commit ec90b2fdb9
2 changed files with 12 additions and 8 deletions

View File

@@ -198,11 +198,13 @@ python server.py
### 训练模型
要想训练模型, 你需要在 `TexTeller/src`目录下运行以下命令:
1. 修改`src/train_config.yaml`中的`num_processes`为训练用的显卡数(默认为1)
```bash
python -m models.ocr_model.train.train
```
2. 在`TexTeller/src`目录下运行以下命令:
```bash
accelerate launch --config_file ./train_config.yaml -m models.ocr_model.train.train
```
你可以在 `TexTeller/src/models/ocr_model/train/train.py`中设置自己的tokenizer和checkpoint路径请参考 `train.py`。如果你使用了与TexTeller一样的架构和相同的字典你还可以用自己的数据集来微调TexTeller的默认权重。