加入和推理和评估的代码

2024-01-30 08:36:23 +00:00
parent e03b877ed1
commit b7bf5c444f
12 changed files with 485 additions and 135 deletions
--- a/src/models/ocr_model/utils/metrics.py
+++ b/src/models/ocr_model/utils/metrics.py
@@ -0,0 +1,17 @@
+import evaluate
+import numpy as np
+from transformers import EvalPrediction, RobertaTokenizer
+from typing import Dict
+
+def bleu_metric(eval_preds:EvalPrediction, tokenizer:RobertaTokenizer) -> Dict:
+    metric = evaluate.load('/home/lhy/code/TeXify/src/models/ocr_model/train/google_bleu/google_bleu.py')  # 这里需要联网，所以会卡住
+    
+    logits, labels = eval_preds.predictions, eval_preds.label_ids
+    preds = logits
+    # preds = np.argmax(logits, axis=1)  # 把logits转成对应的预测标签
+
+    labels = np.where(labels == -100, 1, labels)
+
+    preds = tokenizer.batch_decode(preds, skip_special_tokens=True)
+    labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
+    return metric.compute(predictions=preds, references=labels)