src/inference.py

import os
import argparse
import cv2 as cv

from pathlib import Path
from utils import to_katex
from models.ocr_model.utils.inference import inference as latex_inference
from models.ocr_model.model.TexTeller import TexTeller


if __name__ == '__main__':
    os.chdir(Path(__file__).resolve().parent)
    parser = argparse.ArgumentParser()
    parser.add_argument(
        '-img', 
        type=str, 
        required=True,
        help='path to the input image'
    )
    parser.add_argument(
        '--inference-mode', 
        type=str,
        default='cpu',
        help='Inference mode, select one of cpu, cuda, or mps'
    )
    parser.add_argument(
        '--num-beam', 
        type=int,
        default=1,
        help='number of beam search for decoding'
    )
    # =================  new feature  ==================
    parser.add_argument(
        '-mix', 
        type=str,
        help='use mix mode, only Chinese and English are supported.'
    )
    # ==================================================

    args = parser.parse_args()

    # You can use your own checkpoint and tokenizer path.
    print('Loading model and tokenizer...')
    latex_rec_model = TexTeller.from_pretrained()
    latex_rec_model = TexTeller.from_pretrained()
    tokenizer = TexTeller.get_tokenizer()
    print('Model and tokenizer loaded.')

    # img_path = [args.img]
    img = cv.imread(args.img)
    print('Inference...')
    if not args.mix:
        res = latex_inference(latex_rec_model, tokenizer, [img], args.inference_mode, args.num_beam)
        res = to_katex(res[0])
        print(res)
    else:
        # latex_det_model = load_det_tex_model()
        # lang_model      = load_lang_models()...
        ...
        # res: str = mix_inference(latex_det_model, latex_rec_model, lang_model, img, args.cuda)
        # print(res)
Initial commit 2024-02-11 08:06:50 +00:00			`import os`
			`import argparse`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`import cv2 as cv`
Initial commit 2024-02-11 08:06:50 +00:00
			`from pathlib import Path`
inference.py支持katex语法 2024-04-06 10:09:15 +00:00			`from utils import to_katex`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`from models.ocr_model.utils.inference import inference as latex_inference`
Initial commit 2024-02-11 08:06:50 +00:00			`from models.ocr_model.model.TexTeller import TexTeller`


			`if __name__ == '__main__':`
			`os.chdir(Path(__file__).resolve().parent)`
			`parser = argparse.ArgumentParser()`
			`parser.add_argument(`
			`'-img',`
			`type=str,`
			`required=True,`
			`help='path to the input image'`
			`)`
			`parser.add_argument(`
前端更新, inference.py更新 1) 前端支持剪贴板粘贴图片. 2) 前端支持模型配置. 3) 修改了inference.py的接口. 4) 删除了不必要的文件 2024-04-17 09:12:07 +00:00			`'--inference-mode',`
			`type=str,`
			`default='cpu',`
			`help='Inference mode, select one of cpu, cuda, or mps'`
			`)`
			`parser.add_argument(`
			`'--num-beam',`
			`type=int,`
			`default=1,`
			`help='number of beam search for decoding'`
Initial commit 2024-02-11 08:06:50 +00:00			`)`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`# ================= new feature ==================`
			`parser.add_argument(`
			`'-mix',`
			`type=str,`
			`help='use mix mode, only Chinese and English are supported.'`
			`)`
			`# ==================================================`
Initial commit 2024-02-11 08:06:50 +00:00
			`args = parser.parse_args()`

			`# You can use your own checkpoint and tokenizer path.`
			`print('Loading model and tokenizer...')`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`latex_rec_model = TexTeller.from_pretrained()`
Merge branch 'pre_release' into dev 2024-04-17 10:30:09 +00:00			`latex_rec_model = TexTeller.from_pretrained()`
Initial commit 2024-02-11 08:06:50 +00:00			`tokenizer = TexTeller.get_tokenizer()`
			`print('Model and tokenizer loaded.')`

修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`# img_path = [args.img]`
			`img = cv.imread(args.img)`
Initial commit 2024-02-11 08:06:50 +00:00			`print('Inference...')`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`if not args.mix:`
Merge branch 'pre_release' into dev 2024-04-17 10:30:09 +00:00			`res = latex_inference(latex_rec_model, tokenizer, [img], args.inference_mode, args.num_beam)`
inference.py支持katex语法 2024-04-06 10:09:15 +00:00			`res = to_katex(res[0])`
			`print(res)`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`else:`
			`# latex_det_model = load_det_tex_model()`
			`# lang_model = load_lang_models()...`
			`...`
			`# res: str = mix_inference(latex_det_model, latex_rec_model, lang_model, img, args.cuda)`
			`# print(res)`