src/models/ocr_model/utils/inference.py

import torch
import numpy as np

from transformers import RobertaTokenizerFast, GenerationConfig
from typing import List, Union

from models.ocr_model.model.TexTeller import TexTeller
from models.ocr_model.utils.transforms import inference_transform
from models.ocr_model.utils.helpers import convert2rgb
from models.globals import MAX_TOKEN_SIZE


def inference(
    model: TexTeller, 
    tokenizer: RobertaTokenizerFast,
    imgs: Union[List[str], List[np.ndarray]], 
    inf_mode: str = 'cpu',
    num_beams: int = 1,
) -> List[str]:
    model.eval()
    if isinstance(imgs[0], str):
        imgs = convert2rgb(imgs) 
    else:  # already numpy array(rgb format)
        assert isinstance(imgs[0], np.ndarray)
        imgs = imgs 
    imgs = inference_transform(imgs)
    pixel_values = torch.stack(imgs)

    model = model.to(inf_mode)
    pixel_values = pixel_values.to(inf_mode)

    generate_config = GenerationConfig(
        max_new_tokens=MAX_TOKEN_SIZE,
        num_beams=num_beams,
        do_sample=False,
        pad_token_id=tokenizer.pad_token_id,
        eos_token_id=tokenizer.eos_token_id,
        bos_token_id=tokenizer.bos_token_id,
    )
    pred = model.generate(pixel_values, generation_config=generate_config)
    res = tokenizer.batch_decode(pred, skip_special_tokens=True)
    return res
Initial commit 2024-02-11 08:06:50 +00:00			`import torch`
updated API usage (supports remote calls) 2024-02-27 07:13:36 +00:00			`import numpy as np`
Initial commit 2024-02-11 08:06:50 +00:00
			`from transformers import RobertaTokenizerFast, GenerationConfig`
updated API usage (supports remote calls) 2024-02-27 07:13:36 +00:00			`from typing import List, Union`
Initial commit 2024-02-11 08:06:50 +00:00
			`from models.ocr_model.model.TexTeller import TexTeller`
			`from models.ocr_model.utils.transforms import inference_transform`
			`from models.ocr_model.utils.helpers import convert2rgb`
			`from models.globals import MAX_TOKEN_SIZE`


			`def inference(`
			`model: TexTeller,`
			`tokenizer: RobertaTokenizerFast,`
修复了merge pre_release分支后导致参数名不一致的bug 2024-04-17 14:47:58 +00:00			`imgs: Union[List[str], List[np.ndarray]],`
前端更新, inference.py更新 1) 前端支持剪贴板粘贴图片. 2) 前端支持模型配置. 3) 修改了inference.py的接口. 4) 删除了不必要的文件 2024-04-17 09:12:07 +00:00			`inf_mode: str = 'cpu',`
Initial commit 2024-02-11 08:06:50 +00:00			`num_beams: int = 1,`
			`) -> List[str]:`
			`model.eval()`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`if isinstance(imgs[0], str):`
			`imgs = convert2rgb(imgs)`
updated API usage (supports remote calls) 2024-02-27 07:13:36 +00:00			`else: # already numpy array(rgb format)`
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:25:06 +00:00			`assert isinstance(imgs[0], np.ndarray)`
			`imgs = imgs`
Initial commit 2024-02-11 08:06:50 +00:00			`imgs = inference_transform(imgs)`
			`pixel_values = torch.stack(imgs)`

前端更新, inference.py更新 1) 前端支持剪贴板粘贴图片. 2) 前端支持模型配置. 3) 修改了inference.py的接口. 4) 删除了不必要的文件 2024-04-17 09:12:07 +00:00			`model = model.to(inf_mode)`
			`pixel_values = pixel_values.to(inf_mode)`
Initial commit 2024-02-11 08:06:50 +00:00
			`generate_config = GenerationConfig(`
			`max_new_tokens=MAX_TOKEN_SIZE,`
			`num_beams=num_beams,`
			`do_sample=False,`
			`pad_token_id=tokenizer.pad_token_id,`
			`eos_token_id=tokenizer.eos_token_id,`
			`bos_token_id=tokenizer.bos_token_id,`
			`)`
			`pred = model.generate(pixel_values, generation_config=generate_config)`
			`res = tokenizer.batch_decode(pred, skip_special_tokens=True)`
			`return res`