Commit Graph

71 Commits

Author SHA1 Message Date
TonyLee1256
48043d11e3 Update infer_det.py
增加使用gpu进行onnx模型推理的功能
2024-05-09 00:19:39 +08:00
三洋三洋
e495640690 bugfix 2024-05-08 14:34:01 +00:00
三洋三洋
84fa43321f Added Language option in mixed mode 2024-05-07 07:44:24 +00:00
三洋三洋
85b22ff9c7 bugfix 2024-05-07 07:11:34 +00:00
三洋三洋
42959cd6a5 Add train_config.yaml 2024-05-07 07:11:05 +00:00
TonyLee1256
d2c1e5e10f bugfix inference.py 2024-05-07 13:28:07 +08:00
TonyLee1256
8c85575260 bugfix inference.py 2024-05-07 13:19:43 +08:00
TonyLee1256
1a7939190f Update rec_infer_from_crop_imgs.py 2024-04-22 00:08:36 +08:00
TonyLee1256
0bb11bebfc Update infer_det.py 2024-04-22 00:07:41 +08:00
三洋三洋
188ab88e07 Merge branch 'dev' into pre_release 2024-04-21 13:14:49 +00:00
三洋三洋
5cbbfb38d6 1) 修复了to_katex.py的bug; 2)把Box.py中的转化结果写在logs 2024-04-21 12:09:26 +00:00
三洋三洋
11df230200 merge dev后调整了项目结构 2024-04-21 00:48:24 +08:00
三洋三洋
e6dca76123 merge dev后删除了resizer 2024-04-21 00:13:21 +08:00
三洋三洋
185b2e3db6 1) 实现了文本-公式混排识别; 2) 重构了项目结构 2024-04-21 00:05:14 +08:00
三洋三洋
eab6e4c85d update infer_det.py 2024-04-18 00:06:05 +08:00
三洋三洋
48f778eeda 为了支持mixed inference, 重构了目录 2024-04-17 15:24:06 +00:00
三洋三洋
7883d3c07f 修复了merge pre_release分支后导致参数名不一致的bug 2024-04-17 14:47:58 +00:00
三洋三洋
a064b7dbb0 Merge branch 'pre_release' into dev 2024-04-17 10:32:22 +00:00
三洋三洋
f81a31a8c9 checkpoint 2024-04-17 10:20:15 +00:00
三洋三洋
3cebc2eb2a 前端更新, inference.py更新
1) 前端支持剪贴板粘贴图片.
2) 前端支持模型配置.
3) 修改了inference.py的接口.
4) 删除了不必要的文件
2024-04-17 09:36:40 +00:00
三洋三洋
7d1d8ddd77 work in progress 2024-04-12 03:20:04 +00:00
TonyLee1256
9e8ac666b0 新增公式检测模块 2024-04-11 16:44:19 +00:00
三洋三洋
1538cb73f8 修改了transforms.py中inference_transform的bug: 在训练的eval阶段没有把png图片转化为np.ndarray 2024-04-11 07:04:58 +00:00
三洋三洋
762012be1f 优化了transform.py中的trim_white_border 2024-04-10 16:09:13 +00:00
三洋三洋
1589fb3217 增加了数据增强的概率 2024-04-09 13:50:35 +00:00
三洋三洋
1db514bdbf inference.py支持katex语法 2024-04-06 12:06:08 +00:00
三洋三洋
840be6b843 update README.md 2024-04-06 11:57:50 +00:00
三洋三洋
93fc22adf5 inference.py支持katex 2024-04-06 11:38:59 +00:00
三洋三洋
ecd5481bea web demo支持katex, 不再需要本地安装xelatex渲染器 2024-04-06 07:28:46 +00:00
三洋三洋
b5f7166e58 web demo加入了katex支持, 不再需要本地安装xelatex渲染器 2024-04-06 07:18:40 +00:00
三洋三洋
c9c15d27bd inference_transform bugfix 2024-04-06 05:09:50 +00:00
三洋三洋
70dce92e19 Merge remote-tracking branch 'origin/dev' into dev 2024-04-05 07:52:40 +00:00
三洋三洋
e16f46e856 修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版 2024-04-05 07:27:07 +00:00
三洋三洋
5a259065a4 merge v3_nature_scence 2024-03-28 14:33:25 +00:00
三洋三洋
e8967dce0f 写好了v3版本的训练代码(v3版本加入了自然场景训练增强) 2024-03-28 12:54:00 +00:00
三洋三洋
fb2ab8230d 初步修改完成,但仍然有问题 2024-03-27 06:47:40 +00:00
三洋三洋
dbf35fe9c4 初步修改完成,但仍然有问题 2024-03-27 04:54:49 +00:00
三洋三洋
6373e19132 merge v2 2024-03-26 08:16:28 +00:00
三洋三洋
b293026f5e 数据增强加入了是否只针对扫描件的选项 2024-03-26 07:37:48 +00:00
三洋三洋
63b8e04dab TexTellerv2 release 2024-03-25 13:22:11 +00:00
三洋三洋
ef7cccff03 TexTellerv2 2024-03-25 11:46:43 +00:00
OleehyO
14b637cd6b Update README_zh.md 2024-03-25 16:35:34 +08:00
三洋三洋
ef218d67f6 TexTeller v2 2024-03-25 07:11:10 +00:00
三洋三洋
74341c7e8a update 2024-03-19 14:43:03 +00:00
三洋三洋
a42df1510f 完成了TexTellerv2的训练(不支持自然场景) 2024-03-13 02:21:02 +00:00
三洋三洋
93979bddf6 修复了bug:当样本中出现非常长的公式(对应的token数可能超过2048),会导致给label进行embedding时index out of range 2024-03-06 13:59:36 +00:00
三洋三洋
a65de1154e 完成了7M数据集tokenizer的训练 2024-03-06 04:57:43 +00:00
三洋三洋
04a4bddd97 修改了functional.py中的tokenize_fn(图片以png形式而非数组的形式保存,防止占用过多硬盘空间) 2024-03-04 05:38:30 +00:00
三洋三洋
2d6c46b88d 修改好了训练,加入了数据增强 2024-03-04 05:35:59 +00:00
三洋三洋
38877d90b8 完成了load1) er.py, 以 2) 部分代码的loader加载路径的更改 2024-03-03 15:59:15 +00:00