三洋三洋
|
eab6e4c85d
|
update infer_det.py
|
2024-04-18 00:06:05 +08:00 |
|
三洋三洋
|
48f778eeda
|
为了支持mixed inference, 重构了目录
|
2024-04-17 15:24:06 +00:00 |
|
三洋三洋
|
7883d3c07f
|
修复了merge pre_release分支后导致参数名不一致的bug
|
2024-04-17 14:47:58 +00:00 |
|
三洋三洋
|
a064b7dbb0
|
Merge branch 'pre_release' into dev
|
2024-04-17 10:32:22 +00:00 |
|
三洋三洋
|
f81a31a8c9
|
checkpoint
|
2024-04-17 10:20:15 +00:00 |
|
三洋三洋
|
ec3e744376
|
update README.md
|
2024-04-17 10:08:46 +00:00 |
|
三洋三洋
|
3cebc2eb2a
|
前端更新, inference.py更新
1) 前端支持剪贴板粘贴图片.
2) 前端支持模型配置.
3) 修改了inference.py的接口.
4) 删除了不必要的文件
|
2024-04-17 09:36:40 +00:00 |
|
三洋三洋
|
66d4902871
|
add contributor
|
2024-04-12 07:29:36 +00:00 |
|
三洋三洋
|
78d29d49ef
|
update README
|
2024-04-12 06:16:37 +00:00 |
|
三洋三洋
|
7d1d8ddd77
|
work in progress
|
2024-04-12 03:20:04 +00:00 |
|
OleehyO
|
9e8b15ef3a
|
Merge pull request #14 from TonyLee1256/pre_release
新增公式检测模块
|
2024-04-12 00:46:45 +08:00 |
|
TonyLee1256
|
9e8ac666b0
|
新增公式检测模块
|
2024-04-11 16:44:19 +00:00 |
|
三洋三洋
|
1538cb73f8
|
修改了transforms.py中inference_transform的bug: 在训练的eval阶段没有把png图片转化为np.ndarray
|
2024-04-11 07:04:58 +00:00 |
|
三洋三洋
|
762012be1f
|
优化了transform.py中的trim_white_border
|
2024-04-10 16:09:13 +00:00 |
|
三洋三洋
|
1589fb3217
|
增加了数据增强的概率
|
2024-04-09 13:50:35 +00:00 |
|
三洋三洋
|
1db514bdbf
|
inference.py支持katex语法
|
2024-04-06 12:06:08 +00:00 |
|
三洋三洋
|
840be6b843
|
update README.md
|
2024-04-06 11:57:50 +00:00 |
|
三洋三洋
|
93fc22adf5
|
inference.py支持katex
|
2024-04-06 11:38:59 +00:00 |
|
三洋三洋
|
8d6d889efa
|
update README.md
|
2024-04-06 07:43:03 +00:00 |
|
三洋三洋
|
ecd5481bea
|
web demo支持katex, 不再需要本地安装xelatex渲染器
|
2024-04-06 07:28:46 +00:00 |
|
三洋三洋
|
b5f7166e58
|
web demo加入了katex支持, 不再需要本地安装xelatex渲染器
|
2024-04-06 07:18:40 +00:00 |
|
三洋三洋
|
c9c15d27bd
|
inference_transform bugfix
|
2024-04-06 05:09:50 +00:00 |
|
三洋三洋
|
87ddb86e5e
|
完成了v3版本:加入自然场景的数据增强
|
2024-04-05 08:11:06 +00:00 |
|
三洋三洋
|
a4e878da96
|
Merge remote-tracking branch 'origin/dev' into dev
|
2024-04-05 08:00:11 +00:00 |
|
三洋三洋
|
70dce92e19
|
Merge remote-tracking branch 'origin/dev' into dev
|
2024-04-05 07:52:40 +00:00 |
|
三洋三洋
|
e16f46e856
|
修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版
|
2024-04-05 07:27:07 +00:00 |
|
三洋三洋
|
67426c439f
|
update README.md
|
2024-04-05 05:19:27 +00:00 |
|
三洋三洋
|
d2090c0d61
|
Merge remote-tracking branch 'origin/dev' into dev
|
2024-03-28 14:33:46 +00:00 |
|
三洋三洋
|
5a259065a4
|
merge v3_nature_scence
|
2024-03-28 14:33:25 +00:00 |
|
三洋三洋
|
8d94611aba
|
merge v3_nature_scence
|
2024-03-28 14:22:23 +00:00 |
|
三洋三洋
|
a6a5d07430
|
Merge remote-tracking branch 'origin/dev' into dev
|
2024-03-28 13:28:47 +00:00 |
|
三洋三洋
|
e8967dce0f
|
写好了v3版本的训练代码(v3版本加入了自然场景训练增强)
|
2024-03-28 12:54:00 +00:00 |
|
三洋三洋
|
fb2ab8230d
|
初步修改完成,但仍然有问题
|
2024-03-27 06:47:40 +00:00 |
|
三洋三洋
|
dbf35fe9c4
|
初步修改完成,但仍然有问题
|
2024-03-27 04:54:49 +00:00 |
|
三洋三洋
|
6373e19132
|
merge v2
|
2024-03-26 08:16:28 +00:00 |
|
三洋三洋
|
b293026f5e
|
数据增强加入了是否只针对扫描件的选项
|
2024-03-26 07:37:48 +00:00 |
|
三洋三洋
|
63b8e04dab
|
TexTellerv2 release
|
2024-03-25 13:22:11 +00:00 |
|
三洋三洋
|
ef7cccff03
|
TexTellerv2
|
2024-03-25 11:46:43 +00:00 |
|
OleehyO
|
14b637cd6b
|
Update README_zh.md
|
2024-03-25 16:35:34 +08:00 |
|
OleehyO
|
86443d0cf7
|
Update README_zh.md
|
2024-03-25 16:35:34 +08:00 |
|
OleehyO
|
88d2730752
|
Update README.md
|
2024-03-25 16:34:46 +08:00 |
|
三洋三洋
|
3f4b3c9645
|
update
|
2024-03-25 08:32:17 +00:00 |
|
三洋三洋
|
5e191ff0fe
|
update
|
2024-03-25 07:53:11 +00:00 |
|
三洋三洋
|
9c3bb1c22a
|
update mp4
|
2024-03-25 07:32:33 +00:00 |
|
三洋三洋
|
ef218d67f6
|
TexTeller v2
|
2024-03-25 07:11:10 +00:00 |
|
三洋三洋
|
74341c7e8a
|
update
|
2024-03-19 14:43:03 +00:00 |
|
三洋三洋
|
a42df1510f
|
完成了TexTellerv2的训练(不支持自然场景)
|
2024-03-13 02:21:02 +00:00 |
|
三洋三洋
|
93979bddf6
|
修复了bug:当样本中出现非常长的公式(对应的token数可能超过2048),会导致给label进行embedding时index out of range
|
2024-03-06 13:59:36 +00:00 |
|
三洋三洋
|
a65de1154e
|
完成了7M数据集tokenizer的训练
|
2024-03-06 04:57:43 +00:00 |
|
三洋三洋
|
04a4bddd97
|
修改了functional.py中的tokenize_fn(图片以png形式而非数组的形式保存,防止占用过多硬盘空间)
|
2024-03-04 05:38:30 +00:00 |
|