TexTeller

Author	SHA1	Message	Date
三洋三洋	eab6e4c85d	update infer_det.py	2024-04-18 00:06:05 +08:00
三洋三洋	48f778eeda	为了支持mixed inference, 重构了目录	2024-04-17 15:24:06 +00:00
三洋三洋	7883d3c07f	修复了merge pre_release分支后导致参数名不一致的bug	2024-04-17 14:47:58 +00:00
三洋三洋	a064b7dbb0	Merge branch 'pre_release' into dev	2024-04-17 10:32:22 +00:00
三洋三洋	f81a31a8c9	checkpoint	2024-04-17 10:20:15 +00:00
三洋三洋	ec3e744376	update README.md	2024-04-17 10:08:46 +00:00
三洋三洋	3cebc2eb2a	前端更新, inference.py更新 1) 前端支持剪贴板粘贴图片. 2) 前端支持模型配置. 3) 修改了inference.py的接口. 4) 删除了不必要的文件	2024-04-17 09:36:40 +00:00
三洋三洋	66d4902871	add contributor	2024-04-12 07:29:36 +00:00
三洋三洋	78d29d49ef	update README	2024-04-12 06:16:37 +00:00
三洋三洋	7d1d8ddd77	work in progress	2024-04-12 03:20:04 +00:00
OleehyO	9e8b15ef3a	Merge pull request #14 from TonyLee1256/pre_release 新增公式检测模块	2024-04-12 00:46:45 +08:00
TonyLee1256	9e8ac666b0	新增公式检测模块	2024-04-11 16:44:19 +00:00
三洋三洋	1538cb73f8	修改了transforms.py中inference_transform的bug: 在训练的eval阶段没有把png图片转化为np.ndarray	2024-04-11 07:04:58 +00:00
三洋三洋	762012be1f	优化了transform.py中的trim_white_border	2024-04-10 16:09:13 +00:00
三洋三洋	1589fb3217	增加了数据增强的概率	2024-04-09 13:50:35 +00:00
三洋三洋	1db514bdbf	inference.py支持katex语法	2024-04-06 12:06:08 +00:00
三洋三洋	840be6b843	update README.md	2024-04-06 11:57:50 +00:00
三洋三洋	93fc22adf5	inference.py支持katex	2024-04-06 11:38:59 +00:00
三洋三洋	8d6d889efa	update README.md	2024-04-06 07:43:03 +00:00
三洋三洋	ecd5481bea	web demo支持katex, 不再需要本地安装xelatex渲染器	2024-04-06 07:28:46 +00:00
三洋三洋	b5f7166e58	web demo加入了katex支持, 不再需要本地安装xelatex渲染器	2024-04-06 07:18:40 +00:00
三洋三洋	c9c15d27bd	inference_transform bugfix	2024-04-06 05:09:50 +00:00
三洋三洋	87ddb86e5e	完成了v3版本：加入自然场景的数据增强	2024-04-05 08:11:06 +00:00
三洋三洋	a4e878da96	Merge remote-tracking branch 'origin/dev' into dev	2024-04-05 08:00:11 +00:00
三洋三洋	70dce92e19	Merge remote-tracking branch 'origin/dev' into dev	2024-04-05 07:52:40 +00:00
三洋三洋	e16f46e856	修改了v3(支持自然场景、混合文字场景识别)版本的inference.py模版	2024-04-05 07:27:07 +00:00
三洋三洋	67426c439f	update README.md	2024-04-05 05:19:27 +00:00
三洋三洋	d2090c0d61	Merge remote-tracking branch 'origin/dev' into dev	2024-03-28 14:33:46 +00:00
三洋三洋	5a259065a4	merge v3_nature_scence	2024-03-28 14:33:25 +00:00
三洋三洋	8d94611aba	merge v3_nature_scence	2024-03-28 14:22:23 +00:00
三洋三洋	a6a5d07430	Merge remote-tracking branch 'origin/dev' into dev	2024-03-28 13:28:47 +00:00
三洋三洋	e8967dce0f	写好了v3版本的训练代码(v3版本加入了自然场景训练增强)	2024-03-28 12:54:00 +00:00
三洋三洋	fb2ab8230d	初步修改完成，但仍然有问题	2024-03-27 06:47:40 +00:00
三洋三洋	dbf35fe9c4	初步修改完成，但仍然有问题	2024-03-27 04:54:49 +00:00
三洋三洋	6373e19132	merge v2	2024-03-26 08:16:28 +00:00
三洋三洋	b293026f5e	数据增强加入了是否只针对扫描件的选项	2024-03-26 07:37:48 +00:00
三洋三洋	63b8e04dab	TexTellerv2 release	2024-03-25 13:22:11 +00:00
三洋三洋	ef7cccff03	TexTellerv2	2024-03-25 11:46:43 +00:00
OleehyO	14b637cd6b	Update README_zh.md	2024-03-25 16:35:34 +08:00
OleehyO	86443d0cf7	Update README_zh.md	2024-03-25 16:35:34 +08:00
OleehyO	88d2730752	Update README.md	2024-03-25 16:34:46 +08:00
三洋三洋	3f4b3c9645	update	2024-03-25 08:32:17 +00:00
三洋三洋	5e191ff0fe	update	2024-03-25 07:53:11 +00:00
三洋三洋	9c3bb1c22a	update mp4	2024-03-25 07:32:33 +00:00
三洋三洋	ef218d67f6	TexTeller v2	2024-03-25 07:11:10 +00:00
三洋三洋	74341c7e8a	update	2024-03-19 14:43:03 +00:00
三洋三洋	a42df1510f	完成了TexTellerv2的训练（不支持自然场景）	2024-03-13 02:21:02 +00:00
三洋三洋	93979bddf6	修复了bug：当样本中出现非常长的公式(对应的token数可能超过2048)，会导致给label进行embedding时index out of range	2024-03-06 13:59:36 +00:00
三洋三洋	a65de1154e	完成了7M数据集tokenizer的训练	2024-03-06 04:57:43 +00:00
三洋三洋	04a4bddd97	修改了functional.py中的tokenize_fn(图片以png形式而非数组的形式保存，防止占用过多硬盘空间)	2024-03-04 05:38:30 +00:00

1 2

81 Commits