Commit Graph

  • 14b637cd6b Update README_zh.md OleehyO 2024-03-25 16:35:34 +08:00
  • b64e119093 Update README_zh.md OleehyO 2024-03-25 16:35:34 +08:00
  • 86443d0cf7 Update README_zh.md OleehyO 2024-03-25 16:35:34 +08:00
  • c66b55638f Update README.md OleehyO 2024-03-25 16:34:46 +08:00
  • 88d2730752 Update README.md OleehyO 2024-03-25 16:34:46 +08:00
  • 3f4b3c9645 update 三洋三洋 2024-03-25 07:55:26 +00:00
  • 5e191ff0fe update 三洋三洋 2024-03-25 07:53:11 +00:00
  • 9c3bb1c22a update mp4 三洋三洋 2024-03-25 07:32:33 +00:00
  • ef218d67f6 TexTeller v2 三洋三洋 2024-03-25 06:54:22 +00:00
  • 74341c7e8a update 三洋三洋 2024-03-18 15:48:04 +00:00
  • a42df1510f 完成了TexTellerv2的训练(不支持自然场景) 三洋三洋 2024-03-13 02:21:02 +00:00
  • 93979bddf6 修复了bug:当样本中出现非常长的公式(对应的token数可能超过2048),会导致给label进行embedding时index out of range 三洋三洋 2024-03-06 13:59:36 +00:00
  • a65de1154e 完成了7M数据集tokenizer的训练 三洋三洋 2024-03-06 04:57:43 +00:00
  • 04a4bddd97 修改了functional.py中的tokenize_fn(图片以png形式而非数组的形式保存,防止占用过多硬盘空间) 三洋三洋 2024-03-04 05:38:30 +00:00
  • 2d6c46b88d 修改好了训练,加入了数据增强 三洋三洋 2024-03-04 05:35:59 +00:00
  • 38877d90b8 完成了load1) er.py, 以 2) 部分代码的loader加载路径的更改 三洋三洋 2024-03-03 15:59:15 +00:00
  • 69b10eccc7 update 三洋三洋 2024-02-12 15:16:35 +00:00
  • 5d089b5a7f update 三洋三洋 2024-03-03 12:09:14 +08:00
  • d9ee6b0d9e update 三洋三洋 2024-03-01 22:42:15 +08:00
  • 2d21d2d215 update 三洋三洋 2024-02-27 07:44:35 +00:00
  • 3527a4af47 updated API usage (supports remote calls) 三洋三洋 2024-02-27 07:13:36 +00:00
  • b4537944d0 Update README_zh.md 三洋三洋 2024-02-12 16:33:49 +00:00
  • 72a60f8611 Update README 三洋三洋 2024-02-12 16:27:58 +00:00
  • 3683623925 Update README_zh.md 三洋三洋 2024-02-12 15:02:31 +00:00
  • 94b0781d84 Update README 三洋三洋 2024-02-12 11:46:26 +00:00
  • 9bc165f955 Update files 三洋三洋 2024-02-12 11:40:51 +00:00
  • fa6bcda721 update README 三洋三洋 2024-02-12 08:44:45 +00:00
  • 6e2e45a8d6 update README 三洋三洋 2024-02-12 08:41:33 +00:00
  • b4962bfa98 Initial commit 三洋三洋 2024-02-11 10:44:42 +00:00
  • f057490bdb Initial commit 三洋三洋 2024-02-11 08:06:50 +00:00
  • 04b99b8451 完成了web,ray server,重构了代码 三洋三洋 2024-02-08 13:48:34 +00:00
  • 07c4c3dc01 完成了训练 三洋三洋 2024-02-07 12:18:23 +00:00
  • b5dbf64716 把代码修改成了接受输入为png的图片 三洋三洋 2024-02-03 09:40:13 +00:00
  • 274fd6cdda 加入了输入图片的最小宽和高的过滤,防止注入垃圾数据 三洋三洋 2024-02-02 05:40:26 +00:00
  • ab1a05bf32 完成了所有代码 三洋三洋 2024-01-31 15:27:35 +00:00
  • ebac28a90d tmp commit 三洋三洋 2024-01-31 10:20:27 +00:00
  • 1fba652766 Initial Commit 三洋三洋 2024-01-31 10:11:07 +00:00
  • b7bf5c444f 加入和推理和评估的代码 三洋三洋 2024-01-30 08:36:23 +00:00
  • e03b877ed1 Merge branch 'add_ocr_model' 三洋三洋 2024-01-28 14:04:52 +00:00
  • 14125da26f 1) 加入了推理代码; 2) 整理了其他代码 三洋三洋 2024-01-28 14:03:42 +00:00
  • c6d5c91955 写完了模型代码、Tokenizer、数据预处理、训练脚本,但目前的训练脚本没有配置generate(评估仅能看loss) 三洋三洋 2024-01-28 06:19:23 +00:00
  • 0f619b1812 删除了resiezer中inference.py里面无用的代码 三洋三洋 2024-01-23 06:07:09 +00:00
  • 9d27ee0585 写好了ocr_model训练脚本的大致框架 三洋三洋 2024-01-23 04:23:08 +00:00
  • 703ac7441c 加入了web.py,但是server还没实现 三洋三洋 2024-01-22 09:42:20 +00:00
  • 126026cb48 Initial commit 三洋三洋 2024-01-15 05:48:36 +00:00