Files
doc_ai_frontend/content/docs/zh/ocr-accuracy.md
yoge 409bbf742e feat: optimize docs pages and add 4 new doc articles (en + zh)
- Rewrote DocsListPage and DocDetailPage with landing.css aesthetic
  (icon cards, skeleton loader, prose styles, CTA box)
- Added docs-specific CSS to landing.css
- Created image-to-latex, copy-to-word, ocr-accuracy, pdf-extraction
  articles in both English and Chinese
- Updated DocsSeoSection guide cards to link to real doc slugs

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-26 16:15:22 +08:00

2.6 KiB
Raw Blame History

title, description, slug, date, tags, order
title description slug date tags order
识别准确率 了解 TexPixel 识别准确率及如何获得最佳效果 ocr-accuracy 2026-03-25
准确率
技巧
5

识别准确率

TexPixel 在数学公式识别方面达到行业领先的准确率——但准确率在不同输入类型之间并不统一。本指南解释影响准确率的因素以及如何最大化识别效果。

按公式类型的准确率

公式类型 典型准确率
印刷体公式(教材、论文) 9599%
清晰手写公式 8895%
扫描文档300 DPI+ 9398%
白板照片 8292%
低分辨率图片(< 72 DPI 6080%

这些是大致范围,实际结果在很大程度上取决于图片质量。

影响准确率的因素

图片质量

这是最重要的单一因素。模糊、低分辨率或光线不佳的图片效果始终不如清晰扫描件。

  • 分辨率 — 建议 150 DPI 或更高,文档理想为 300 DPI
  • 对比度 — 白色背景上的深色墨水为模型提供最清晰的信号
  • 清晰度 — 避免运动模糊或对焦不准

公式复杂度

简单的单行方程识别准确率接近完美。更复杂的结构可能偶有错误:

  • 多行方程组
  • 大矩阵6×6 或更大)
  • 深度嵌套分数3 层以上)
  • 非标准符号或自定义符号

手写风格

印刷体打字公式优于手写体但当以下条件满足时TexPixel 能很好地处理手写:

  • 字母清晰成形且不连笔(印刷体,而非草书)
  • 变量写成明显不同的大小(例如 x 和 × 清晰区分)
  • 符号间距一致

降低准确率的因素

  • 旋转图片 — 倾斜的公式更难解析
  • 重叠元素 — 划掉的内容、注释或符号附近的箭头
  • 纸上铅笔 — 对比度低;上传前可尝试增加图片亮度/对比度
  • 一张图片多个公式 — 裁剪到你需要的具体公式
  • 装饰字体 — 花体或风格化数学书写

提高识别效果

如果识别出错,按以下顺序尝试:

  1. 提高图片分辨率 — 用 300 DPI 扫描代替 150 DPI
  2. 改善对比度 — 使用图片编辑器提高亮度和对比度
  3. 紧密裁剪 — 去除周围文字和空白
  4. 矫正图片 — 上传前纠正旋转
  5. 重新拍摄 — 更好的光线、更近的距离、更清晰的对焦

反馈错误

发现 TexPixel 持续识别错误的公式类型?请告知我们——准确率反馈直接改进模型。

联系我们:support@texpixel.com


上传公式测试识别准确率 →