Files
doc_ai_frontend/content/docs/zh/ocr-accuracy.md

80 lines
2.6 KiB
Markdown
Raw Normal View History

---
title: 识别准确率
description: 了解 TexPixel 识别准确率及如何获得最佳效果
slug: ocr-accuracy
date: 2026-03-25
tags: [准确率, 技巧]
order: 5
---
# 识别准确率
TexPixel 在数学公式识别方面达到行业领先的准确率——但准确率在不同输入类型之间并不统一。本指南解释影响准确率的因素以及如何最大化识别效果。
## 按公式类型的准确率
| 公式类型 | 典型准确率 |
|---|---|
| 印刷体公式(教材、论文) | 9599% |
| 清晰手写公式 | 8895% |
| 扫描文档300 DPI+ | 9398% |
| 白板照片 | 8292% |
| 低分辨率图片(< 72 DPI | 6080% |
这些是大致范围,实际结果在很大程度上取决于图片质量。
## 影响准确率的因素
### 图片质量
这是最重要的单一因素。模糊、低分辨率或光线不佳的图片效果始终不如清晰扫描件。
- **分辨率** — 建议 150 DPI 或更高,文档理想为 300 DPI
- **对比度** — 白色背景上的深色墨水为模型提供最清晰的信号
- **清晰度** — 避免运动模糊或对焦不准
### 公式复杂度
简单的单行方程识别准确率接近完美。更复杂的结构可能偶有错误:
- 多行方程组
- 大矩阵6×6 或更大)
- 深度嵌套分数3 层以上)
- 非标准符号或自定义符号
### 手写风格
印刷体打字公式优于手写体但当以下条件满足时TexPixel 能很好地处理手写:
- 字母清晰成形且不连笔(印刷体,而非草书)
- 变量写成明显不同的大小(例如 x 和 × 清晰区分)
- 符号间距一致
### 降低准确率的因素
- **旋转图片** — 倾斜的公式更难解析
- **重叠元素** — 划掉的内容、注释或符号附近的箭头
- **纸上铅笔** — 对比度低;上传前可尝试增加图片亮度/对比度
- **一张图片多个公式** — 裁剪到你需要的具体公式
- **装饰字体** — 花体或风格化数学书写
## 提高识别效果
如果识别出错,按以下顺序尝试:
1. **提高图片分辨率** — 用 300 DPI 扫描代替 150 DPI
2. **改善对比度** — 使用图片编辑器提高亮度和对比度
3. **紧密裁剪** — 去除周围文字和空白
4. **矫正图片** — 上传前纠正旋转
5. **重新拍摄** — 更好的光线、更近的距离、更清晰的对焦
## 反馈错误
发现 TexPixel 持续识别错误的公式类型?请告知我们——准确率反馈直接改进模型。
联系我们:[support@texpixel.com](mailto:support@texpixel.com)
---
[上传公式测试识别准确率 →](/app)