- Delete blog/copy-math-to-word (EN+ZH) — identical to docs/copy-to-word - Rewrite blog/pdf-formula-issues as narrative troubleshooting story; operational steps now link out to docs/pdf-extraction - Add "Further reading" cross-links: 4 docs → relevant blog posts - Add "See also" cross-links: 3 blog posts → relevant docs Docs = product reference; Blog = narrative/use cases/opinions Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
3.7 KiB
title, description, slug, date, tags
| title | description | slug | date | tags | |||
|---|---|---|---|---|---|---|---|
| 用 TexPixel 数字化十年科研笔记 | 研究人员如何用 TexPixel 将多年手写数学笔记转换为可搜索、可编辑的 LaTeX 文档 | researcher-workflow | 2026-03-08 |
|
用 TexPixel 数字化十年科研笔记
研究人员会积累笔记本。会议上草拟的推导、印刷论文上的旁注、组会白板的拍照、凌晨三点写了一半的证明。在很长一段时间里,这些材料实际上是不可搜索的——被困在物理形态中,只能翻翻一叠叠笔记本才能找到。
TexPixel 改变了这个局面。
问题的规模
一个活跃的研究人员每年可能积累 5–10 本填满的笔记本,每本包含数百个方程式。手动数字化——逐个用 LaTeX 重新输入公式——几乎是不可能完成的任务。按每个公式 3 分钟、每本 50 个公式计算,一年的笔记需要 400 多小时才能手动转录。
用 TexPixel,每个公式从拍照到 LaTeX 不到 5 秒。同样一年的笔记:不到 7 小时。
实用数字化工作流
第一步:拍摄笔记本
使用摄像头好的手机和文档扫描 App(Adobe Scan、Microsoft Lens 或 Apple 内置文档扫描仪)。这些 App 能够:
- 自动检测页面边缘
- 校正透视畸变
- 对褪色墨水或铅笔字迹进行对比度增强
- 导出为 PDF
扫描一整本笔记本需要 15–20 分钟。
第二步:确定公式密集的页面
不是每页都需要数字化。快速翻阅并标记包含你实际需要的方程式的页面。即使周围的文字不需要,一个关键推导或一组方程式往往也值得数字化。
第三步:用 TexPixel 批量处理
对每个标记的页面:
- 将页面或裁剪区域导出为 PNG
- 上传到 TexPixel
- 将 LaTeX 输出复制到笔记中
对于公式密集的页面,建议裁剪单个公式而不是上传整页——这能获得更准确的结果和更干净的输出。
第四步:整理到参考文档
创建一个按主题组织的 .tex 文档(或 Overleaf 项目)。将每个提取的公式粘贴进去,附上简短的上下文说明:
% 变分下界——来自 2022 NeurIPS 推导
\mathcal{L}(\theta, \phi) = \mathbb{E}_{q_\phi(z|x)}\left[\log p_\theta(x|z)\right] - D_{KL}(q_\phi(z|x) \| p(z))
几次整理之后,你将拥有一份可搜索、可编译的参考文档,所用时间只是手动转录的零头。
处理白板
会议室白板是特别有价值的目标。一次组会可能产生 20–30 个关键方程式,否则随着有人擦掉白板就消失了。
最佳实践: 在擦板前拍照(显而易见),但也要拍摄中间步骤——讨论推进过程中被覆盖的推导。中间步骤往往才是洞见所在。
白板拍摄注意事项:
- 正对白板拍摄,不要斜着拍
- 使用均匀光线——开灯不用闪光灯通常比用闪光灯更好,闪光灯会在光滑白板上产生眩光
- 上传前将各个公式分别裁剪
处理印刷论文
对于有批注的印刷论文,TexPixel 可以提取印刷公式,也可以(以略低的准确率)识别手写旁注。紧密裁剪到需要的区域,将公式与旁注分开上传。
建立长期知识库
数字化的真正价值随时间复利增长。5 年笔记整理出的结构良好的 LaTeX 参考文档,你可以:
- 用
grep或编辑器搜索功能检索 - 与引用管理器交叉引用
- 与合作者共享
- 写新论文时直接在此基础上构建
从过去一年的笔记本开始。7 小时的投入,将带来多年的回报。
参考文档: 关于 PDF 文件限制、支持类型和导出选项,请查看 PDF 公式提取文档 →