Files
doc_ai_frontend/content/blog/zh/2026-03-08-researcher-workflow.md
yoge 99e1314bf9 refact: eliminate blog/docs content overlap
- Delete blog/copy-math-to-word (EN+ZH) — identical to docs/copy-to-word
- Rewrite blog/pdf-formula-issues as narrative troubleshooting story;
  operational steps now link out to docs/pdf-extraction
- Add "Further reading" cross-links: 4 docs → relevant blog posts
- Add "See also" cross-links: 3 blog posts → relevant docs

Docs = product reference; Blog = narrative/use cases/opinions

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-26 16:52:27 +08:00

3.7 KiB
Raw Blame History

title, description, slug, date, tags
title description slug date tags
用 TexPixel 数字化十年科研笔记 研究人员如何用 TexPixel 将多年手写数学笔记转换为可搜索、可编辑的 LaTeX 文档 researcher-workflow 2026-03-08
工作流
科研
教程

用 TexPixel 数字化十年科研笔记

研究人员会积累笔记本。会议上草拟的推导、印刷论文上的旁注、组会白板的拍照、凌晨三点写了一半的证明。在很长一段时间里,这些材料实际上是不可搜索的——被困在物理形态中,只能翻翻一叠叠笔记本才能找到。

TexPixel 改变了这个局面。

问题的规模

一个活跃的研究人员每年可能积累 510 本填满的笔记本,每本包含数百个方程式。手动数字化——逐个用 LaTeX 重新输入公式——几乎是不可能完成的任务。按每个公式 3 分钟、每本 50 个公式计算,一年的笔记需要 400 多小时才能手动转录。

用 TexPixel每个公式从拍照到 LaTeX 不到 5 秒。同样一年的笔记:不到 7 小时。

实用数字化工作流

第一步:拍摄笔记本

使用摄像头好的手机和文档扫描 AppAdobe Scan、Microsoft Lens 或 Apple 内置文档扫描仪)。这些 App 能够:

  • 自动检测页面边缘
  • 校正透视畸变
  • 对褪色墨水或铅笔字迹进行对比度增强
  • 导出为 PDF

扫描一整本笔记本需要 1520 分钟。

第二步:确定公式密集的页面

不是每页都需要数字化。快速翻阅并标记包含你实际需要的方程式的页面。即使周围的文字不需要,一个关键推导或一组方程式往往也值得数字化。

第三步:用 TexPixel 批量处理

对每个标记的页面:

  1. 将页面或裁剪区域导出为 PNG
  2. 上传到 TexPixel
  3. 将 LaTeX 输出复制到笔记中

对于公式密集的页面,建议裁剪单个公式而不是上传整页——这能获得更准确的结果和更干净的输出。

第四步:整理到参考文档

创建一个按主题组织的 .tex 文档(或 Overleaf 项目)。将每个提取的公式粘贴进去,附上简短的上下文说明:

% 变分下界——来自 2022 NeurIPS 推导
\mathcal{L}(\theta, \phi) = \mathbb{E}_{q_\phi(z|x)}\left[\log p_\theta(x|z)\right] - D_{KL}(q_\phi(z|x) \| p(z))

几次整理之后,你将拥有一份可搜索、可编译的参考文档,所用时间只是手动转录的零头。

处理白板

会议室白板是特别有价值的目标。一次组会可能产生 2030 个关键方程式,否则随着有人擦掉白板就消失了。

最佳实践: 在擦板前拍照(显而易见),但也要拍摄中间步骤——讨论推进过程中被覆盖的推导。中间步骤往往才是洞见所在。

白板拍摄注意事项:

  • 正对白板拍摄,不要斜着拍
  • 使用均匀光线——开灯不用闪光灯通常比用闪光灯更好,闪光灯会在光滑白板上产生眩光
  • 上传前将各个公式分别裁剪

处理印刷论文

对于有批注的印刷论文TexPixel 可以提取印刷公式,也可以(以略低的准确率)识别手写旁注。紧密裁剪到需要的区域,将公式与旁注分开上传。

建立长期知识库

数字化的真正价值随时间复利增长。5 年笔记整理出的结构良好的 LaTeX 参考文档,你可以:

  • grep 或编辑器搜索功能检索
  • 与引用管理器交叉引用
  • 与合作者共享
  • 写新论文时直接在此基础上构建

从过去一年的笔记本开始。7 小时的投入,将带来多年的回报。

参考文档: 关于 PDF 文件限制、支持类型和导出选项,请查看 PDF 公式提取文档 →

开始数字化你的笔记 →