Files
doc_ai_frontend/content/blog/zh/2026-03-08-researcher-workflow.md

83 lines
3.6 KiB
Markdown
Raw Normal View History

---
title: "用 TexPixel 数字化十年科研笔记"
description: 研究人员如何用 TexPixel 将多年手写数学笔记转换为可搜索、可编辑的 LaTeX 文档
slug: researcher-workflow
date: 2026-03-08
tags: [工作流, 科研, 教程]
---
# 用 TexPixel 数字化十年科研笔记
研究人员会积累笔记本。会议上草拟的推导、印刷论文上的旁注、组会白板的拍照、凌晨三点写了一半的证明。在很长一段时间里,这些材料实际上是不可搜索的——被困在物理形态中,只能翻翻一叠叠笔记本才能找到。
TexPixel 改变了这个局面。
## 问题的规模
一个活跃的研究人员每年可能积累 510 本填满的笔记本,每本包含数百个方程式。手动数字化——逐个用 LaTeX 重新输入公式——几乎是不可能完成的任务。按每个公式 3 分钟、每本 50 个公式计算,一年的笔记需要 400 多小时才能手动转录。
用 TexPixel每个公式从拍照到 LaTeX 不到 5 秒。同样一年的笔记:不到 7 小时。
## 实用数字化工作流
### 第一步:拍摄笔记本
使用摄像头好的手机和文档扫描 AppAdobe Scan、Microsoft Lens 或 Apple 内置文档扫描仪)。这些 App 能够:
- 自动检测页面边缘
- 校正透视畸变
- 对褪色墨水或铅笔字迹进行对比度增强
- 导出为 PDF
扫描一整本笔记本需要 1520 分钟。
### 第二步:确定公式密集的页面
不是每页都需要数字化。快速翻阅并标记包含你实际需要的方程式的页面。即使周围的文字不需要,一个关键推导或一组方程式往往也值得数字化。
### 第三步:用 TexPixel 批量处理
对每个标记的页面:
1. 将页面或裁剪区域导出为 PNG
2. 上传到 TexPixel
3. 将 LaTeX 输出复制到笔记中
对于公式密集的页面,建议裁剪单个公式而不是上传整页——这能获得更准确的结果和更干净的输出。
### 第四步:整理到参考文档
创建一个按主题组织的 `.tex` 文档(或 Overleaf 项目)。将每个提取的公式粘贴进去,附上简短的上下文说明:
```latex
% 变分下界——来自 2022 NeurIPS 推导
\mathcal{L}(\theta, \phi) = \mathbb{E}_{q_\phi(z|x)}\left[\log p_\theta(x|z)\right] - D_{KL}(q_\phi(z|x) \| p(z))
```
几次整理之后,你将拥有一份可搜索、可编译的参考文档,所用时间只是手动转录的零头。
## 处理白板
会议室白板是特别有价值的目标。一次组会可能产生 2030 个关键方程式,否则随着有人擦掉白板就消失了。
**最佳实践:** 在擦板前拍照(显而易见),但也要拍摄中间步骤——讨论推进过程中被覆盖的推导。中间步骤往往才是洞见所在。
白板拍摄注意事项:
- 正对白板拍摄,不要斜着拍
- 使用均匀光线——开灯不用闪光灯通常比用闪光灯更好,闪光灯会在光滑白板上产生眩光
- 上传前将各个公式分别裁剪
## 处理印刷论文
对于有批注的印刷论文TexPixel 可以提取印刷公式,也可以(以略低的准确率)识别手写旁注。紧密裁剪到需要的区域,将公式与旁注分开上传。
## 建立长期知识库
数字化的真正价值随时间复利增长。5 年笔记整理出的结构良好的 LaTeX 参考文档,你可以:
-`grep` 或编辑器搜索功能检索
- 与引用管理器交叉引用
- 与合作者共享
- 写新论文时直接在此基础上构建
从过去一年的笔记本开始。7 小时的投入,将带来多年的回报。
[开始数字化你的笔记 →](/app)