2026-03-26 16:46:31 +08:00
|
|
|
|
---
|
|
|
|
|
|
title: "用 TexPixel 数字化十年科研笔记"
|
|
|
|
|
|
description: 研究人员如何用 TexPixel 将多年手写数学笔记转换为可搜索、可编辑的 LaTeX 文档
|
|
|
|
|
|
slug: researcher-workflow
|
|
|
|
|
|
date: 2026-03-08
|
|
|
|
|
|
tags: [工作流, 科研, 教程]
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
# 用 TexPixel 数字化十年科研笔记
|
|
|
|
|
|
|
|
|
|
|
|
研究人员会积累笔记本。会议上草拟的推导、印刷论文上的旁注、组会白板的拍照、凌晨三点写了一半的证明。在很长一段时间里,这些材料实际上是不可搜索的——被困在物理形态中,只能翻翻一叠叠笔记本才能找到。
|
|
|
|
|
|
|
|
|
|
|
|
TexPixel 改变了这个局面。
|
|
|
|
|
|
|
|
|
|
|
|
## 问题的规模
|
|
|
|
|
|
|
|
|
|
|
|
一个活跃的研究人员每年可能积累 5–10 本填满的笔记本,每本包含数百个方程式。手动数字化——逐个用 LaTeX 重新输入公式——几乎是不可能完成的任务。按每个公式 3 分钟、每本 50 个公式计算,一年的笔记需要 400 多小时才能手动转录。
|
|
|
|
|
|
|
|
|
|
|
|
用 TexPixel,每个公式从拍照到 LaTeX 不到 5 秒。同样一年的笔记:不到 7 小时。
|
|
|
|
|
|
|
|
|
|
|
|
## 实用数字化工作流
|
|
|
|
|
|
|
|
|
|
|
|
### 第一步:拍摄笔记本
|
|
|
|
|
|
|
|
|
|
|
|
使用摄像头好的手机和文档扫描 App(Adobe Scan、Microsoft Lens 或 Apple 内置文档扫描仪)。这些 App 能够:
|
|
|
|
|
|
- 自动检测页面边缘
|
|
|
|
|
|
- 校正透视畸变
|
|
|
|
|
|
- 对褪色墨水或铅笔字迹进行对比度增强
|
|
|
|
|
|
- 导出为 PDF
|
|
|
|
|
|
|
|
|
|
|
|
扫描一整本笔记本需要 15–20 分钟。
|
|
|
|
|
|
|
|
|
|
|
|
### 第二步:确定公式密集的页面
|
|
|
|
|
|
|
|
|
|
|
|
不是每页都需要数字化。快速翻阅并标记包含你实际需要的方程式的页面。即使周围的文字不需要,一个关键推导或一组方程式往往也值得数字化。
|
|
|
|
|
|
|
|
|
|
|
|
### 第三步:用 TexPixel 批量处理
|
|
|
|
|
|
|
|
|
|
|
|
对每个标记的页面:
|
|
|
|
|
|
1. 将页面或裁剪区域导出为 PNG
|
|
|
|
|
|
2. 上传到 TexPixel
|
|
|
|
|
|
3. 将 LaTeX 输出复制到笔记中
|
|
|
|
|
|
|
|
|
|
|
|
对于公式密集的页面,建议裁剪单个公式而不是上传整页——这能获得更准确的结果和更干净的输出。
|
|
|
|
|
|
|
|
|
|
|
|
### 第四步:整理到参考文档
|
|
|
|
|
|
|
|
|
|
|
|
创建一个按主题组织的 `.tex` 文档(或 Overleaf 项目)。将每个提取的公式粘贴进去,附上简短的上下文说明:
|
|
|
|
|
|
|
|
|
|
|
|
```latex
|
|
|
|
|
|
% 变分下界——来自 2022 NeurIPS 推导
|
|
|
|
|
|
\mathcal{L}(\theta, \phi) = \mathbb{E}_{q_\phi(z|x)}\left[\log p_\theta(x|z)\right] - D_{KL}(q_\phi(z|x) \| p(z))
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
几次整理之后,你将拥有一份可搜索、可编译的参考文档,所用时间只是手动转录的零头。
|
|
|
|
|
|
|
|
|
|
|
|
## 处理白板
|
|
|
|
|
|
|
|
|
|
|
|
会议室白板是特别有价值的目标。一次组会可能产生 20–30 个关键方程式,否则随着有人擦掉白板就消失了。
|
|
|
|
|
|
|
|
|
|
|
|
**最佳实践:** 在擦板前拍照(显而易见),但也要拍摄中间步骤——讨论推进过程中被覆盖的推导。中间步骤往往才是洞见所在。
|
|
|
|
|
|
|
|
|
|
|
|
白板拍摄注意事项:
|
|
|
|
|
|
- 正对白板拍摄,不要斜着拍
|
|
|
|
|
|
- 使用均匀光线——开灯不用闪光灯通常比用闪光灯更好,闪光灯会在光滑白板上产生眩光
|
|
|
|
|
|
- 上传前将各个公式分别裁剪
|
|
|
|
|
|
|
|
|
|
|
|
## 处理印刷论文
|
|
|
|
|
|
|
|
|
|
|
|
对于有批注的印刷论文,TexPixel 可以提取印刷公式,也可以(以略低的准确率)识别手写旁注。紧密裁剪到需要的区域,将公式与旁注分开上传。
|
|
|
|
|
|
|
|
|
|
|
|
## 建立长期知识库
|
|
|
|
|
|
|
|
|
|
|
|
数字化的真正价值随时间复利增长。5 年笔记整理出的结构良好的 LaTeX 参考文档,你可以:
|
|
|
|
|
|
- 用 `grep` 或编辑器搜索功能检索
|
|
|
|
|
|
- 与引用管理器交叉引用
|
|
|
|
|
|
- 与合作者共享
|
|
|
|
|
|
- 写新论文时直接在此基础上构建
|
|
|
|
|
|
|
|
|
|
|
|
从过去一年的笔记本开始。7 小时的投入,将带来多年的回报。
|
|
|
|
|
|
|
2026-03-26 16:52:27 +08:00
|
|
|
|
**参考文档:** 关于 PDF 文件限制、支持类型和导出选项,请查看 [PDF 公式提取文档 →](/docs/pdf-extraction)
|
|
|
|
|
|
|
2026-03-26 16:46:31 +08:00
|
|
|
|
[开始数字化你的笔记 →](/app)
|