𝚃𝚎𝚡𝚃𝚎𝚕𝚕𝚎𝚛
🤗 Hugging Face
[](https://opensource.org/licenses/Apache-2.0)
[](https://github.com/OleehyO/TexTeller/issues)
[](https://huggingface.co/datasets/OleehyO/latex-formulas)
[](https://huggingface.co/OleehyO/TexTeller)
https://github.com/OleehyO/TexTeller/assets/56267907/532d1471-a72e-4960-9677-ec6c19db289f
TexTeller是一个基于[TrOCR](https://arxiv.org/abs/2109.10282)的端到端公式识别模型,可以把图片转换为对应的latex公式
TexTeller用了**80M**个图片-公式对进行训练(过去的数据集可以在[这里](https://huggingface.co/datasets/OleehyO/latex-formulas)获取),相比于[LaTeX-OCR](https://github.com/lukas-blecher/LaTeX-OCR)(使用了一个100K的数据集),TexTeller具有**更强的泛化能力**以及**更高的准确率**,可以覆盖大部分的使用场景。
> [!NOTE]
> 如果您想为本项目提供一些反馈、建议等,欢迎在[Discussions版块](https://github.com/OleehyO/TexTeller/discussions)发起讨论。
>
> 另外,如果您觉得这个项目对您有帮助,请不要忘记点亮上方的Star⭐️🙏
---