Files
TexTeller/src/models/ocr_model

  • Encoder-Decoder架构

  • Encoder使用Deit_{BASE}

  • Decoder使用RoBERTa_{LARGE}

    • Decoder的tokenizer也使用RoBERTa_{LARGE}的