6 lines
136 B
Markdown
6 lines
136 B
Markdown
* Encoder-Decoder架构
|
|
|
|
* Encoder使用Deit_{BASE}
|
|
|
|
* Decoder使用RoBERTa_{LARGE}
|
|
* Decoder的tokenizer也使用RoBERTa_{LARGE}的 |