6 lines
136 B
Markdown
6 lines
136 B
Markdown
|
|
* Encoder-Decoder架构
|
||
|
|
|
||
|
|
* Encoder使用Deit_{BASE}
|
||
|
|
|
||
|
|
* Decoder使用RoBERTa_{LARGE}
|
||
|
|
* Decoder的tokenizer也使用RoBERTa_{LARGE}的
|