[返回参数类型不一致]transformers.PreTrainedTokenizer.encode

transformers.PreTrainedTokenizer.encode

transformers.PreTrainedTokenizer.encode(text, **kwargs)

paddlenlp.transformers.PreTrainedTokenizer.encode

paddlenlp.transformers.PreTrainedTokenizer.encode(text, **kwargs)

参数映射

transformers PaddlePaddle 备注
text text 输入的编码文本。
返回值 返回值 PyTorch 返回 Tensor 类型,Paddle 返回类型为 BatchEncoding,是一种 dict-like 对象,key 包含 input_idsattention_mask 等属性,需要转写。

转写示例

# Pytorch 写法
transformers.PreTrainedTokenizer.encode(text)

# Paddle 写法
paddlenlp.transformers.PreTrainedTokenizer.encode(text)["input_ids"]