[torch 参数更多]transformers.GenerationConfig
transformers.GenerationConfig
transformers.GenerationConfig(*kwargs)
paddlenlp.generation.GenerationConfig
paddlenlp.generation.GenerationConfig(*kwargs)
两者功能一致,但 PyTorch 相比 Paddle 支持更多其他参数,具体如下:
参数映射
| transformers | PaddlePaddle | 备注 |
|---|---|---|
| max_length | max_length | 最大生成长度。 |
| max_new_tokens | - | 最大生成长度(忽略 promot),Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| min_length | min_length | 最小生成长度。 |
| min_new_tokens | - | 最小生成长度(忽略 promot),Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| early_stopping | early_stopping | 早停是否开启。 |
| max_time | - | 最大允许计算运行时间,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| do_sample | do_sample | 是否进行采样。 |
| num_beams | num_beams | beams for beam search。 |
| num_beam_groups | num_beam_groups | beams 划分的组数。 |
| penalty_alpha | - | 惩罚参数,Paddle 无此参数,暂无转写方式。 |
| use_cache | use_cache | 是否开启 kv cache。 |
| temperature | temperature | 用于控制下个 token 生成的参数。 |
| top_k | top_k | top_k 算法的 k 值。 |
| top_p | top_p | top_p 算法的 p 值。 |
| typical_p | - | 局部典型度量的参数,Paddle 无此参数,暂无转写方式。 |
| epsilon_cutoff | - | 截断采样参数,Paddle 无此参数,暂无转写方式。 |
| eta_cutoff | - | 截断采样参数,Paddle 无此参数,暂无转写方式。 |
| diversity_penalty | - | 分散惩罚系数,Paddle 无此参数,暂无转写方式。 |
| repetition_penalty | repetition_penalty | 重复惩罚参数。 |
| encoder_repetition_penalty | - | 编码重复惩罚参数,Paddle 无此参数,暂无转写方式。 |
| length_penalty | length_penalty | 长度重复惩罚参数。 |
| no_repeat_ngram_size | - | ngram 在给定长度内不可重复,Paddle 无此参数,暂无转写方式。 |
| bad_words_ids | - | 不允许生成的 id 列表,Paddle 无此参数,暂无转写方式。 |
| force_words_ids | - | 必须生成的 id 列表,Paddle 无此参数,暂无转写方式。 |
| renormalize_logits | - | 对 logits 进行 renormalize 操作,Paddle 无此参数,暂无转写方式。 |
| constraints | - | 自定义约束列表,Paddle 无此参数,暂无转写方式。 |
| forced_bos_token_id | forced_bos_token_id | 强制生成的 bos token 的 id。 |
| forced_eos_token_id | forced_eos_token_id | 强制生成的 eos token 的 id。 |
| remove_invalid_values | - | 是否移除无效值,Paddle 无此参数,暂无转写方式。 |
| exponential_decay_length_penalty | - | 生成指定长度 tokens 后的惩罚参数,Paddle 无此参数,暂无转写方式。 |
| suppress_tokens | - | 生成期间被抑制的 tokens,Paddle 无此参数,暂无转写方式。 |
| begin_suppress_tokens | - | 开始生成时被抑制的 tokens,Paddle 无此参数,暂无转写方式。 |
| forced_decoder_ids | - | 指定 decoder 指定位置生成的 token,Paddle 无此参数,暂无转写方式。 |
| sequence_bias | - | 映射 sequence 到其偏执项的字典,Paddle 无此参数,暂无转写方式。 |
| guidance_scale | - | 控制 output 与 input 联系紧密程度的参数,Paddle 无此参数,暂无转写方式。 |
| low_memory | - | 使用更低显存占用的搜索算法,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| num_return_sequences | - | 为 batch 中每个序列独立计算返回序列的个数,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| output_attentions | - | 是否返回注意力层的注意力张量,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| output_hidden_states | - | 是否返回注意力层的隐藏层张量,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| output_scores | - | 是否返回注意力层的得分张量,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| return_dict_in_generate | - | 是否返回 dict 而不是 tuple,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| pad_token_id | pad_token_id | padding token 的 id。 |
| bos_token_id | bos_token_id | beginning-of-sequence token 的 id。 |
| eos_token_id | eos_token_id | end-of-sequence token 的 id。 |
| encoder_no_repeat_ngram_size | - | encoder 中指定 size 内不能出现同一个 ngram,Paddle 无此参数,暂无转写方式。 |
| decoder_start_token_id | - | decoder 生成的第一个 token 的 id,Paddle 无此参数,暂无转写方式。 |
| num_assistant_tokens | - | 定义在每次迭代中由目标模型检查之前由辅助模型生成的推测令牌的数量,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
| num_assistant_tokens_schedule | - | 定义推理时应更改最大辅助 tokens 的 schedule,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |