sentiment

脚本获取并预处理由NLTK提供的movie_reviews数据集。

方法

paddle.dataset.sentiment.get_word_dict()

按照样本中出现的单词的频率对单词进行排序。

返回
words_freq_sorted

paddle.dataset.sentiment.train()

默认的训练集reader creator。

paddle.dataset.sentiment.test()

默认的测试集reader creator。

paddle.dataset.sentiment.convert(path)

将数据集转换为recordio格式。