关于项目中为什么要用停用词的文章
-
扫雷怎么撤销「扫雷大军为什么你不应该去除停用词」
全文共3342字,预计学习时长10分钟
来源:Pexels
我们常常认为在预处理文本时,去除停用词是很明智的一种操作。
的确,我同意这一做法,但是我们应该谨慎决定该去除哪类停用词。
比如说,去除停用词最常规的方法是使用NLTK停用词表。
一起来看看nltk中的停用词列表吧。
from nltk.corpus import stopwords
print(stopwords.words('english'))
stopwords