安装nltk需要两步:安装nltk和安装nltk_data数据包
1 import nltk 2 nltk.download()
但通常这样安装都会提示:getaddrinfo failed
可见,直接代码安装不行
因为其他方法我都试过了,都没有成功,这里推荐我试了之后成功的方法
先进入这个网站:https://github.com/nltk/nltk_data/tree/gh-pages
1 import nltk 2 from nltk_book import *
所以我们把nltk_data安装包里packages里的这些文件解压到上述任意路径,重命名为nltk_data即可,我解压到D:\\Anaconda3
完后以上步骤,执行下面代码试验一下有没有安装成功
1 import nltk 2 from nltk.book import *
出现以下内容,即成功!
注意:在
1 import nltk 2 3 sen = \'hello, how are you?\' 4 res = nltk.word_tokenize(sen) 5 print(res)
会提示 Resource punkt not found. Please use the NLTK Downloader to obtain the resource: 即punkt数据未找到:
类似这样的错误,其实如果找到查找的路径,也就是上面我们放数据包的地方,是可以在tokenizers文件夹下找到这个punkt的,原因就在于没有解压,那么,把punkt.zip解压到文件夹中,再运行分割句子的代码就没问题了。如果有其他的一些数据也是这样的,如果遇到显示没有找到某个数据包,不妨试一试。(如果打开其他的文件夹,发现里面也有未解压的那些文件,我们可以手动将其解压)
来源:https://www.cnblogs.com/wangsiy/p/16350638.html
本站部分图文来源于网络,如有侵权请联系删除。