解决:NLTK包下载出错问题及NLP环境测试

news/2024/8/21 16:25:15 标签: 自然语言处理, nlp, nltk

Python 2.7
IDE Pycharm 5.0.3
NLTK 3.2.1


前言

需要用到自然语言处理了,安装调试过程记录一下,省的下次再找


【注意:软件安装需求:Python、NLTK、NLTK-Data必须安装,NumPy和Matplotlin推荐安装,NetworkX和Prover9可选安装】

安装详细过程可见Python与自然语言处理(一)搭建环境总结的很好,我这里简要说明和补充:


安装Python

滚粗,自己百度


安装NLTK

Pycharm自带NLTK包,如果没有,请在cmd窗口输入命令:pip install nltk,下的应该蛮快的。不知道pip是什么?滚粗!


安装NLTK-Data

你可以作死的尝试


>>>import nltk
>>>nltk.download()

先点击Refresh,刷新下,之后选中all-corpora点击左下角下载就好,至于路径

要么在C盘中,要么在Python的根目录下!C盘根目录最靠谱!

这里写图片描述

这是官方正统下载方式,但是肯定会出错的!不仅下的慢,而且下一半就出错!老纸试了三次!

这里才是正确的下载方式:最好的方法是用使用@V_can打包好的的包网盘下载下载地址1:云盘密码znx7,下来的包nltk_data.zip 解压到C盘根目录下,这样是最保险的,防止找不到包。下载地址2:云盘密码4cp3


NLTK测试

测试环境是否安装好请按照下列步骤(全部在python console中完成,就是输入一行输出一行的那种IDE):

In[4]:from nltk.book import *
# 只输入import nltk 会出错的,但却有很多博客上都这么写,我也母鸡

之后会出现如下显示:

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908

继续测试输入:

In[5]:text1

会输出:

Out[5]: 
<Text: Moby Dick by Herman Melville 1851>

再测试输入:

In[6]: text1.concordance("monstrous")

输出:

Displaying 11 of 11 matches:
ong the former , one was of a most monstrous size . ... 

ok,这里就演示那么多,到此,NLP的环境就装好了,调试完毕,可以用于自己的实验了。


总结

写的东西不重复,实践过,有重点,对别人有帮助,这个才是最重要的。


致谢

@monkey131499–Python与自然语言处理(一)搭建环境
@V_can–Python与自然语言处理_第一期_NLTK入门之环境搭建


http://www.niftyadmin.cn/n/1672286.html

相关文章

VIM 参 考 手 册[转]

VIM 参 考 手 册 作者: Bram Moolenaar译者: Dasn, tocerhttp://vimcdoc.sf.net介绍 Vim *ref* *reference*1. 简介 |intro|2. 互联网上的 Vim |internet|3. 制作群 …

kvm虚拟化技术:实战与原理解析

2019独角兽企业重金招聘Python工程师标准>>> kvm虚拟化技术&#xff1a;实战与原理解析 在具体内容上&#xff0c;本书不仅系统介绍了 KVM虚拟机的功能、特性和使用方 法&#xff0c;而且还深入地剖析了 KVM虚拟机的核心技术和工作原理&#xff0c;对 KVM做了全面而…

Springboot @Autowired 和 @Resource 我的剖析,今天带你详细了解各组件原理

一直用的都是 Autowired &#xff1f; 别人代码用什么就copy用什么&#xff0c;反正他没错&#xff0c;俺也不会错&#xff1f; 它们都是一样的作用&#xff1f;只是名字不一样而已&#xff1f; 如果你存在以上这些疑问&#xff0c;那么你看这篇文章必赚&#xff01; 上车&a…

txt转化csv的接口(子函数)

Python 2.7 IDE Pycharm 5.0.3 pyExcelerator 0.6.4.1 目的 将txt转化为csv格式 准备工作 安装pyExcelerator包 推荐使用pip install pyExcelerator或者百度pyExcelerator github下载zip解压后&#xff0c;cmd切换到解压目录&#xff0c;执行输入python setup.py install&a…

vi 每日练习

vi 1. 4 空格 2. ctrl b, ctrl f 3. 0 $ 4. 1G gg G 5. 10G 6. 10 回车 7. / ? 8. 1,$s/a/x/g 1,$s/a/x/gc 9. 10x 10X 10. dd 10dd d1G dG 11. d$ d0 12. yy 10yy y1G yG 13. y$ y0 14. p 15. J 16. u 17. . 18. :w filename 19. …

windows server 2008 远程桌面(授权、普通用户登录)~ .

大家好&#xff0c;因公司上ERP系统&#xff0c;用户端需要远程到服务器&#xff0c;但大家都知道微软默认只有2个&#xff0c;所以没有办法达到我公司的要求。在网上找了很久也没有找到合适的文章&#xff0c;要不就这里说一点&#xff0c;那里说一点&#xff0c;没有一个全的…

随机采样接口(子函数)

Python 2.7 IDE Pycharm 5.0.3 sklearn 0.17. 目前接口库 MrLevo520–数据转化接口 仍在不断更新 目的 将一堆数据中随机或者按比例抽取部分作为训练样本并保存txt/csv 准备工作 请先安装相关科学计数包&#xff0c;numpy&#xff0c;sklearn等&#xff0c;具体看包导入情况…

CCIE IGP TEST

IGP汇总试验 __________________RIP___________________________________________________________________________ b 1> Config ip address with R1.R2.R3.R4 and Loopback0 is 3.3.x.x/24 . ( x Router Number ) Advertise Loopback0 with relevant IGP The router can …