如何从代码中配置nltk数据目录?
如何从代码中配置nltk数据目录?
How to config nltk data directory from code?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
如何从代码中配置nltk数据目录?
How to config nltk data directory from code?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(7)
只需更改
nltk.data.path
的项目即可,这是一个简单的列表。Just change items of
nltk.data.path
, it's a simple list.从代码中,http://www.nltk.org/_modules/nltk/data.html:
然后在代码中:
要修改路径,只需附加到可能路径的列表中:
或者在 Windows 中:
From the code, http://www.nltk.org/_modules/nltk/data.html:
Then within the code:
To modify the path, simply append to the list of possible paths:
Or in windows:
我使用附加,例如
I use append, example
NLTK 接受 NLTK_DATA 环境变量,而不是将
nltk.data.path.append('your/path/to/nltk_data')
添加到每个脚本。 (代码链接)打开
~/. bashrc
(或~/.profile
),使用文本编辑器(例如nano
、vim
、gedit
),并添加以下行:执行
source
加载环境变量测试
打开 python 并执行以下行
您可以看到 nltk 数据路径已在其中。
参考:@alvations 的回答
nltk/nltk #1997
Instead of adding
nltk.data.path.append('your/path/to/nltk_data')
to every script, NLTK accepts NLTK_DATA environment variable. (code link)Open
~/.bashrc
(or~/.profile
) with text editor (e.g.nano
,vim
,gedit
), and add following line:Execute
source
to load environmental variableTest
Open python and execute following lines
Your can see your nltk data path already in there.
Reference: @alvations's answer on
nltk/nltk #1997
使用 fnjn 上面关于打印路径的建议:
我在 Windows 上看到了这种格式的路径字符串:
所以当我使用路径时,我将路径从 python 类型正斜杠“/”切换为双反斜杠“\\” .append:
异常消失了。
Using fnjn's advice above on printing out the path:
I saw the path strings in this type of format on windows:
So I switched my path from the python type forward slash '/', to a double backslash '\\' when I used path.append:
The exception went away.
对于那些使用 uwsgi 的人:
我遇到了麻烦,因为我想要一个 uwsgi 应用程序(以与我不同的用户身份运行)来访问我之前下载的 nltk 数据。对我有用的是将以下行添加到
myapp_uwsgi.ini
:这会设置环境变量
NLTK_DATA
,如 @schemacs 所建议的。进行此更改后,您可能需要重新启动 uwsgi 进程。
For those using uwsgi:
I was having trouble because I wanted a uwsgi app (running as a different user than myself) to have access to nltk data that I had previously downloaded. What worked for me was adding the following line to
myapp_uwsgi.ini
:This sets the environment variable
NLTK_DATA
, as suggested by @schemacs.You may need to restart your uwsgi process after making this change.
另一个解决方案是抢先一步。
尝试
导入nltk
nltk.download()
当弹出窗口询问是否要下载语料库时,可以指定下载到哪个目录。
Another solution is to get ahead of it.
try
import nltk
nltk.download()
When the window box pops up asking if you want to download the corpus , you can specify there which directory it is to be downloaded to.