Emacs:如何为文档生成单词列表?
我想使用 RefTex 为 LaTex 文档生成索引,遵循 RefTex 手册中的建议:
“...您可能希望从文档的单词列表开始,并删除所有不应索引的单词。” (-> 收集索引短语文件的短语)。
现在我问自己:如何为我的多文件 LaTex 文档生成这样的单词列表? 我在 Emacs 手册或网络上没有找到答案。但 Emacs 一定能够做到这一点,对吧?
感谢您的任何提示。
I would like to generate an index for a LaTex document with RefTex, following this advice from the RefTex manual:
"...you might want to start from a word list of the document and remove all words which should not be indexed." (-> collecting phrases for the index phrases file).
Now I ask myself: how do I generate such a word list for my multi-file LaTex Document?
I don't find the answer in the Emacs manual or on the web. But Emacs must be able to do that, right?
Thanks for any hints.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
快速入门方法(在命令行,而不是 emacs):
sed 's/ */\n/g'
sed 's/ */\n/g'
sed 's/ */\n/g'
我的文档.txt |排序 -f |优衣库> wordListToEdit.txt
a quick way to get started (at the command line, not emacs):
sed 's/ */\n/g' < myDocument.txt | sort -f | uniq > wordListToEdit.txt
我找到了一个独立于 Emacs 的解决方案,但它生成一个包含文档中找到的所有标记的文件。
我只是在 Emacs Dired 中标记了 LaTeX 项目中的所有 .tex 文件,然后用于
在所有文件上运行以下脚本。
您可以在此处找到有关 nltk 和 Python 的更多信息:http://www.nltk.org/
I found a solution that is independent from Emacs, but it produces a file with all tokens found in the document(s).
I just marked all the .tex files in my LaTeX project in Emacs Dired, and then used
to run the following script on all of them.
You find more Information about nltk and Python here: http://www.nltk.org/