python 模块删除互联网行话/俚语/首字母缩略词
是否有任何 python 模块(可能在 nltk python 中)来删除互联网俚语/聊天俚语,如“lol”、“brb”等。如果没有,有人可以为我提供一个包含如此大量俚语列表的 CSV 文件吗?
网站 http://www.netlingo.com/acronyms.php 提供了首字母缩略词列表,但是我无法找到任何可在我的程序中使用它们的 CSV 文件。
Is there any python module (may be in nltk python) to remove internet slang/ chat slang like "lol","brb" etc. If not can some one provide me a CSV file comprising of such vast list of slang?
The website http://www.netlingo.com/acronyms.php gives the list of acronyms but I am not able to find any CSV files for using them in my program.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
要废弃的代码 http://www.netlingo.com/acronyms.php
code to scrap http://www.netlingo.com/acronyms.php
行话文件:http://www.catb.org/jargon/ 。
Kevin 的单词列表页面:请参阅俚语单词列表和词典的链接
The Jargon File: http://www.catb.org/jargon/ .
Kevin's Word List Page: see Links to Slang Word Lists and Dictionaries