比较页面或 CSV 文件中的关键字:PHP ?重击?
我在 HTML 网页中有一系列关键字 - 它们以逗号分隔,因此我可以将它们转换为 CSV,并且想知道哪些关键字不在显示为 html 网页的另一个 CSV 文件中。 你会如何进行这种比较?我对 mysql 和表有想法,但这是 CSV 或 html 源。 谢谢 !
I have a series of keywords in an HTML web page - they are comma separated so I could get them to CSV, and would like to know which ones are NOTin another CSV file displayed as an html web page.
How would you do that comparison ? I have ideas for mysql and tables but this is CSV or html sources.
Thanks !
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
在 Python 中,给定 2 个 csv 文件 a.csv 和 b.csv,此脚本将创建(或编辑,如果已存在)一个新文件 out.csv,其中包含 a.csv 中 b.csv 中未找到的所有内容。
In Python, given 2 csv files, a.csv and b.csv, this script will create (or edit if it already exists) a new file out.csv that contains everything in a.csv that's not found in b.csv.
如果只是一个关键字列表,你想进行搜索和替换(可以使用sed)将所有逗号替换为回车符。因此,您最终会得到一个文件,每一行都包含一个关键字。对列表的两个版本都执行此操作。然后使用“join”命令:
这将报告左文件中不在右文件中的所有条目。不要忘记先对文件进行排序,否则连接将不起作用。还有一个用于排序的 bash 工具(毫不奇怪,它被称为“排序”)。
If it is just a list of keywords, you want to do a search and replace (you can use sed) to replace all the commas with carriage returns. So you will end up with a file containing one keyword on each line. Do that to both versions of the list. Then use the "join" command:
This will report all the entries in leftfile that are not in rightfile. Don't forget to sort the files first, or join won't work. There is a bash tool for sorting too (it's called, not surprisingly, "sort").
PHP解决方案..
获取关键字作为字符串,然后转换为数组并使用 array_diff 函数:
?>
PHP solution..
Get keywords as strings, convert then in arrays and use array_diff function:
?>