从 HTML/ MS Word 标签中清理数据库
我有非常大的数据库需要清理。在旧系统上,用户被允许使用 HTML(并从 Word 文件粘贴)。现在我在数据库的不同位置有大量的开放标签。
有人知道执行这种清理的应用程序/脚本吗?
I have very large database to cleanup. On the old system user was permitted to use HTML (and paste from Word files). Now I've large amount of open tags in different places in DB.
Anyone know a application/script to perform this kind of cleanup?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以使用 php 的一些位(或其他后端语言)来执行此操作,
这是一个在 php 上编写的示例,
如果您想删除并非所有 html 标签,您还可以修改 strip_tags 函数的调用。 (http://ru.php.net/manual/en/function. strip-tags.php)
如果无法执行php脚本,则只能使用mysql来执行此操作。我从 this 得到它
You may do this with some bits of php (or another backend language)
Here is an example written on php
You also can modify call of strip_tags function, if you want to remove not all html tags. (http://ru.php.net/manual/en/function.strip-tags.php)
If executing of php script is not possible, you can do this only with mysql. I get it from this
如果您有 <和>字符作为文本的一部分,而不是 HTML 的一部分。即使您的字符串末尾包含损坏的 HTML 标记。那么你应该使用这个版本的函数:
What if you have < and > characters as a part of the text, not a part of HTML. Even if your string contains broken HTML tag at the end of the string. So then you should use this version of the function: