如何过滤掉<script type="text/javascript">……</script>之间的文本
提取网页文本,
使用 HTMLParser 过可以滤掉 HTML 中的 script 和 style 内容,但是不知道怎莫过滤掉<script type="text/javascript">……</script>之间的文本,请指教
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(8)
顶!!!jousp太强大了,莫名其妙的就好了。谢谢各位先辈了!
肯定行。
jsoup 可行否?
???
正则?replaceall掉?
http://bbs.phpchina.com/viewthread.php?tid=222353&rpid=1895332&ordertype=0&page=1#pid1895332
第五楼有源代码
可能是<script type="text/javascript">……</script>之间的文本可能太长过滤不掉,怎么办呀?
这位仁兄对这篇网页试试http://book.douban.com/subject/1231490/
怎么我的不可以呀
这个代码对 <script type=...> 同样有效