用java提取文本
如果我有下面的字符串,如何使用 java 提取 EDITORS PREFACE 文本?谢谢。
<div class='chapter'><a href='page.php?page=1&filename=SomeFile&chapter=EDITORS PREFACE'>EDITORS PREFACE</a></div>
If I have the string below, how can I extract the EDITORS PREFACE text with java? Thanks.
<div class='chapter'><a href='page.php?page=1&filename=SomeFile&chapter=EDITORS PREFACE'>EDITORS PREFACE</a></div>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
正如您在问题评论中所写的那样,您想要 href 中的内容,请在此处使用正则表达式:
此正则表达式将与 Microsoft .NET Framework 一起使用。它将捕获 href 中的内容,并将其放入名为 url 的组中。
刚刚注意到这个问题是用Java标记的。在 Java 中,从 JDK 6 开始没有命名组,因此这里是 Java 的解决方案:
上面的正则表达式将捕获 href 中的内容,并将其放入组 1。
在这里测试它: http://www.regexplanet.com/simple/index.html
运行此程序:
As you wrote in a comment of your question that you want what is within href, using Regex here it is:
This regex will work with Microsoft .NET Framework. It'll capture the content within href putting it in a group called url.
Just noted that this question is tagged with Java. In Java there's no named group as of JDK 6, so here's the solution for Java:
The above regex will capture the content within href putting it in group 1.
Test it here: http://www.regexplanet.com/simple/index.html
Run this program: