选择其中包含多个格式标记的文本字符串
上下文:
使用 htmlagility pack 处理 html 文档的 VB.NET 应用程序。
问题:
在 html 文档中,我想为所有以 # 开头并以空格结尾的字符串添加 URL 前缀,无论其中使用什么格式标记。 所以#sth会变成http://www.anything.tld/sth
例如:
之前:
<p>#string1</p> blablabla
<p><strong>#stri</strong>ng2</p> bliblibli
之后:
<p><a href="http://www.anything.tld/string1">#string1</a> blablabla</p>
<p><a href="http://www.anything.tld/string2"><strong>#stri</strong>ng2</a> bliblibli</p>
我想我可以使用 html 敏捷包来实现这一点,但是如何选择不带格式的整个文本字符串?
或者我应该使用一个简单的正则表达式替换例程?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这是我的解决方案。我确信这会让一些经验丰富的开发人员流血不止,但它确实有效。
htmlcode 位于 strCorpusHtmlContent
之前:
之后:
Here's my solution. I'm sure it would make some experienced developpers bleed from every hole but it actually works.
The htmlcode is in strCorpusHtmlContent
Before:
After: