在Java中将HTML解析为字符串
我必须获取电子邮件的内容(HTML 格式)并将其保存到一个字符串中,然后解析该字符串以获得所需的详细信息并准备 XML 输出。
我正在使用 JAMES,并且我希望用 Java 来完成它。如何将 HTML 页面转储为字符串?你认为我在解析时不会遇到双引号、空格、反斜杠的任何问题吗?
现在我正在本地系统上测试邮件服务器。 我以 HTML 格式从 user1@localhost 向 user2@localhost 发送了一封邮件 另一方面,我想转换解析 HTML 页面以创建具有所需值的 XML 文档..
I have to get an email's content (HTML format) and save it to a string which then should be parsed to get the required details and to prepare an XML output.
I am using JAMES and i want it to be done in Java. How can I dump the HTML page into a string? Do you think I won't get any problem with the double inverted commas, spaces, backward slash while parsing?
Now i am testing mailserver on my localsystem.
I sent a mail from user1@localhost to user2@localhost in format HTML
At the other end i want to convert the parse HTML page to create an XML document with the desired values ..
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
你能尝试一下那个例子吗?转储 html 页面并将该数据写入 data.html 文件。
从下面的代码中,您可以将结果附加到 StringBuffer 并替换 html 特殊字符。
}
Can you try with that example. Dumps html page and writes that data into data.html file.
From bellow code you can append result to StringBuffer and replace the html special chars.
}