在Java中将HTML解析为字符串

发布于 2024-10-20 12:32:06 字数 274 浏览 4 评论 0原文

我必须获取电子邮件的内容(HTML 格式)并将其保存到一个字符串中,然后解析该字符串以获得所需的详细信息并准备 XML 输出。

我正在使用 JAMES,并且我希望用 Java 来完成它。如何将 HTML 页面转储为字符串?你认为我在解析时不会遇到双引号、空格、反斜杠的任何问题吗?

现在我正在本地系统上测试邮件服务器。 我以 HTML 格式从 user1@localhost 向 user2@localhost 发送了一封邮件 另一方面,我想转换解析 HTML 页面以创建具有所需值的 XML 文档..

I have to get an email's content (HTML format) and save it to a string which then should be parsed to get the required details and to prepare an XML output.

I am using JAMES and i want it to be done in Java. How can I dump the HTML page into a string? Do you think I won't get any problem with the double inverted commas, spaces, backward slash while parsing?

Now i am testing mailserver on my localsystem.
I sent a mail from user1@localhost to user2@localhost in format HTML
At the other end i want to convert the parse HTML page to create an XML document with the desired values ..

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

装迷糊 2024-10-27 12:32:06

你能尝试一下那个例子吗?转储 html 页面并将该数据写入 data.html 文件。
从下面的代码中,您可以将结果附加到 StringBuffer 并替换 html 特殊字符。

public class UrlReadPageDemo {
  public static void main(String[] args) {
    try {
        URL url = new URL("http://example.com");

        BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
        BufferedWriter writer = new BufferedWriter(new FileWriter("data.html"));

        String line;
        while ((line = reader.readLine()) != null) {
            System.out.println(line);
            writer.write(line);
            writer.newLine();
        }

        reader.close();
        writer.close();
    } catch (MalformedURLException e) {
        e.printStackTrace();
    }  catch (IOException e) {
        e.printStackTrace();
    }
}

}

Can you try with that example. Dumps html page and writes that data into data.html file.
From bellow code you can append result to StringBuffer and replace the html special chars.

public class UrlReadPageDemo {
  public static void main(String[] args) {
    try {
        URL url = new URL("http://example.com");

        BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
        BufferedWriter writer = new BufferedWriter(new FileWriter("data.html"));

        String line;
        while ((line = reader.readLine()) != null) {
            System.out.println(line);
            writer.write(line);
            writer.newLine();
        }

        reader.close();
        writer.close();
    } catch (MalformedURLException e) {
        e.printStackTrace();
    }  catch (IOException e) {
        e.printStackTrace();
    }
}

}

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文