Javascript 中的 HTML 解析器

发布于 2024-12-11 12:26:38 字数 1739 浏览 0 评论 0原文

大家好，我现在尝试为我们的新粉丝页面解析一些 HTML 新闻。因为该公司不提供 RSS 源。

我得到了一个新的 JS 文件，其中包含该文件

function getNews() {
      y = 0;
      news = new Array(7);
      news_content = new Array(5);
      for (var i = 0; i < news.length; i++)
      {
            var table = document.getElementById('news').contentWindow.getElementsByTagName('table')[y];
            news_content[0] = table.rows[0].cells[0].getElementsByTagName('img')[0].src;
            news_content[1] = table.rows[0].cells[1].getElementsByTagName('span')[0].innerHTML;
            news_content[2] = table.rows[0].cells[2].getElementsByTagName('span')[0].innerHTML;
            news_content[3] = table.rows[1].cells[0].getElementsByTagName('p')[0].innerHTML;
            news_content[4] = table.rows[0].cells[0].getElementsByTagName('a')[0].href;
            //alert(news[0] + "\n" + news[1] + "\n" + news[2] + "\n" + news[3] + "\n" + news[4]);
            news[i] = news_content[0] + "\n" + news_content[1] + "\n" + news_content[2] + "\n" + news_content[3] + "\n" + news_content[4] + "\n";
            y = y + 2;
      }
      alert (news[0] + "\n" + news[1] + "\n" + news[2] + "\n" + news[3] + "\n" + news[4])
}

和该 html

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Unbenanntes Dokument</title>
<script src="test.js"></script>
</head>

<body>
<a href="page.html" onclick="getNews()">Hier klicken</a>
<iframe id="news" src="http://www.aerosoft-shop.com/list_news.php?cat=fs&lang=de">
</body>
</html>

最后，如果我将源代码粘贴到 html 文件中，它可以工作，但是没有办法从外部页面解析吗？

原文

Hi i at the momment try to parse some HTML news for our new fan page.
Caus the company do not offer a RSS Feed.

I got a new JS File with that included

function getNews() {
      y = 0;
      news = new Array(7);
      news_content = new Array(5);
      for (var i = 0; i < news.length; i++)
      {
            var table = document.getElementById('news').contentWindow.getElementsByTagName('table')[y];
            news_content[0] = table.rows[0].cells[0].getElementsByTagName('img')[0].src;
            news_content[1] = table.rows[0].cells[1].getElementsByTagName('span')[0].innerHTML;
            news_content[2] = table.rows[0].cells[2].getElementsByTagName('span')[0].innerHTML;
            news_content[3] = table.rows[1].cells[0].getElementsByTagName('p')[0].innerHTML;
            news_content[4] = table.rows[0].cells[0].getElementsByTagName('a')[0].href;
            //alert(news[0] + "\n" + news[1] + "\n" + news[2] + "\n" + news[3] + "\n" + news[4]);
            news[i] = news_content[0] + "\n" + news_content[1] + "\n" + news_content[2] + "\n" + news_content[3] + "\n" + news_content[4] + "\n";
            y = y + 2;
      }
      alert (news[0] + "\n" + news[1] + "\n" + news[2] + "\n" + news[3] + "\n" + news[4])
}

and that html

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Unbenanntes Dokument</title>
<script src="test.js"></script>
</head>

<body>
<a href="page.html" onclick="getNews()">Hier klicken</a>
<iframe id="news" src="http://www.aerosoft-shop.com/list_news.php?cat=fs&lang=de">
</body>
</html>

At last if i pase the source code into the html file it works but is there no way to parse from a external page?

分享到QQ

分享到微博