PHP cURL 获取明文

发布于 2024-10-20 01:41:28 字数 180 浏览 2 评论 0原文

我在 PHP 中使用 cURL 来获取网页内容,效果很好。但我的程序现在要求我仅从目标站点获取纯文本,而不是 HTML。我对此进行了广泛的研究,但似乎没有人能给出答案。我还尝试在 cURL 选项中设置 CURLOPT_TRANSFERTEXT=1 ,但这似乎对结果没有影响。

知道为什么会发生这种情况吗?

I'm using cURL in PHP to get webpage content and it's working great. But my program now requires me to get only plain-text from the target site, instead of HTML. I've looked extensively for this but no one seems to have the answer. I've also tried setting CURLOPT_TRANSFERTEXT=1 in my cURL options, but this seems to have no effect on the results.

Any idea why this is happening?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

新雨望断虹 2024-10-27 01:41:28

确保满足以下条件:

curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);

curl_exec 的返回值应该是数据。

Make sure you have the following:

curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);

The return value of curl_exec should then be the data.

忆伤 2024-10-27 01:41:28

我认为这就是您正在寻找的:

<?
$address = file_get_contents('http://www.thesite.com/file.html');
echo $address;



$file = file_get_contents('./file.txt', true);

 or 

$file = file_get_contents('./file.txt', FILE_USE_INCLUDE_PATH);

?>

I think it is what you are looking for:

<?
$address = file_get_contents('http://www.thesite.com/file.html');
echo $address;



$file = file_get_contents('./file.txt', true);

 or 

$file = file_get_contents('./file.txt', FILE_USE_INCLUDE_PATH);

?>
甲如呢乙后呢 2024-10-27 01:41:28

实际上我确实喜欢这样来获取另一个页面的内容。

<?php
function curl_get_file_contents($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }


echo curl_get_file_contents("http://www.php.net");
?>

但它返回给我全部内容。

Actually I do like this to get the content of another page.

<?php
function curl_get_file_contents($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }


echo curl_get_file_contents("http://www.php.net");
?>

But it returns to me the whole content.

溇涏 2024-10-27 01:41:28

您的意思是要去掉页面上的所有 HTML 标签吗?

只需使用 strip_tags() 函数即可。

Do you mean that you want to strip off all the HTML tags on the page?

Simply use the strip_tags() function.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文