在这种情况下,我该如何进行网络刮擦?

发布于 2025-02-08 12:30:08 字数 1620 浏览 1 评论 0原文

我正在尝试从 https://in-the-sky.org/data/object.php?id=A216& day = 17 = 17& month = 6& yyear=2022

://i.sstatic.net/hnaz4.png“ alt =”这是我要废除的部分>

所以我写了一个代码

import java.util.Iterator;
import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;



public class Main {
public static void main(String args[]) {

    int num = 216;
    int day = 17;
    int month = 6;
    int year = 2022;
    String url ="https://in-the-sky.org/data/object.php?id=A"+Integer.toString(num)+"&day="+Integer.toString(day)+"&month="+Integer.toString(month)+"&year="+Integer.toString(year);
    System.out.println(url);
    Document doc = null;
    
    try {
    
        doc = Jsoup.connect(url).get();
    
    } catch (Exception e) {
    
        // TODO: handle exception
        e.printStackTrace();
    
    }
    
    System.out.println("=======================================================");
    
    Elements element = doc.select("div.col-md-6 col-md-pull-6");  
    String output = element.select("p").text();
    System.out.println(output);
    
    
    System.out.println("=======================================================");
    
}
}

,但效果不佳。我希望有人帮我

i am trying to scrap text from https://in-the-sky.org/data/object.php?id=A216&day=17&month=6&year=2022
this is how the html of the part i want to scrap lookes like

this is the part i want to scrap

so i wrote a code like

import java.util.Iterator;
import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;



public class Main {
public static void main(String args[]) {

    int num = 216;
    int day = 17;
    int month = 6;
    int year = 2022;
    String url ="https://in-the-sky.org/data/object.php?id=A"+Integer.toString(num)+"&day="+Integer.toString(day)+"&month="+Integer.toString(month)+"&year="+Integer.toString(year);
    System.out.println(url);
    Document doc = null;
    
    try {
    
        doc = Jsoup.connect(url).get();
    
    } catch (Exception e) {
    
        // TODO: handle exception
        e.printStackTrace();
    
    }
    
    System.out.println("=======================================================");
    
    Elements element = doc.select("div.col-md-6 col-md-pull-6");  
    String output = element.select("p").text();
    System.out.println(output);
    
    
    System.out.println("=======================================================");
    
}
}

but it doesnt work well. i would like someone to help me please

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

怪我入戏太深 2025-02-15 12:30:08

我相信您可以使用elements elements = doc.Select(“ div.col-md-6> p”);获取所需的输出。

I believe that you can use Elements element = doc.select("div.col-md-6 > p"); to get your desired output.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文