自学内容网 自学内容网

爬虫 //获取元素中的数据

 //    <!--jsoup解析工具所需依赖-->
//        <dependency>
//            <groupId>org.jsoup</groupId>
//            <artifactId>jsoup</artifactId>
//            <version>1.10.3</version>
//        </dependency>
//
//        <dependency>
//            <groupId>junit</groupId>
//            <artifactId>junit</artifactId>
//            <version>4.12</version>
//            <scope>test</scope>
//        </dependency>
//
//        <dependency>
//            <groupId>commons-io</groupId>
//            <artifactId>commons-io</artifactId>
//            <version>2.6</version>
//        </dependency>
//
//        <dependency>
//            <groupId>org.apache.commons</groupId>
//            <artifactId>commons-lang3</artifactId>
//            <version>3.7</version>
//        </dependency>

package day05;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import java.io.File;
import java.io.IOException;

public class CESHIDE {
    public static void main(String[] args) throws IOException {
        
     //获取元素中的数据
    //解析文件,获取Document
        Document parse = Jsoup.parse(new File("C:\\Users\\LX\\Desktop\\新建文本文档.txt"), "utf-8");
    //根据id获取元素doc.getElementById("test");
     //根据id获取元素
        Element test = parse.getElementById("mobileclient");
       //打印
//        System.out.println(test.id());

     //  从元素中获取className/12.str = element.className();

     //   获取元素class内容
//        String s = test.className();
//        System.out.println(s);

        //获取多个class提示内容 如果有多个的话
//        Set<String> strings = test.classNames();
//        for (String string : strings) {
//            System.out.println(string);
//        }

//        从元素中获取属性的值attr
        /*String id = test.attr("id");
        System.out.println(id);
        String id = test.attr("class");
        System.out.println(id);*/

//    从元素中获取所有属性
       /* Attributes attributes = test.attributes();
        System.out.println(attributes.toString());*/

//        从元素中获取文本内容 text
        String text = test.text();
        System.out.println(text);

    }
}


原文地址:https://blog.csdn.net/kuayueday/article/details/137973943

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!