URL类和URLConnection类的创建及用法。

一、代码实现

输出结果为:

至于这么多空白和null,主要是因为baidu不在本地主机上,无法获取绝对路径。

获取www.baidu.com页面的信息,然后输出。

页面通过流输出就变成了网页源文件了。浏览器通过编码,就能按照一定的规则把源文件变成我们平时看到的网页。

二、总结

可以实现简单的抓取网页的功能,也是爬虫的一项基本功能。

发表评论

电子邮件地址不会被公开。 必填项已用*标注