• 名称:Python网络爬虫与信息提取-北京理工大学
  • 分类:程序设计
  • 观看人数:加载中...
  • 时间:2019-02-11 14:39
Python作为一门脚本语言,它灵活、易用、易学、适用场景多,实现程序快捷便当,早已经成为程序员们的一门编程利器。从小到办事器运维的脚本,到大型软件开发,使用python都能够很灵活的快速实现。python不单可以快速实现大型的web应用程序,在网络层的开发,以及工程计算、数学计算上都有便利的开发手段。Map&Reduce思想在python里面也有着非常便利的实现。甚至在一些嵌入式设备上,你也可以实现本身的python应用。诸如著名的云计算框架openstack之类很多编程应用,都能见到python的身影。
        网络爬虫(Web Spider),是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。