第十章

基本使用

使用 urllib2 模块可以轻松抓取页面的源代码。主要用到两个函数:

  • urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])
  • urllib2.urlopen(url[, data][, timeout])

例如抓取 so.com 的源代码: