python爬虫下载文件

有时候大家遇到很多喜欢的图片或者音乐，想下载下来。但是一个个点多麻烦，要是能用爬虫下载下来就方便了。今天我们先来学习一下怎么在已有url的情况下下载文件。这也是批量下载的第一步。
下载东西和访问网页差不多,这里以下载我以前做的一个安卓小游戏为例
地址为:http://hjwachhy.site/game/only_v1.1.1.apk

首先下载到内存

# coding: UTF-8
import requests
url="http://hjwachhy.site/game/only_v1.1.1.apk"
r=requests.get(url)
print ("ok")
print len(r.content)

这里是下载到内存,由于是二进制.所以是不能输出text的，requests.content返回的是二进制响应内容。len函数得到它的大小。

保存文件

# coding: UTF-8
import requests
url="http://hjwachhy.site/game/only_v1.1.1.apk"
path="only.apk"
r=requests.get(url)
print("ok")
with open(path,"wb") as f:
	f.write(r.content)
f.close()

这里是保存到代码目录了,文件名为only.apk

然后看一下文件夹

下载成功了!

下首歌听听

写了这么久代码,是时候放松一下了,让我们来下载一首歌听听。只要修改上面代码的url和path变量就行了。
如下：

# coding: UTF-8
import requests
url="http://hjwachhy.site/music.mp3"
path="music.mp3"
r=requests.get(url)
print ("ok")
with open(path,"wb") as f:
	f.write(r.content)
f.close()

好了，现在可以打开文件夹听下音乐了。
在以后的内容里，我会写关于批量获取url的内容，这样结合这里的下载文件内容。就能一次性下载很多东西了。

本文作者： philhuan

本文链接： http://hjwblog.com/archives/python爬虫下载文件

版权声明： 本博客所有文章除特别声明外，均采用CC BY-NC-SA 3.0 许可协议。转载请注明出处！