简介:
P站很多人不陌生了,声明是正规的P站(Pixiv),不是你们想的那个P站(这个我也有,哈哈哈)。
这里分享个萌咖写的爬虫脚本,基于Python3,可直接下载排行榜、画师的原图。无需登录,无需cookies,也不需要其它依赖,使用纯Python原生模块,支持多线程下载,支持过滤已下载。
截图:
使用:
Github地址:https://github.com/MoeClub/Pixiv
Windows为例:
安装Python:
下载地址:http://npm.taobao.org/mirrors/python/
如果pypi下载很慢:用清华大学的镜像辅助下载:
地址:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/
至于代码下载,这个不需要我来教吧,打开上面的Github地址,复制代码粘贴到记事本里,重命名xxx.py保存就好了!
运行说实话,也不需要什么pycharm之类的大型IDE,自带的IDLE就够了!
还有一点,比较困难,国内访问不了pixiv,代码写的再漂亮,也下载不下来。
- 一、租用境外的一台服务器做中转,就是下载好就直接与国内服务器通信,最后下载到本地。
- 二、使用代理,代理也是需要花钱的,现在的P站也不是说想进就想进的!
就简单来说,使用代理吧,毕竟这个时候,很多电脑上都会有代理软件。这个脚本,没有代理模块,我们需要自己去下载一个代理模块!
如果使用socks的话,socks在python3中不是自带的,所以需要通过pip install PySocks这个模块。这个镜像里面不敢保证会有,自己先在系统上尝试安装。
在头部,加入引用
import socket
import socks
......
socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5, "127.0.0.1", 1080)
socket.socket = socks.socksocket
这个是本地socks代理的演示,填写自己设定的端口号。如果本地没有代理,可以使用http协议通信都可以!本文章是以本地代理来演示的,放入以上代码,运行就好!
具体代码是怎么运行的,图片喜欢什么样的,那个画师的,自己根据代码酌情修改:
python3 pixiv.py "https://www.pixiv.net/ranking.php?mode=male" (male可以改为daily,weekly等吧,代表今日排行榜,一周排行榜)
举个栗子:
# By UserID(画师UID):
python3 pixiv.py "673179"
# By RankLink: (排行版,比如下面的图片...)
python3 pixiv.py "https://www.pixiv.net/ranking.php?mode=male"
就这样子了!很简单哦!