基于Python3的Pixiv爬虫,可下载喜欢的画师,以及排行榜原图

简介:

P站很多人不陌生了,声明是正规的P站(Pixiv),不是你们想的那个P站(这个我也有,哈哈哈)。

这里分享个萌咖写的爬虫脚本,基于Python3,可直接下载排行榜、画师的原图。无需登录,无需cookies,也不需要其它依赖,使用纯Python原生模块,支持多线程下载,支持过滤已下载。

截图:

新鲜热乎的:

使用:

Github地址:https://github.com/MoeClub/Pixiv

Windows为例:

安装Python:

下载地址:http://npm.taobao.org/mirrors/python/

如果pypi下载很慢:用清华大学的镜像辅助下载:

地址:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/

清华大学开源软件镜像站

至于代码下载,这个不需要我来教吧,打开上面的Github地址,复制代码粘贴到记事本里,重命名xxx.py保存就好了!

运行说实话,也不需要什么pycharm之类的大型IDE,自带的IDLE就够了!

还有一点,比较困难,国内访问不了pixiv,代码写的再漂亮,也下载不下来。

  • 一、租用境外的一台服务器做中转,就是下载好就直接与国内服务器通信,最后下载到本地。
  • 二、使用代理,代理也是需要花钱的,现在的P站也不是说想进就想进的!

就简单来说,使用代理吧,毕竟这个时候,很多电脑上都会有代理软件。这个脚本,没有代理模块,我们需要自己去下载一个代理模块!

如果使用socks的话,socks在python3中不是自带的,所以需要通过pip install PySocks这个模块。这个镜像里面不敢保证会有,自己先在系统上尝试安装。

在头部,加入引用

import socket
import socks


......

socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5, "127.0.0.1", 1080)
socket.socket = socks.socksocket

这个是本地socks代理的演示,填写自己设定的端口号。如果本地没有代理,可以使用http协议通信都可以!本文章是以本地代理来演示的,放入以上代码,运行就好!

具体代码是怎么运行的,图片喜欢什么样的,那个画师的,自己根据代码酌情修改:

python3 pixiv.py "https://www.pixiv.net/ranking.php?mode=male" (male可以改为daily,weekly等吧,代表今日排行榜,一周排行榜)


举个栗子:
# By UserID(画师UID):    
python3 pixiv.py "673179"    
# By RankLink: (排行版,比如下面的图片...)   
python3 pixiv.py "https://www.pixiv.net/ranking.php?mode=male"    

就这样子了!很简单哦!

浊以静之徐清,安以动之徐生

你也可能喜欢

发表评论

插入图片
返回顶部

微信扫一扫

微信扫一扫