用户注册

用户登录

发表随想

该用户最新代码

More...

10/8750

爬虫抓取王者荣耀所有英雄皮肤高清壁纸+超强注释

编程随想

AI时代，找源码已成为过去式，纪念我过去的十年 by Python自学0(回) 137天前

还有人吗 by 高嘉易2(回) 154天前

会python真的可以为所欲为 by Python自学0(回) 634天前

这里还有人吗 by mikeKil2(回) 819天前

这里还有人吗 by mikeKil0(回) 819天前

每天面对着电脑屏幕，敲打键盘。我所面对的并不只是代码，而是一种生活方式。 by js特效0(回) 1044天前

云代码 - python代码库

爬虫抓取王者荣耀所有英雄皮肤高清壁纸+超强注释

2020-04-11 作者：云代码会员举报

[python]代码库

import urllib.request
import re
 
# 获取主页源码
url = 'https://pvp.qq.com/web201605/herolist.shtml'
a = urllib.request.urlopen(url)  # 访问网页
a = a.read()  # 读取源码
a = a.decode('gbk')  # 转码为gbk
# 获取英雄名称和ID
a = (re.compile('输入英雄不存在，请重新输入' + "(.*?)" + '英雄介绍', re.S).findall(a))[0]  # 取主要源码
id = re.compile('<li><a href="herodetail/' + '(.*?)' + '.shtml"', re.S).findall(a)  # 取id
name = re.compile('height="91" alt="' + '(.*?)' + '">').findall(a)  # 取名字
print('本次共抓取到' + str(len(id)) + '个英雄数据')
# 询问保存路径
r = True
while r:
    f = input('请输入想要保存的路径：')
    if f == '':
        print('不能为空')
    if f != '':
        r = False
 
# i
i = 0
for i in range(0, len(id) + 1):  # 对列表位置进行循环
    print('正在下载' + name[i])
    url1 = 'https://pvp.qq.com/web201605/herodetail/' + id[i] + '.shtml'  # 英雄主页网址
    url1 = ((urllib.request.urlopen(url1)).read()).decode('gbk')  # 获取源码，并且转码为gbk
    pf = re.compile('data-imgname="' + '(.*?)' + '">', re.S).findall(url1)  # 取出皮肤名字
    pf = pf[0]
    """删除沉余字符"""
    pf = pf.replace('&', '', )
    pf = pf.replace('0', '', )
    pf = pf.replace('1', '', )
    pf = pf.replace('2', '', )
    pf = pf.replace('3', '', )
    pf = pf.replace('4', '', )
    pf = pf.replace('5', '', )
    pf = pf.replace('6', '', )
    pf = pf.replace('7', '', )
    pf = pf.replace('8', '', )
    pf = pf.replace('9', '', )
 
    pf = pf.split('|')#文本分割
    print(pf)
 
    for i1 in range(0, len(pf)):  # 对皮肤列表进行循环
        print(name[i] + '-' + pf[i1])
        url2 = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + id[i] + '/' + id[i] + '-bigskin-' + str(
            i1 + 1) + '.jpg'  # 皮肤下载地址
        urllib.request.urlretrieve(url2, f + '/' + name[i] + '-' + pf[i1] + '.jpg')  # 下载

网友评论 (发表评论)

初级程序员
by: 20071016 发表于：2020-04-21 10:30:36 顶(0) | 踩(0) 回复
好厉害
回复评论

还能输入：1000字
初级程序员
by: 云代码会员发表于：2020-07-02 11:25:59 顶(0) | 踩(0) 回复
很厉害, 不过循环那里好像不用 + 1, 会报下标越界的错误
回复评论

还能输入：1000字
初级程序员
by: 云代码会员发表于：2020-09-11 21:28:05 顶(0) | 踩(1) 回复
回复评论

还能输入：1000字
初级程序员
by: guojiayu 发表于：2020-09-18 14:36:47 顶(0) | 踩(0) 回复
怎么使用呢
回复评论

还能输入：1000字

中级程序员

by: IM标神发表于：2020-10-20 17:19:18 顶(1) | 踩(0) 回复

页面使用了动态读取json英雄数据，英雄不全。下面是我优化的。

import urllib.request import json import os import re # 皮肤下载地址 skin_link = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' # 英雄主页 hero_link = 'https://pvp.qq.com/web201605/herodetail/' # 英雄数据文件 json_link = 'https://pvp.qq.com/web201605/js/herolist.json' # 载入英雄数据 json_data = urllib.request.urlopen(json_link) # 获取英雄列表 hero_list = json.loads(json_data.read().decode('utf-8')) # 显示英雄数量 print('本次共抓取到' + str(len(hero_list)) + '个英雄数据') # 询问保存路径 r = True while r:
    des_dir = input('请输入想要保存的路径：') if des_dir == '': print('不能为空') if des_dir != '': if not os.path.exists(des_dir):
            os.mkdir(des_dir)
        r = False  for hero in hero_list:
    hero_name = hero['cname']
    ename = str(hero['ename']) print('正在下载' + hero_name) # 不使用直接读取json文件的皮肤数据原因是，官方的json文件里面的英雄皮肤写的不全  # skin_name = hero['skin_name']  # if not skin_name:  #     skin_name = hero['skin_title']  # pf = skin_name.split('|')  # 文本分割   url1 = hero_link + ename + '.shtml' # 英雄主页网址  url1 = ((urllib.request.urlopen(url1)).read()).decode('gbk') # 获取源码，并且转码为gbk  pf = re.compile('data-imgname="' + '(.*?)' + '">', re.S).findall(url1) # 取出皮肤名字  pf = pf[0] """删除沉余字符"""  pf = pf.replace('&', '', )
    pf = pf.replace('0', '', )
    pf = pf.replace('1', '', )
    pf = pf.replace('2', '', )
    pf = pf.replace('3', '', )
    pf = pf.replace('4', '', )
    pf = pf.replace('5', '', )
    pf = pf.replace('6', '', )
    pf = pf.replace('7', '', )
    pf = pf.replace('8', '', )
    pf = pf.replace('9', '', )

    pf = pf.split('|') # 文本分割   print(pf) for i1 in range(0, len(pf)): print(hero_name + '-' + pf[i1]) # 皮肤图片下载地址  img_url = skin_link + ename + '/' + ename + '-bigskin-' + str(i1 + 1) + '.jpg'  # 皮肤保存路径  skin_dir = des_dir + '/' + hero_name if not os.path.exists(skin_dir):
            os.mkdir(skin_dir)
        urllib.request.urlretrieve(img_url, des_dir + '/' + hero_name + '/' + hero_name + '-' + pf[i1] + '.jpg') # 下载

回复评论

初级程序员
by: 云代码会员发表于：2021-04-02 16:57:18 顶(0) | 踩(0) 回复
66
回复评论

还能输入：1000字
初级程序员
by: 云代码会员发表于：2021-04-02 16:58:23 顶(0) | 踩(0) 回复
66
回复评论

还能输入：1000字
初级程序员
by: 1爱python的小龙发表于：2021-11-16 09:54:18 顶(0) | 踩(0) 回复
66
回复评论

还能输入：1000字
初级程序员
by: shuaibi 发表于：2021-11-28 22:54:20 顶(0) | 踩(0) 回复
666
回复评论

还能输入：1000字
初级程序员
by: 小白大师发表于：2022-03-20 14:36:47 顶(0) | 踩(0) 回复
代码敲完怎么把所有的英雄皮肤都放在游戏里呢？
回复评论

还能输入：1000字

共10 条评论 1/1页

发表评论：

评论须知：

1、评论每次加2分，每天上限为30；
2、请文明用语，共同创建干净的技术交流环境；
3、若被发现提交非法信息，评论将会被删除，并且给予扣分处理，严重者给予封号处理；
4、请勿发布广告信息或其他无关评论，否则将会删除评论并扣分，严重者给予封号处理。

用户注册

用户登录

发表随想

该用户最新代码

编程随想

爬虫抓取王者荣耀所有英雄皮肤高清壁纸+超强注释

[python]代码库

网友评论 (发表评论)

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

发表评论：

评论须知：

扫码下载

输入口令后可复制整站源码

用户注册

用户登录

发表随想

该用户最新代码

编程随想

爬虫 抓取王者荣耀所有英雄皮肤高清壁纸+超强注释

[python]代码库

网友评论 (发表评论)

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

回复评论

发表评论：

评论须知：

扫码下载

输入口令后可复制整站源码

爬虫抓取王者荣耀所有英雄皮肤高清壁纸+超强注释