用户注册



邮箱:

密码:

用户登录


邮箱:

密码:
记住登录一个月忘记密码?

发表随想


还能输入:200字
云代码 - python代码库

python 用json形式从豆瓣抓取电影的排行,电影名称与分数

2016-07-12 作者:ME80举报

[python]代码库

from urllib.request import urlopen
import json
### 用json形式从豆瓣抓取电影的排行,通过审查元素找到看起来是json格式的链接

def get20Movie(url):
    html = urlopen(url)
    htmlJsonString = html.read()
    jsonObj = json.loads(htmlJsonString.decode()) # decode()很关键
    movieNameAndScores = []
    for each in jsonObj.get('subjects'):
        movieNameAndScores.append(each.get('title')+each.get('rate'))
        # print(each.get('title')+each.get('rate'))
    return movieNameAndScores

j = 0
while 1:
    movieNameAndScores = get20Movie('https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start='+str(j))
    for each in movieNameAndScores:
        print(each)
    j += 20

[代码运行效果截图]


python 用json形式从豆瓣抓取电影的排行,电影名称与分数


分享到:
更多

网友评论    (发表评论)

共1 条评论 1/1页

发表评论:

评论须知:

  • 1、评论每次加2分,每天上限为30;
  • 2、请文明用语,共同创建干净的技术交流环境;
  • 3、若被发现提交非法信息,评论将会被删除,并且给予扣分处理,严重者给予封号处理;
  • 4、请勿发布广告信息或其他无关评论,否则将会删除评论并扣分,严重者给予封号处理。