该用户最新代码

More...

5/8134

爬虫api调用输入网易云音乐或歌单地址下载vip歌曲

1/2983

爬虫抓取王者荣耀所有英雄皮肤高清壁纸+超强注释

编程随想

会python真的可以为所欲为 by Python自学0(回) 449天前

这里还有人吗 by mikeKil1(回) 634天前

这里还有人吗 by mikeKil0(回) 634天前

每天面对着电脑屏幕，敲打键盘。我所面对的并不只是代码，而是一种生活方式。 by js特效0(回) 859天前

到处都是羊，不想上班 by Python自学0(回) 939天前

鸽子 by 张书娥0(回) 943天前

云代码 - python代码库

取百度看点内容

2020-04-01 作者：雨沫初婴举报

[python]代码库

import urllib.request#导入模块，用于网页访问
import re#导入文本正则模块，用于取中间文本
#获取网页源码
url = 'https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9958850143698636667%22%7D&n_type=0&p_from=1'#要访问的网页
a=urllib.request.urlopen(url)#打开网页
html = a.read()#获取网页源码
html = html.decode()#编码转换
#取文本标题
title = re.compile("<title>"+"(.*?)"+"</title>",re.S ).findall(html)#取中间文本 用于取中间的文本，得到集合
print ("标题:",title[0])#获取集合第一个元素
#获取作者名称
title = re.compile('<p class="author-name">'+"(.*?)"+'</p><div class="article-source',re.S ).findall(html)#取中间文本 用于取中间的文本，得到集合
print ("作者:",title[0])#获取集合第一个元素
#获取正文
titles=re.compile('<span class="bjh-p">'+"(.*?)"+'</span></p><p>',re.S ).findall(html)#取中间文本 用于取中间的文本，得到集合
for title in titles :
    print (title)#获取集合所有元素

网友评论 (发表评论)

暂无评论 (抢沙发)

发表评论：

评论须知：

1、评论每次加2分，每天上限为30；
2、请文明用语，共同创建干净的技术交流环境；
3、若被发现提交非法信息，评论将会被删除，并且给予扣分处理，严重者给予封号处理；
4、请勿发布广告信息或其他无关评论，否则将会删除评论并扣分，严重者给予封号处理。

用户注册

用户登录

发表随想

该用户最新代码

编程随想

取百度看点内容

[python]代码库

网友评论 (发表评论)

发表评论：

评论须知：

扫码下载

输入口令后可复制整站源码