用户注册



邮箱:

密码:

用户登录


邮箱:

密码:
记住登录一个月忘记密码?

发表随想


还能输入:200字
云代码 - python代码库

取百度看点内容

2020-04-01 作者: 雨沫初婴举报

[python]代码库

import urllib.request#导入模块,用于网页访问
import re#导入文本正则模块,用于取中间文本
#获取网页源码
url = 'https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9958850143698636667%22%7D&n_type=0&p_from=1'#要访问的网页
a=urllib.request.urlopen(url)#打开网页
html = a.read()#获取网页源码
html = html.decode()#编码转换
#取文本标题
title = re.compile("<title>"+"(.*?)"+"</title>",re.S ).findall(html)#取中间文本 用于取中间的文本,得到集合
print ("标题:",title[0])#获取集合第一个元素
#获取作者名称
title = re.compile('<p class="author-name">'+"(.*?)"+'</p><div class="article-source',re.S ).findall(html)#取中间文本 用于取中间的文本,得到集合
print ("作者:",title[0])#获取集合第一个元素
#获取正文
titles=re.compile('<span class="bjh-p">'+"(.*?)"+'</span></p><p>',re.S ).findall(html)#取中间文本 用于取中间的文本,得到集合
for title in titles :
    print (title)#获取集合所有元素


网友评论    (发表评论)


发表评论:

评论须知:

  • 1、评论每次加2分,每天上限为30;
  • 2、请文明用语,共同创建干净的技术交流环境;
  • 3、若被发现提交非法信息,评论将会被删除,并且给予扣分处理,严重者给予封号处理;
  • 4、请勿发布广告信息或其他无关评论,否则将会删除评论并扣分,严重者给予封号处理。


扫码下载

加载中,请稍后...

输入口令后可复制整站源码

加载中,请稍后...