用户注册



邮箱:

密码:

用户登录


邮箱:

密码:
记住登录一个月忘记密码?

发表随想


还能输入:200字
云代码 - python代码库

使用requests库和pyquery库获取百度热点并将获取的内容并导出为文件

2022-09-22 作者: 啦啦啦啦啦啦啦啦啦举报

[python]代码库

#引入我们的requests库
import requests
#引入我们的pyquery库
from pyquery import PyQuery as pq
#获取我们的请求头
headers = {
       "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36 Edg/105.0.1343.42"
    }
#获取到我们的百度的链接
url = "https://www.baidu.com/"
#使用我们requests库当中的get当中,我们当中的参数是url和headers
r=requests.get(url,headers=headers)
#这一行是用来检查我们的状态码的
r.raise_for_status()
#这一行是用来将我们的文章的语言编码统一
r.encoding=r.apparent_encoding
#让我们的内容等于demo
demo = r.text
doc = pq(demo)
i = 1#计数用
for inf in doc.find('.title-content-title').items():
    # print(inf)
    d = pq(inf)
    # print(d("a"))
    p = d("span")
    # span标签里面的内容
    v=p.text()
    # span标签的父亲所有内容
    w=p.parent()
    # 网站链接
    q=w.attr.href
    print(q)
    with open('i:/作业.txt', 'a', encoding=r.apparent_encoding) as f:
        f.write(str(i) + '.')
        f.write(v)
        f.write(q)
        f.write('\n')  # 写入
    i += 1










网友评论    (发表评论)


发表评论:

评论须知:

  • 1、评论每次加2分,每天上限为30;
  • 2、请文明用语,共同创建干净的技术交流环境;
  • 3、若被发现提交非法信息,评论将会被删除,并且给予扣分处理,严重者给予封号处理;
  • 4、请勿发布广告信息或其他无关评论,否则将会删除评论并扣分,严重者给予封号处理。


扫码下载

加载中,请稍后...

输入口令后可复制整站源码

加载中,请稍后...