用户注册



邮箱:

密码:

用户登录


邮箱:

密码:
记住登录一个月忘记密码?

发表随想


还能输入:200字
云代码 - python代码库

python网络数据采集2 getName

2016-07-06 作者: ME80举报

[python]代码库

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen('http://www.pythonscraping.com/pages/warandpeace.html')

bsObj = BeautifulSoup(html)
nameList = bsObj.findAll('span',{'class':'green'}) # 将class是green的整个span标签及内容提取出来,
for name in nameList:
    # 会把你正在处理的HTML 文档中所有的标签都清除,然后返回
    # 一个只包含文字的字符串。假如你正在处理一个包含许多超链接、段落和标
    # 签的大段源代码,那么.get_text() 会把这些超链接、段落和标签都清除掉,
    # 只剩下一串不带标签的文字。
    print(name.get_text())

[代码运行效果截图]


python网络数据采集2 getName


网友评论    (发表评论)


发表评论:

评论须知:

  • 1、评论每次加2分,每天上限为30;
  • 2、请文明用语,共同创建干净的技术交流环境;
  • 3、若被发现提交非法信息,评论将会被删除,并且给予扣分处理,严重者给予封号处理;
  • 4、请勿发布广告信息或其他无关评论,否则将会删除评论并扣分,严重者给予封号处理。


扫码下载

加载中,请稍后...

输入口令后可复制整站源码

加载中,请稍后...