关于ZAKER 融媒体解决方案 合作 加入

python – BeautifulSoup 在

CocoaChina 10-21

这是我从这个Python代码行回来的东西

listm = soup.findAll ( 'td',{'class':'thumb'} )

当我遍历 listm 时 , 这是一个项目的例子……

<a href="/property-search/property-details/1021206?StrtNum=1507"><img alt="1507 BOSTWICK LN" src="/res/slir/w75-h57-c4:3/propertyimages/20120904/BB/DSCN0738.JPG"/></a>

但是 , 我真正想要的是 < img alt = 中的 "1507 BOSTWICK LN" 我试过 .get_text 并返回一个空白 , 我试过了

lista = soup.findAll ( ‘ td ’ ,{ ‘ class ’:’ thumb ’ },{ ‘ alt ’:’ img ’ } ) , 以及其他一些不能让我看到文字的变体 .

我想有 BeautifulSoup 返回文本 , 还是会正常表达工作?我对 RE 的了解是 zilch, 任何输入都会非常感激 !!

最佳答案

尝试这个:

listm = soup.findAll ( 'td',{'class':'thumb'} ) for elem in listm: print elem ( 'img' ) [ 0 ] [ 'alt' ]

这应该在每个 td 中找到 img 标签并打印 alt 属性的值 .

编辑:

你不应该假设存在 img 标签 . 改为:

listm = soup.findAll ( 'td',{'class':'thumb'} ) for elem in listm: imgs = elem ( 'img' ) if imgs: print imgs [ 'alt' ]

以上内容由"CocoaChina"上传发布 查看原文
相关标签 python变体

觉得文章不错,微信扫描分享好友

扫码分享