标签: 爬虫

1 篇文章

python爬虫小案例—爬取豆瓣帖子下方评论的邮箱
python爬虫小案例—爬取豆瓣帖子下方评论的邮箱 一、思路: 使用request模块请求网页,使用bs4对所获得网页以lxml格式进行解析,在解析得到的结果中查找特定分类的html标签即attrs={'class': 'reply-doc'}),然后对得到的结果进行循环,使用邮箱格式的正则表达式re.search("\w+@\w+.\w+", c…