初学python,写了个小爬虫,是对贴吧的爬取,希望做到由已知发言内容得到用户名
用find_all()爬的含信息的div头。class属性是"l_post l_post_bright j_l_post clearfix",这个div的data-field里有用户id和发言的content。但是他中间会有很多很多别的标签,就想问下前辈们有没有什么方法可以简单的就取到最外面的标签。嗯,把中间的统统过滤掉!
添加回答
举报
0/150
提交
取消