我已经用 python 编写了一个脚本来从一大块 html 元素中提取地址。地址在几个br标签内。但是,当我运行我的脚本时,我将其[<br/>, <br/>, <br/>, <br/>]作为输出。我怎样才能得到完整的地址?我试图从以下位置收集地址的 html 元素:<div class="ACA_TabRow ACA_FLeft"> Mailing <br/> 1961 MAIN ST #186 <br/> WATSONVILLE, CA, 95076 <br/> United States <br/></div>到目前为止我已经尝试过:from bs4 import BeautifulSoupimport rehtml = """<div class="ACA_TabRow ACA_FLeft"> Mailing <br/> 1961 MAIN ST #186 <br/> WATSONVILLE, CA, 95076 <br/> United States <br/></div>"""soup = BeautifulSoup(html,"lxml")items = soup.find(class_="ACA_TabRow").find(string=re.compile("Mailing")).find_next_siblings()print(items)
添加回答
举报
0/150
提交
取消