首页猿问 Python...

Python BeautifulSoup：如何从 <td>TEXT</td> 获取文本

Python

白衣染霜花 2023-12-08 17:12:53

我不知道如何从这个标签获取文本和数字<td>THERE IS TEXT I WANT TO GET</td>，并且还有“数量”<td>QUANTITY</td>link:https://bscscan.com/tokenholdings?a=0x00a2c3d755c21bc837a3ca9a32279275eae9e3d6 有我想要得到的图像。提前致谢

查看完整描述

3 回答

三国纷争

TA贡献1804条经验获得超7个赞

网站中的表格是动态加载的，因此您无法使用requests. 你必须使用selenium才能做到这一点。这是完整的代码：

from bs4 import BeautifulSoup

from selenium import webdriver

import time

import pandas as pd

url = 'https://bscscan.com/tokenholdings?a=0x00a2c3d755c21bc837a3ca9a32279275eae9e3d6'

driver = webdriver.Chrome()

driver.get(url)

time.sleep(5)

html = driver.page_source

driver.close()

soup = BeautifulSoup(html,'html5lib')

tbody = soup.find('tbody', id = "tb1")

tr_tags = tbody.find_all('tr')

symbols = []

quantities = []

for tr in tr_tags:

td_tags = tr.find_all('td')

symbols.append(td_tags[2].text)

quantities.append(td_tags[3].text)

df = pd.DataFrame((symbols,quantities))

df = df.T

df.columns = ['Symbol','Quantity']

print(df)

输出：

Symbol Quantity

0 BNB 17.98420742

1 Cake 19.76899295

2 ANY 1

3 FREE 1,502

4 LFI 326.87340092

5 LFI 326.87340092

反对回复 2023-12-08

宝慕林4294392

TA贡献2021条经验获得超8个赞

我推荐一个非常好的工具，叫做 re，你可以从两个子字符串中搜索特定的字符串，例如

import re

s = ''<td>THERE IS TEXT I WANT TO GET</td>"

result = re.search('<td>(.*)</td>', s)

print(result.group(1))

反对回复 2023-12-08

慕妹3242003

TA贡献1824条经验获得超6个赞

>>> html="<td>THERE IS TEXT I WANT TO GET</td>\n<td>THERE IS TEXT I WANT TO GET</td>\n<td>THERE IS TEXT I WANT TO GET</td>\n<td>THERE IS TEXT I WANT TO GET</td>"

>>> soup = BeautifulSoup(html)

>>> for td in soup.find_all('td'): print(td.text)

反对回复 2023-12-08

3 回答
0 关注
341 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

Python BeautifulSoup：如何从 <td>TEXT</td> 获取文本

Python BeautifulSoup：如何从 <td>TEXT</td> 获取文本

3 回答

添加回答