3 回答

TA贡献1824条经验 获得超5个赞
在你的情况下tokens = {"Token": <last_token>}
像这样修改您的代码,以便可以为每个令牌发送一个请求。
tokens = set()
'''
<- You can use list also but in this case set is better as it will ensure only
one request for one token even if your tokens file contains duplicate line.
'''
url_list = [
"https://www.google.com/api/"
]
tokens = set()
with open("tokens.txt", "r") as f:
file_lines = f.readlines()
for line in file_lines:
tokens.add(line.strip())
token_data = {"Token": None}
def makerequest(url):
for token in tokens:
token_data["Token"] = token
html = requests.post(url,stream=True, data=token_data)
print(token)
# do something with html here
# don't return or break

TA贡献2019条经验 获得超9个赞
你在做
数据 = 令牌
那一点tokens
是最后一行的分配。如果你想要所有的令牌,你需要做一些像j这样的事情:
tokens = set() for line file_lines: tokens.add(......)

TA贡献1844条经验 获得超8个赞
您的代码的问题是令牌字典的创建 - 您循环提供令牌,但您总是覆盖映射到“令牌”键的值。
此外,您的代码中还有一些不良做法。
请像您一样小心内联打开文件
file_lines = open("tokens.txt", "r").readlines()
而是将其用作上下文管理器
with open("tokens.txt", "r") as file: file_lines = file.readlines()
这可以确保文件在您阅读后再次关闭 - 在您的情况下,您需要确保文件被关闭(即使在崩溃等情况下)
其次,避免在函数中使用全局变量。根据你的代码,我假设你想用每个标记查询不同的 url - 所以函数应该接受这两个作为参数。然后我会分别创建一个组合列表,比如
url_token_combs = [(url, token.strip()) for url in url_list for token in file_lines]
最后,更改您的功能以使用传递给它的参数而不是全局参数,例如:
def makerequest(url_token ): url , token = url_token html = requests.post(url,stream=True, data=token) return html.content
这使您现在可以使用以下线程遍历代码:
import requests
from concurrent.futures import ThreadPoolExecutor, as_completed
from time import time
def makerequest(url_token):
url , token = url_token
html = requests.post(url,stream=True, data=tokens)
print(tokens)
return html.content
if __name__ == "__main__":
start = time()
url_list = [
"https://www.google.com/api/"
]
with open("tokens.txt", "r") as file:
file_lines = file.readlines()
tokens = [{'Token':line.replace('/n','') }for line in file_lines ]
url_tokens = [(url, token.strip()) for url in url_list for token in tokens]
processes = []
with ThreadPoolExecutor(max_workers=200) as executor:
for url_token in url_tokens:
processes.append(executor.submit(makerequest, url_token))
for task in as_completed(processes):
print(task.result())
print(f'Time taken: {time() - start}')
添加回答
举报