我正在尝试使用goquery解析时间表内容,以便稍后使用它。但我有一个问题。我有两个功能。第一个获取html文档并搜索令牌(csrfmiddlewaretoken),第二个使用此令牌发送请求并提取信息。完成从页面中提取所有必要的信息后,我搜索令牌以在将来的请求中使用它并存储它。但是由于某种原因,发现的令牌在到达时会变成空字符串。如果我在语句之前打印令牌的长度,它会打印以下内容:if len(foundCsrfToken) == 0 {...640...我已经摆脱了所有的戈鲁丁,以防万一这是问题。func findCsrfMiddlewareToken(responseBody io.Reader) (string, error) { document, err := goquery.NewDocumentFromReader(responseBody) if err != nil { return "", err } var foundCsrfToken string document.Find("script").Each(func(_ int, scrpt *goquery.Selection) { scriptText := scrpt.Text() if funcDefIndex := strings.Index(scriptText, "function Filter"); funcDefIndex != -1 { csrfTokenValueStart := strings.Index(scriptText, "csrfmiddlewaretoken: '") offset := csrfTokenValueStart + len("csrfmiddlewaretoken: '") foundCsrfToken = scriptText[offset : offset+csrfMiddlewareTokenLength] } }) if len(foundCsrfToken) == 0 { return "", errNoCsrfMiddlewareToken } return foundCsrfToken, nil}func (parser *TimetableParser) ParseTimetable(timetableFilterInfo internal.TimetableInfo) (internal.Timetable, error) { timetable := internal.Timetable{} requestBody := makeFormValues(timetableFilterInfo, parser.csrfMiddlewareToken).Encode() request, err := http.NewRequest("POST", baseUrl, strings.NewReader(requestBody)) if err != nil { return timetable, err } request.Header.Add("Content-Type", "application/x-www-form-urlencoded") request.Header.Add("Content-Length", strconv.Itoa(len(requestBody))) request.Header.Add("Referer", baseUrl) response, err := parser.client.Do(request) if err != nil { return timetable, err } defer response.Body.Close() document, err := goquery.NewDocumentFromReader(response.Body) if err != nil { return timetable, err }
1 回答
开心每一天1111
TA贡献1836条经验 获得超13个赞
我刚刚意识到出了什么问题。哎呀。读取器被视为流。因此,当我从中读取一次时,它变得空了。如您所见,在收集了所有必要的信息并读取响应之后,它被传递到第一个函数中。但它已经是空的了。当我第一次调用函数时,它像往常一样工作并打印令牌长度(64)。但是当我以空响应进入第二个调用时,它打印0。findCsrfMiddlewareToken
- 1 回答
- 0 关注
- 108 浏览
添加回答
举报
0/150
提交
取消