用node做爬虫，爬到一半的时候报错

如题，在爬到一部分到html内容后，node会在req中报错，提示为：HPE_INVALID_CONSTANT网上找了很多东西，都说是res的header中Content-Type设置为application/json , 但是我也打印了res.header, 它的Content-Type并不是这个，而是正确的text/html我用的是http模块中的http.get(url, callback()) 方法来实现的爬虫功能.问题代码如下：var http = require('http'); var req = https.get(url, function(res) { var html = ''; res.on('data', function(data){ // console.log('response.headers: '+res.headers); html += data; }); res.on('end', function(){ //此处html代码应该显示完整的html内容，但只打印出前一部分的内容。就连body和head的闭合标签都没有显示 console.log(html); }); }).on('error', function(err){ // console.log('request.headers: '+res.headers); console.log('获取文件出错。'+JSON.stringify(err)); });

查看完整描述

3 回答

_潇潇暮雨

TA贡献646条经验获得超225个赞

能上下完整的代码么？

1 反对回复 2016-04-29

root丶Dima

TA贡献1条经验获得超0个赞

出问题的代码如下：

var http = require('http');
var req = https.get(url, function(res) {
    var html = '';
    res.on('data', function(data){
        // console.log('response.headers: '+res.headers);
        html += data;
    });

    res.on('end', function(){
        //此处html代码应该显示完整的html内容，但只打印出前一部分的内容。就连body和head的闭合标签都没有显示
        console.log(html);
    });
}).on('error', function(err){
    // console.log('request.headers: '+res.headers);
    console.log('获取文件出错。'+JSON.stringify(err));
});

反对回复 2016-04-29

qq_Theonlymeani_0
http.get

回复 2016-05-06

热搜

最近搜索清空

用node做爬虫，爬到一半的时候报错

用node做爬虫，爬到一半的时候报错

3 回答

添加回答