<sup id="sjju3"><noscript id="sjju3"></noscript></sup>
    <big id="sjju3"></big>

  • <blockquote id="sjju3"></blockquote>
    <blockquote id="sjju3"></blockquote>

      <td id="sjju3"></td>

      <big id="sjju3"></big>
        <code id="sjju3"><strong id="sjju3"><dl id="sjju3"></dl></strong></code>
      1. 基于node.js实现爬虫的讲解

         更新时间:2019年02月18日 16:49:09   作者:Inside_Zhang   我要评论

        今天小编就为大家分享一篇关于基于node.js实现爬虫的讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧

        1. cheerio 与 request

        • request:模拟客户端行为,对页面进行请求
        • cheerio:对服务器端返回的页面进行解析;
        var cheerio = require('cheerio');
        var request = require('request');
        var startUrl = 'http://www.baidu.com'
        request(startUrl, function(err, response) {
          if (err) {
            console.log(err);
          }
          var $ = cheerio.load(response.body);
          var title = $('title').text();
          console.log(title);
        }

        2. 认识 cheerio

        获取 element 位置

        通过 class 属性进行匹配:

        var $=cheerio.load('<div class="container"></div>'); 
        $('.container')

        取其链接:<a class="downbtn" href="http://mov.bn.netease.com/mobilev/2013/1/F/G/S8KTEF7FG.mp4" id="M8KTEKR84" target="_blank"></a>

        $('a.downbtn').attr('href')

        某一页面下的全部可链接:

        var url = 
        var $ = cheerio.load(data);
          $("a.downbtn").each(function(i, e) {
            console.log($(e).attr("href"));
          });
          console.log("done");
         } else {
           console.log("error");
         } 

        总结

        以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

      2. 详解nodejs通过代理(proxy)发送http请求(request)

        详解nodejs通过代理(proxy)发送http请求(request)

        本篇文章主要介绍了nodejs通过代理(proxy)发送http请求(request),具有一定的参考价值,有兴趣的可以了解一下
        2017-09-09
      3. Koa日志中间件封装开发详解

        Koa日志中间件封装开发详解

        这篇文章主要介绍了Koa日志中间件封装开发详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
        2019-03-03
      4. node.js开机自启动脚本文件

        node.js开机自启动脚本文件

        这篇文章主要介绍了node.js开机自启动脚本文件的方法和代码,这里分享给大家,有需要的小伙伴参考下吧
        2014-12-12
      5. node.js用fs.rename强制重命名或移动文件夹的方法

        node.js用fs.rename强制重命名或移动文件夹的方法

        本篇文章主要介绍了node.js用fs.rename强制重命名或移动文件夹的方法,具有一定的参考价值,?#34892;?#36259;的小伙伴们可以参?#23478;?#19979;
        2017-12-12
      6. Nodejs使用Mongodb存储与提供后端CRD服务详解

        Nodejs使用Mongodb存储与提供后端CRD服务详解

        这篇文章主要给大家介绍了关于Nodejs使用Mongodb存储与提供后端CRD服务的相关资?#24076;?#25991;中通过示例代码介绍的非常详细,对大家的学习或工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
        2018-09-09
      7. Node.js中使用Buffer编码、解码二进制数据详解

        Node.js中使用Buffer编码、解码二进制数据详解

        这篇文章主要介绍了Node.js中使用Buffer编码、解码二进制数据详解,Buffer支持ascii、utf8、ucs2、base64等编码格式,需要的朋友可以参考下
        2014-08-08
      8. 手把手教你用Node.js爬虫爬取网站数据的方法

        手把手教你用Node.js爬虫爬取网站数据的方法

        这篇文章主要介绍了手把手教你用Node.js爬虫爬取网站数据,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
        2018-07-07
      9. 最新评论

        常用在线小工具

        2018白小姐一肖中特马
        <sup id="sjju3"><noscript id="sjju3"></noscript></sup>
        <big id="sjju3"></big>

      10. <blockquote id="sjju3"></blockquote>
        <blockquote id="sjju3"></blockquote>

          <td id="sjju3"></td>

          <big id="sjju3"></big>
            <code id="sjju3"><strong id="sjju3"><dl id="sjju3"></dl></strong></code>
          1. <sup id="sjju3"><noscript id="sjju3"></noscript></sup>
            <big id="sjju3"></big>

          2. <blockquote id="sjju3"></blockquote>
            <blockquote id="sjju3"></blockquote>

              <td id="sjju3"></td>

              <big id="sjju3"></big>
                <code id="sjju3"><strong id="sjju3"><dl id="sjju3"></dl></strong></code>