频道导航

nodejs实现爬取网站图片功能

2019-01-04 Node.js 前端之家

前端之家收集整理的这篇文章主要介绍了nodejs实现爬取网站图片功能，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

通过实例给大家讲解nodejs实现爬取网站图片功能，以下就是全部内容：

原理：

爬虫是最明显的IO密集型应用场景，显然用node，使得I/O等待开销小数据挖掘比较方便

借助express模块来搭建node服务

并使用request模块获取目标页面的HTML代码

下载cheerio模块对HTML代码做处理(cheerio类似jQuery的语法，所以好用又方便)

环境配置：

(1)引入各个模块

文件 var url = 'https://movie.douban.com/cinema/nowplaying/beijing/' //定义要爬的页面

(2)发送请求

中文乱码 res.on('data',function(chunk){ html += chrunk; //监听data事件每次取一块数据 }) res.on('end',function(){ var $ = cheerio.load(html); //获取数据完成后，解析html //将获取的图片存到images文件夹中 $('.mod-bd img').each(function(index,item){ //获取图片属性 var imgName = $(this).parent().next().text().trimg() var imgfile = imgName + '.jpeg'; var imgSrc = $(this).attr('src') //采用request模块，向服务器发起请求获取图片资源 request.head(imgSrc,function(error,res,body){ if(error){ console.log('失败了') } }); //通过管道的方式用fs模块将图片写到本地的images文件下 request(imgSrc).pipe.(fs.createWriteStream('./images/' + imgfile)); })

})
})

原文链接：https://www.f2er.com/nodejs/34697.html

nodejs nodejs nodejs 爬取网站图片

上一篇：NodeJs form-data格式传输文件的方下一篇：NodeJS爬虫实例之糗事百科

猜你在找的Node.js相关文章

[javascript] typescript的安装

现在的js代码都是这种高级点的方式语法，就是ts语法，要使用ts语法那就要先安装一下先...

作者：前端之家时间：2021-02-05

node版本管理工具nvm

nvm是node版本管理工具为了解决node各种版本存在不兼容现象 nvm是让你在同一台机器上安装...

作者：前端之家时间：2020-12-29

node起一个简单服务，打开本地项目或文件浏览

1、安装nodejs 2、在项目文件夹目录下创建一个js文件，命名server.js(自定义名称),内容如下...

作者：前端之家时间：2020-12-29

path的join和resolve的使用区别

1.连接路径：path.join([path1][, path2][, ...]) path.join()方法可以连接任意多个路径字...

作者：前端之家时间：2020-12-29

nodejs与javascript中的aes加密

简介 1.aes加密简单来说，在密码学中又称Rijndael加密法，是美国联邦政府采用的一种区块加...

作者：前端之家时间：2020-12-23

带你玩转七牛云存储——高级篇

七牛云图片存储优点 1. 支持各种尺寸的图片缩放； 2. 支持图片自动压缩； 3. 支持水印添加...

作者：前端之家时间：2020-12-23

VueJs生产环境部署

VueJs为客户端语言，所以部署的时候是不需要基于nodejs或其他服务器运行环境，只需要像其他...

作者：前端之家时间：2020-12-23

vuejs深入浅出—基础篇

一、从HelloWorld说起任何语言的都是从Hello World开始的，VueJs也不例外，直接上代码： ...

作者：前端之家时间：2020-12-23

你必须知道的session与cookie

Session本质提到Session我们能联想到的就是用户登录功能，而本身我们使用Session的基础是...

作者：前端之家时间：2020-12-23

es6新特性分享

1、字符串查找es5使用是indexOf() 返回字符第一次出现的位置int值es6新增了3个方法：inclu...

作者：前端之家时间：2020-12-23

最新文章