1. 秦子帅的博客首页
  2. Python

Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

点击标题下「蓝色微信名」可快速关注

前言

前两节我们讲了Selenium的安装配置和基本用法,不熟悉的朋友可以去看一看:

Selenium的安装与Firefox配置

Python-selenium各种用法详解(元素拖拽,页面切换等)

今天我们巩固一下前面学过的知识,通过Selenium+Firefox实现模拟浏览器并自动翻页,爬取图片并写入本地文件中。

以搜索“女装”为例,自动爬取“女装”展示页面的前五页图片信息,先看一下爬取到的图片:

Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

 

运行后浏览器的显示效果(我只截取了一部分):

Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

 

本文学习要点:

  • 掌握selenium+Firefox的常见用法

  • Selenium下拉滚动+翻页

  • 会在浏览器上查看审查元素(浏览器右键–>检查)

    例如我们定位搜索框:

Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

  • xpath语法

  • 图片写入本地文件

实战

直接上源码:

希望对大家有所帮助!

推荐阅读:

Python-selenium各种用法详解(元素拖拽,页面切换等)

Selenium的安装与Firefox配置

Python如何生成词云(详解)


Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

原文始发于微信公众号( 扎心了Python ):Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

发布者:秦子帅,转转请注明出处:http://qinzishuai.cn/index.php/2018/05/28/fd1bd6e078/

联系我们

912241847

在线咨询:点击这里给我发消息

邮件:qzs531156@163.com

QR code