Python之爬虫-校花网

阅读量：445 次

发布时间：2019-03-06

本文共 727 字，大约阅读时间需要 2 分钟。

Python之爬虫-校花网

#!/usr/bin/env python# -*- coding:utf-8 -*-import reimport requests# 拿到校花网主页的内容response = requests.get('http://www.xiaohuar.com/')data = response.text# 拿到校花网所有的图片链接results = re.findall('lazysrc="(.*?)"', data)for result in results:  # type:str    # 判断是不是有链接的    if result.startswith('htt'):        pass    else:        img_result = 'http://www.xiaohuar.com/' + result        # 获取图片内容        img_response = requests.get(img_result)        img_data = img_response.content        img_name = result.split('/')[3]        img_filename = img_name + '.jpg'        print(img_filename)        # 保存图片内容        with open(img_filename, 'wb') as f:  # write,read，wb是写入二进制            f.write(img_data)            print('爬取成功一张')

转载地址：http://hzgyz.baihongyu.com/

你可能感兴趣的文章

nginx：/usr/src/fastdfs-nginx-module/src/common.c:21:25:致命错误：fdfs_define.h：没有那个文件或目录 #include

Nginx：NginxConfig可视化配置工具安装

Nginx：现代Web服务器的瑞士军刀 | 文章末尾送典藏书籍

ngModelController

ngnix配置文件

ngrok | 内网穿透，支持 HTTPS、国内访问、静态域名

ngrok内网穿透可以实现资源共享吗？快解析更加简洁

ngrok内网穿透可以实现资源共享吗？快解析更加简洁

NHibernate动态添加表

NHibernate学习[1]

NHibernate异常：No persister for的解决办法

Nhibernate的第一个实例

NHibernate示例

nid修改oracle11gR2数据库名

NIFI1.21.0/NIFI1.22.0/NIFI1.24.0/NIFI1.26.0_2024-06-11最新版本安装_采用HTTP方式_搭建集群_实际操作---大数据之Nifi工作笔记0050

NIFI1.21.0_java.net.SocketException:_Too many open files 打开的文件太多_实际操作---大数据之Nifi工作笔记0051

NIFI1.21.0_Mysql到Mysql增量CDC同步中_日期类型_以及null数据同步处理补充---大数据之Nifi工作笔记0057

NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_插入时如果目标表中已存在该数据则自动改为更新数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0058

NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_更新时如果目标表中不存在记录就改为插入数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0059

NIFI1.21.0_NIFI和hadoop蹦了_200G集群磁盘又满了_Jps看不到进程了_Unable to write in /tmp. Aborting----大数据之Nifi工作笔记0052