首页手记 python | 图像抓取、加载与通道数处理

python | 图像抓取、加载与通道数处理

标签：

Python

这篇文章整理了在处理大量图片数据集时可能需要用到的一些东西。

主要包括：

用urllib根据图片url抓取图片并保存；
用PIL的Image图像库加载图片；
用crop函数对图像进行裁剪；
处理数据集中的图像通道数，使其都为3通道；

1. 根据url下载图片

数据集很大的情况，常常需要我们自己去下载图片，这个时候就需要有个程序帮我们自动下载了。

用urllib获取图片并保存

import urllib# img_url: the url of image# img_path: the path you want to save imageurllib.urlretrieve(img_url,img_path)

2. 图片加载与处理

1. 用PIL加载图像

from PIL import Imagedef get_image_from_path(img_path,img_region):
    image = Image.open(img_path)
    image = process_image_channels(image, img_path)
    image = image.crop(img_region)    return image

2. 关于crop函数

一定要注意bounding_box的传入参数；
crop接受的参数为（左上x，左上y，右下x，右下y）
python的坐标系为最左上角为(0,0)，横向x，纵向y；
这里踩了好久的坑。╮(╯﹏╰）╭

3. 关于处理图像通道

在这次处理的数据集中有jpg的图像，也有png的图像；
以前从来不知道png会有RGBA4个通道甚至有些图片只有一个A通道，所以如果没有提前处理后面训练或者换测试的时候会时不时的给你一个bug小彩蛋哈哈哈。
关键语句：

def process_image_channels(image, image_path):
    # process the 4 channels .png
    if image.mode == 'RGBA':
        r, g, b, a = image.split()
        image = Image.merge("RGB", (r, g, b))    # process the 1 channel image
    elif image.mode != 'RGB':
        image = image.convert("RGB")
        os.remove(image_path)
        image.save(image_path)    return image

简单的做个整理吧，后期有新的问题也会继续补充在这里。

作者：与阳光共进早餐
链接：https://www.jianshu.com/p/009fc2e4348a

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

绝地无双

手记
篇

粉丝

59

获赞与收藏

329

关注作者，订阅最新文章

阅读免费教程

Python 办公自动化教程

17个小节 27499 929

Python 算法入门教程

15个小节 30236 1170

Python 进阶应用教程

38个小节 72817 1144

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

python | 图像抓取、加载与通道数处理

1. 根据url下载图片

2. 图片加载与处理

阅读免费教程