当前位置: 开发笔记 > 编程语言 > 正文

利用GDAL库在Python中高效读取与处理栅格数据的详细指南

作者：小小的dream | 来源：互联网 | 2024-10-28 11:31

GDAL原生支持超过100种栅格数据类型，涵盖所有主流GIS与RS数据格式，包括 ArcInfo grids, ArcSDE raster, Imagine, Idrisi

GDAL原生支持超过100种栅格数据类型，涵盖所有主流GIS与RS数据格式，包括

ArcInfo grids, ArcSDE raster, Imagine, Idrisi, ENVI, GRASS, GeoTIFF

HDF4, HDF5

USGS DOQ, USGS DEM

ECW, MrSID

TIFF, JPEG, JPEG2000, PNG, GIF, BMP

完整的支持列表可以参考http://www.gdal.org/formats_list.html

导入GDAL支持库

旧版本（1.5以前）：import gdal, gdalconst

新版本（1.6以后）：from osgeo import gdal, gdalconst

gdal和gdalconst最好都要导入，其中gdalconst中的常量都加了前缀，力图与其他的module冲突最小。所以对gdalconst你可以直接这样导入：from osgeo.gdalconst import *

GDAL数据驱动，与OGR数据驱动类似，需要先创建某一类型的数据驱动，再创建响应的栅格数据集。

一次性注册所有的数据驱动，但是只能读不能写：gdal.AllRegister()

单独注册某一类型的数据驱动，这样的话可以读也可以写，可以新建数据集：

driver = gdal.GetDriverByName(&＃39;HFA&＃39;)

driver.Register()

打开已有的栅格数据集：

fn = &＃39;aster.img&＃39;

ds = gdal.Open(fn, GA_ReadOnly)

if ds is None:

print &＃39;Could not open &＃39; + fn

sys.exit(1)

读取栅格数据集的x方向像素数，y方向像素数，和波段数

cols = ds.RasterXSize

rows = ds.RasterYSize

bands = ds.RasterCount

注意后面没有括号，因为他们是属性(properties)不是方法(methods)

读取地理坐标参考信息(georeference info)

GeoTransform是一个list，存储着栅格数据集的地理坐标信息

adfGeoTransform[0] /* top left x 左上角x坐标*/

adfGeoTransform[1] /* w--e pixel resolution 东西方向上的像素分辨率*/

adfGeoTransform[2] /* rotation, 0 if image is "north up" 如果北边朝上，地图的旋转角度*/

adfGeoTransform[3] /* top left y 左上角y坐标*/

adfGeoTransform[4] /* rotation, 0 if image is "north up" 如果北边朝上，地图的旋转角度*/

adfGeoTransform[5] /* n-s pixel resolution 南北方向上的像素分辨率*/

注意栅格数据集的坐标一般都是以左上角为基准的。

下面的例子是从一个栅格数据集中取出Geotransform作为一个list，然后读取其中的数据

geotransform = ds.GetGeoTransform()

originX = geotransform[0]

originY = geotransform[3]originY = geotransform[3]

pixelWidth = geotransform[1]

pixelHeight = geotransform[5]

计算某一坐标对应像素的相对位置(pixel offset)，也就是该坐标与左上角的像素的相对位置，按像素数计算，计算公式如下：

xOffset = int((x – originX) / pixelWidth)

yOffset = int((y – originY) / pixelHeight)

读取某一像素点的值，需要分两步

首先读取一个波段(band)：GetRasterBand()，其参数为波段的索引号

然后用ReadAsArray(, , , )，读出从(xoff,yoff)开始，大小为(xsize,ysize)的矩阵。如果将矩阵大小设为1X1，就是读取一个像素了。但是这一方法只能将读出的数据放到矩阵中，就算只读取一个像素也是一样。例如：

band = ds.GetRasterBand(1)

data = band.ReadAsArray(xOffset, yOffset, 1, 1)

如果想一次读取一整张图，那么将offset都设定为0，size则设定为整个图幅的size，例如：

data = band.ReadAsArray(0, 0, cols, rows)

但是要注意，从data中读取某一像素的值，必须要用data[yoff, xoff]。注意不要搞反了。数学中的矩阵是[row,col]，而这里恰恰相反！这里面row对应y轴，col对应x轴。

注意在适当的时候释放内存，例如band = None 或者dataset = None。尤其当图很大的时候

如何更有效率的读取栅格数据？显然一个一个的读取效率非常低，将整个栅格数据集都塞进二维数组也不是个好办法，因为这样占的内存还是很多。更好的方法是按块(block)来存取数据，只把要用的那一块放进内存。本周的样例代码中有一个utils模块，可以读取block大小。

例如：

import utils

blockSize = utils.GetBlockSize(band)

xBlockSize = blockSize[0]

yBlockSize = blockSize[1]

平铺(tiled)，即栅格数据按block存储。有的格式，例如GeoTiff没有平铺，一行是一个block。Erdas imagine格式则按64x64像素平铺。

如果一行是一个block，那么按行读取是比较节省资源的。

如果是平铺的数据结构，那么设定ReadAsArray()的参数值，让它一次只读入一个block，就是效率最高的方法了。例如：

rows = 13, cols = 11, xBSize = 5, yBSize = 5

for i in range(0, rows, yBSize):

if i + yBSize

numRows = yBSize

else:

numRows = rows – i

for j in range(0, cols, xBSize):

if j + xBSize

numCols = xBSize

else:

numCols = colsnumCols = cols – j

data = band.ReadAsArray(j, i, numCols, numRows)

这一段代码具有通用性，可以时常拿来用的。

下面介绍一点二维数组的处理技巧

这里要用到两个库，Numeric和numpy。Numeric比较老了，FWTools用它。自己安装配置的话还是配功能更强的numpy。

数据类型转换：

data = band.ReadAsArray(j, i, nCols, nRows)

data = data.astype(Numeric.Float) # Numeric

data = data.astype(numpy.float) # numpy

或者简单点只写一句

data = band.ReadAsArray(j, i, nCols, nRows).astype(Numeric.Float)

掩膜mask

这是Numeric和numpy库的功能，输入一个数组和条件，输出一个二值数组。例如

mask = Numeric.greater(data, 0)mask = Numeric.greater(data, 0)

>>> a = Numeric.array([0, 4, 6, 0, 2])

>>> print a

[0 4 6 0 2]

>>> mask = Numeric.greater(a, 0)

>>> print mask

[0 1 1 0 1]

数组求和

>>> a = Numeric.array([0, 4, 6, 0, 2])

>>> print a>>> print a

[0 4 6 0 2]

>>> print Numeric.sum(a)

如果是二维数组，那sum就会返回一个一维数组

>>> b = Numeric.array([a, [5, 10, 0, 3, 0]])

>>> print b

[[ 0 4 6 0 2]

[ 5 10 0 3 0]]

>>> print Numeric.sum(b)>>> print Numeric.sum(b)

[ 5 14 6 3 2]

所以，二维数组的求和就要这样

>>> print Numeric.sum(Numeric.sum(b))

这里有一个小技巧，统计大于0的像素个数，可以联合运用mask和sum两个函数

>>> print a

[0 4 6 0 2]

>>> mask = Numeric.greater(a, 0)

>>> print mask

[0 1 1 0 1]

>>> print Numeric.sum(mask)

以上就是python gdal教程之：用gdal读取栅格数据的内容，更多相关内容请关注PHP中文网（www.gxlcms.com）！

推荐阅读

get
导航栏样式练习：项目实例解析

本文详细介绍了如何创建一个具有动态效果的导航栏，包括HTML、CSS和JavaScript代码的实现，并附有详细的说明和效果图。 ... [详细]

蜡笔小新 2024-12-27 19:42:28
tags
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
get
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
get
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
get
使用Numpy实现无外部库依赖的双线性插值图像缩放

本文介绍如何仅使用Numpy库，通过双线性插值方法实现图像的高效缩放，避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 13:15:40
get
Android 模拟用户交互：点击与滑动操作的实现

本文介绍如何在 Android 中通过代码模拟用户的点击和滑动操作，包括参数说明、事件生成及处理逻辑。详细解析了视图（View）对象、坐标偏移量以及不同类型的滑动方式。 ... [详细]

蜡笔小新 2024-12-28 12:12:22
get
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
get
Go+ 中的上下文处理指南

本文详细介绍 Go+ 编程语言中的上下文处理机制，涵盖其基本概念、关键方法及应用场景。Go+ 是一门结合了 Go 的高效工程开发特性和 Python 数据科学功能的编程语言。 ... [详细]

蜡笔小新 2024-12-28 11:05:31
get
解决Uploadify在IE浏览器中的兼容性问题

本文详细介绍了如何解决Uploadify插件在Internet Explorer（IE）9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码，确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]

蜡笔小新 2024-12-27 22:07:40
get
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
get
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
get
java编写的简易计算器

主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]

蜡笔小新 2024-12-27 18:18:10
get
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
client
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
client
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25

小小的dream

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章