热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

GIS回归分析的使用测试

文章目录一、已有数据1.1关于土地利用类型数据的说明二、相关处理数据准备以及处理1.栅格数据2.叠加分析3.生成目标区域(自主进行区域的合并即可)4.统


文章目录

  • 一、 已有数据
    • 1.1 关于土地利用类型数据的说明
  • 二、 相关处理数据准备以及处理
    • 1. 栅格数据
    • 2. 叠加分析
    • 3. 生成目标区域(自主进行区域的合并即可)
    • 4. 统计不同区域中各个土地利用类型的面积
    • 5. 普通最小二乘进行回归(未挑选因子)
      • 5.1 将表与矢量数据进行一对一的链接
      • 5.2 普通最小二乘的使用
      • 5.3 报表的查看
      • 5.4 相关的精度进行评定
    • 6 因子挑选重新进行建立回归方程
    • 7. 建立回归方程 (分类实验测试)(挑选了相关因子)(最终选择四大类9小类)(基于标准的划分)
      • 7.1 分为几大类后的方程
      • 五大类 耕地 林地 草地 住宅用地 商业用地
      • 四大类 耕地 林地 草地 住宅用地
      • 四大类中 9 小类
      • 五大类中 12 小类
    • 8. 模拟人口 根据文献中的四大类的 9 小类作为因子
      • 8.1 可变面积划分方案一
      • 8.1 模拟结果统计以及精度评定
      • 8.2 可变面积划分方案二
      • 8.2 模拟结果统计以及精度评定
      • 8.3 可变面积划分方案三
      • 8.3 模拟结果统计以及精度评定
    • 9. 在统计面积时,采用不同的像元大小进行土地利用类型面积统计(挑选合适分辨率)(下面的不同方案指的是上文中的三种不同的区域划分方案)
      • 9.1(2 cell)
        • 探索性回归_参考标准
        • 方案 1
        • 方案 2
        • 方案 3
      • 9.2 (5 cell)
        • 探索性回归_参考标准
        • 方案 1
        • 方案 2
        • 方案 3
      • 9.3 (10cell)
        • 探索性回归_参考标准
        • 方案 1
        • 方案 2
        • 方案 3
      • 9.4 (20cell)
        • 探索性回归_参考标准
        • 方案 1
        • 方案 2
        • 方案 3
      • 9.5 分辨率选择结论
    • 10. 全部因子加入回归分析进行模拟人口结果
        • 方案1
        • 方案2
        • 方案3
        • 结论
    • 11. 探索性回归分析
        • 1. 工具位置
        • 2. 相关参数挑选
        • 3. 基于解释变量数量的最佳模型
        • 4. 根据挑探索回归选出的因子进行方案的回归分析(选择上面分析得到的三种模型中的第一个,红框已经标出)
        • 5 由探索性回归挑选的因子而得到的回归方程(OLS)(此方程基于标准)
          • 5.1 回归报表:
          • 5.2 回归方程:
          • 5.3 不同方案人口模拟以及精度评定(基于10m的栅格数据统计的土地利用类型面积而做)
            • 5.3.1 方案一划分
            • 5.3.2 方案二划分
            • 5.3.2 方案三划分
    • 12. 精度评定汇总(基于不同栅格精度,不同方案,探索性回归整合)
    • 13. 对于数据处理的挖掘分析
      • 13.1 回归方程的评价(文献挑选因子与探索性回归方程比较)
      • 13.2 关于分辨率的
      • 14 人口密度 土地占有率 回归分析
        • 14.1 文献方向------建立回归方程
        • 14.2 探索性回归方向
  • 三、 附录 全部土地利用类型进行的回归的回归方程(测试用过)
    • 1. 全部加入回归的因子有:
    • 2. 相关性图表
    • 3. 土地利用类型划分表


一、 已有数据

原始数据_EA(原始的伦敦的各个小的行政规划 里面的每个小规划单位有人口数据以及相关的小面积)
源数据_EA (一个参考的标准的将原始数据的二次划分,划分成一些比较大的单位 即小单位的合并)
Landuse (土地利用 区域内的不同的土地利用类型的面积


1.1 关于土地利用类型数据的说明

在所下载的伦敦土地利用数据中,一共有19中土地利用类型,下载后根据相关文献得知,土地利用类型与耕地,林地,草地,住宅用地相关性较强,所以挑选出来做回归分析,在19类型中,属于耕地,林地,草地,住宅用地共有 9 个小类,所以后面的回归分析基于此 9 小类处理。


二、 相关处理数据准备以及处理


1. 栅格数据

Landuse矢量数据转换成栅格数据:10米,值:code,命名:LU_EA_Raster。
工具:Conversion Tools-to Raster-Feature to Raster

在这里插入图片描述


2. 叠加分析

源数据_EA和原始数据_EA进行叠加分析按区域统计y值
工具:Analysis Tools-Overlay-Spatial Join
参数选择:one to one ,contains
在这里插入图片描述


3. 生成目标区域(自主进行区域的合并即可)

区域合并为30-40平方公里,命名 目标区域_EA


4. 统计不同区域中各个土地利用类型的面积

使用面积制表的功能
在这里插入图片描述
此处打开 arcgis 的搜索工具
面积制表
在这里插入图片描述

TabulateArea
进行相关参数的设置即可
在这里插入图片描述面积的制作表格
https://desktop.arcgis.com/zh-cn/arcmap/10.3/tools/spatial-analyst-toolbox/tabulate-area.htm


5. 普通最小二乘进行回归(未挑选因子)

在这里插入图片描述


5.1 将表与矢量数据进行一对一的链接

在矢量数据右键进行 join 即可


5.2 普通最小二乘的使用

在这里插入图片描述


5.3 报表的查看

在这里插入图片描述


5.4 相关的精度进行评定

在这里插入图片描述

新建字段 为Residual的双倍 RR 设置成 double类型 计算出 RR 的平均值(字段统计)直接开根号即可
均方根误差:32,545.84180638448
标准化值:0.3254273420436881


6 因子挑选重新进行建立回归方程

田永中等(2004)在2000年中国人口分布影响因素的主成分分析中发现了耕地对于人口密度来讲,相关系数高达0.949,于欣鑫等(2015)在青岛地区人口密度空间化模拟研究表明耕地,居住区,林地3种土地利用类型与人口相关系数可以达到0.80以上,水域草地和未利用土地与人口密度的相关系数均小于0.2,相关性不强;江东、杨小唤等(2002)在基于RS、GIS的人口空间分布研究中经过筛选,选择了耕地、林地、草地、农村居民点、城镇居民点、工交建设用地作为模型中的因子;


7. 建立回归方程 (分类实验测试)(挑选了相关因子)(最终选择四大类9小类)(基于标准的划分)

四大类是:耕地 林地 草地 住宅用地
九小类是:
在这里插入图片描述


7.1 分为几大类后的方程


五大类 耕地 林地 草地 住宅用地 商业用地

均方根误差: 47052.46176789463
标准化值:0.470479690180711
在这里插入图片描述耕地 林地 草地 住宅用地 商业用地


四大类 耕地 林地 草地 住宅用地

均方根误差:50479.29406504035e
标准化值:0.504744741081033
在这里插入图片描述


四大类中 9 小类

均方根误差:45812.36255398550
标准化值:0.458079882135993
在这里插入图片描述在这里插入图片描述


五大类中 12 小类

均方根误差:34199.74333246568
标准化值:0.341964778095781

在这里插入图片描述
在这里插入图片描述


8. 模拟人口 根据文献中的四大类的 9 小类作为因子

回归方程采用上面的四大类中 9 小类的回归结果
Y = 49944.034734 + 0.004136 *x1- 0.023265 * x2 + 0.003905 *x3 - 0.020625 * x4 + 0.007767 * x5 - 0.002897 * x6 - 0.008433 * x7 -0.016327 * x8 + 0.316676 * x9

x1 到 x9 分别对应下面的顺序
在这里插入图片描述


8.1 可变面积划分方案一

在这里插入图片描述


8.1 模拟结果统计以及精度评定

精度评定采用均方根误差并计算标准化值
误差计算公式:abs(原始人口 - 模拟人口 ) / 原始人口
在这里插入图片描述


8.2 可变面积划分方案二

在这里插入图片描述


8.2 模拟结果统计以及精度评定

精度评定采用均方根误差并计算标准化值
误差计算公式:abs(原始人口 - 模拟人口 ) / 原始人口
在这里插入图片描述


8.3 可变面积划分方案三

在这里插入图片描述


8.3 模拟结果统计以及精度评定

精度评定采用均方根误差并计算标准化值
误差计算公式:abs(原始人口 - 模拟人口 ) / 原始人口
在这里插入图片描述


9. 在统计面积时,采用不同的像元大小进行土地利用类型面积统计(挑选合适分辨率)(下面的不同方案指的是上文中的三种不同的区域划分方案)


9.1(2 cell)

相关的精度评定 以及统计结果


探索性回归_参考标准

在这里插入图片描述


方案 1

在这里插入图片描述


方案 2

在这里插入图片描述


方案 3

在这里插入图片描述


9.2 (5 cell)


探索性回归_参考标准

在这里插入图片描述


方案 1

在这里插入图片描述


方案 2

在这里插入图片描述


方案 3

在这里插入图片描述


9.3 (10cell)


探索性回归_参考标准

在这里插入图片描述


方案 1

在这里插入图片描述


方案 2

在这里插入图片描述


方案 3

在这里插入图片描述


9.4 (20cell)


探索性回归_参考标准

在这里插入图片描述


方案 1

在这里插入图片描述


方案 2

在这里插入图片描述


方案 3

在这里插入图片描述


9.5 分辨率选择结论

从标准化值来看当选择的像元分辨率越高,相应的人口密度的模拟精度会随之提高,但是考虑到计算机的运行时间以及保证一定的精度,以及相关数据对比,将分辨率设置在 5 ~ 10 之间比较合适


10. 全部因子加入回归分析进行模拟人口结果


方案1

在这里插入图片描述


方案2

在这里插入图片描述


方案3

在这里插入图片描述


结论

将所有的因子加入回归模拟人口,相比挑选部分因子,其精度较高,方程的项数也更多,但是实际情况中,不会一股脑将全部的因子加进去,需要通过一定手段进行因子的挑选得到好的人口密度的模拟模型。


11. 探索性回归分析


1. 工具位置

在这里插入图片描述


2. 相关参数挑选

在这里插入图片描述


3. 基于解释变量数量的最佳模型

在这里插入图片描述

此模型是基于基准的划分得到的(基准的划分有71个划分单元,如下所示)
在这里插入图片描述


4. 根据挑探索回归选出的因子进行方案的回归分析(选择上面分析得到的三种模型中的第一个,红框已经标出)


5 由探索性回归挑选的因子而得到的回归方程(OLS)(此方程基于标准)


5.1 回归报表:

在这里插入图片描述


5.2 回归方程:

Y = 10625.593015 - 0.011358 * x1 - 0.008730 * x2 + 0.115421 * x3 - 0.034894 * x4 + 0.007372 *x5 + 0.022352 * x6 -0.147975 * x7 - 0.019122 * x8 + 0.113022 * x9


5.3 不同方案人口模拟以及精度评定(基于10m的栅格数据统计的土地利用类型面积而做)

5.3.1 方案一划分

总体概览
在这里插入图片描述
局部放大:
在这里插入图片描述


5.3.2 方案二划分

总体概览:
在这里插入图片描述局部放大:
在这里插入图片描述


5.3.2 方案三划分

总体概览
在这里插入图片描述

局部放大
在这里插入图片描述


12. 精度评定汇总(基于不同栅格精度,不同方案,探索性回归整合)

在这里插入图片描述


13. 对于数据处理的挖掘分析


13.1 回归方程的评价(文献挑选因子与探索性回归方程比较)

下面是文献阅读所挑选的因子:
均方根误差:45812.36255398550
标准化值:0.458079882135993
在这里插入图片描述
在这里插入图片描述

下面是探索性所挑选的因子:
在这里插入图片描述
在这里插入图片描述

回归方程对比分析(挑选几个回归报表的参数进行对比分析):


  1. 从回归系数标准差来看,基于文献所挑选的因子而形成的回归方程的回归系数标准差相较基于探索性回归分析的得到的模型的回归系数标准差较大;
  2. 探索性的方差膨胀因子(VIF)整体来讲,比基于文献所构造的模型的数值要低,说明其因子的冗余度较低;
  3. 从 Multiple R-Squared:多重R平方系数 Adjusted R-Squared:校正R平方系数来看
    探索性回归分析中的多重R平方系数为0.7535,校正R平方系数为0.6918;
    基于文献所挑选因子回归方程中:多重R平方系数为0.561952,校正R平方系数为0.497321;
    通常来讲,这两个参数会进行一起使用,它们的值在0 ~ 1之间,指的是在回归方程中的自变量对于因变量的解释能力,从回归分析来说,探索性回归分析的模型的性能会更加的好一些。
  4. 综上,基于探索性回归分析所建立起来的模型相对基于文献所挑选的因子模型的精度要更高,模型也更加的准确

13.2 关于分辨率的

在进行人口的模拟时候,由于回归方程中的的自变量是土地利用类型的面积,而在进行面积统计的时候,不同的栅格数据的精度,对于面积的统计结果有一定的影响,从而对于人口的最终模拟结果有一定的影响,所以确定合适的栅格分辨率是必要的。


14 人口密度 土地占有率 回归分析


14.1 文献方向------建立回归方程

Y = 178346.13774 - 32803.58927 - 588447.7057 - 377860.5226 - 1088738.673 - 23931.25490 - 280297.4209 - 255264.6494 - 195405.6398 + 2625462.2668


14.2 探索性回归方向

Y = 103558.72844 - 467438.3100 - 422455.5389 + 2224701.3733 - 543006.7135 + 32348.943254 + 317196.76343 - 5431647.795 - 492478.4801 + 64623.946504


三、 附录 全部土地利用类型进行的回归的回归方程(测试用过)


1. 全部加入回归的因子有:

!在这里插入图片描述


2. 相关性图表

在这里插入图片描述


3. 土地利用类型划分表

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


推荐阅读
  • Shodan简单用法Shodan简介Shodan是互联网上最可怕的搜索引擎,与谷歌不同的是,Shodan不是在网上搜索网址,而是直接进入互联网的背后通道。Shodan可以说是一款“ ... [详细]
  • baresip android编译、运行教程1语音通话
    本文介绍了如何在安卓平台上编译和运行baresip android,包括下载相关的sdk和ndk,修改ndk路径和输出目录,以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]
  • javascript  – 概述在Firefox上无法正常工作
    我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观:而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]
  • 解决github访问慢的问题的方法集锦
    本文总结了国内用户在访问github网站时可能遇到的加载慢的问题,并提供了解决方法,其中包括修改hosts文件来加速访问。 ... [详细]
  • iOS超签签名服务器搭建及其优劣势
    本文介绍了搭建iOS超签签名服务器的原因和优势,包括不掉签、用户可以直接安装不需要信任、体验好等。同时也提到了超签的劣势,即一个证书只能安装100个,成本较高。文章还详细介绍了超签的实现原理,包括用户请求服务器安装mobileconfig文件、服务器调用苹果接口添加udid等步骤。最后,还提到了生成mobileconfig文件和导出AppleWorldwideDeveloperRelationsCertificationAuthority证书的方法。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 如何优化Webpack打包后的代码分割
    本文介绍了如何通过优化Webpack的代码分割来减小打包后的文件大小。主要包括拆分业务逻辑代码和引入第三方包的代码、配置Webpack插件、异步代码的处理、代码分割重命名、配置vendors和cacheGroups等方面的内容。通过合理配置和优化,可以有效减小打包后的文件大小,提高应用的加载速度。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • FeatureRequestIsyourfeaturerequestrelatedtoaproblem?Please ... [详细]
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • r2dbc配置多数据源
    R2dbc配置多数据源问题根据官网配置r2dbc连接mysql多数据源所遇到的问题pom配置可以参考官网,不过我这样配置会报错我并没有这样配置将以下内容添加到pom.xml文件d ... [详细]
  • 本文介绍了如何清除Eclipse中SVN用户的设置。首先需要查看使用的SVN接口,然后根据接口类型找到相应的目录并删除相关文件。最后使用SVN更新或提交来应用更改。 ... [详细]
  • IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]
author-avatar
十只北羊鱼
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有