最新版GeoDa软件是一款空间回归分析工具,该系统支持多种空间数据格式,让原始数据转换为地图,跨时间跨空间地进行数据分析,大大提升实验效率。
GeoDa是一个免费、开源的空间数据分析软件。 通过探索和建模空间模式,GeoDa向用户提供了全新的空间数据分析视角。
GeoDa是由 Luc Anselin 博士和其团队开发的. 该程序提供了友好的用户界面以及丰富的用于探索性空间数据分析(ESDA)的方法,比如空间自相关统计(spatial autocorrelation statistics)和基本的空间回归分析(spatial regression analysis)。
从2003年2月GeoDa发布第一个版本以来, GeoDa的用户数量成倍的增长。截止2017年6月,GeoDa的用户数量已经超过了20万。 包括哈佛,麻省理工、康奈尔等著名大学都在实验室中安装并使用GeoDa软件。GeoDa软件得到了用户和媒体广泛的好评,被称之为“一个非常重要的分析工具”,“一款制作精良的软件”,有着“激动人心的进展”。
该程序提供了丰富的用于探索性空间数据分析(ESDA)的方法,比如:
空间自相关统计(spatial autocorrelation statistics)
空间回归分析(spatial regression analysis)
单变量和多变量的局部Geary聚类分析
(非空间)聚类分析方法(PCA)等
同时GeoDa也支持更多的空间数据格式,支持时空(space-time)数据,支持包括Nokia和Carto提供的底图(Basemap)显示,均值比较图表(averages charts),散点图矩阵(scatter plot matrices),非参数的空间自相关图(nonparametric spatial autocorrelation--correlogram),以及灵活的数据分类方法(flexible data categorization)。
GeoDa支持更多的空间数据格式
引入GDAL软件库后,GeoDa目前可以支持多种矢量数据格式,包括:ESRI Shapefile、ESRI geodatabase、GeoJson、MapInfo、GML、KML等。同时GeoDa也能从表格数据(如:.csv、.dbf、.xls、.ds)中通过制定坐标数据(X,Y或者经纬度)来创建点空间数据。
通过相互关联的地图和图表探索统计结果
与将原始数据可视化为地图的程序不同,GeoDa专注于通过链接的地图和图表探索统计测试和模型的结果。
时空模式分析
现在您可以在新的时间编辑器中对同一变量进行跨时间段的分组,以探索跨时空的统计模式。然后用时间播放器探索随着时间变化而变化的视图的结果。
添加包括Nokia和CartoDB提供的底图(Basemap)
如果你的空间数据是投影(.prj文件),你现在可以在任何地图视图中添加一个基图,包括聚类图,以获得更好的定位和地面实测结果。
时空数据的均值比较
一个新的平均数图表比较在时间和/或空间上的平均数,并测试这些平均数的差异是否显著。例如,首先选择是否要比较同一时间段内选定的观测值与未选定的观测值的平均值,或者比较不同时间段的所有观测值。然后,一个基本的前-后/影响-控制检验表明你的结果是否在时间和空间上发生了变化(使用F检验和差异检验)。
检测多元空间关系
通过散点图矩阵,可以同时探索多个二变量的相关关系。在这个例子中,我们展示了旧金山市选定的、未选定的和所有警察分局的回归斜率,以探索四种犯罪类型之间的关系。
检测随时间的变化在空间上聚集
使用全局或局部差分Moran's I检验来找出一个变量在特定地点的变化是否与邻近地区的变化有统计学上的关系。例如,这个局部(LISA)聚类图显示了2002年至2008年期间纽约的热点地区的孩子比例变化较大(而冷点的变化较小)。
单/多变量的空间聚类分析
Luc Anselin(2017)最近用一个新的空间关联的局部指标对Geary的c进行了扩展。这被应用到法国 "道德统计 "的经典数据集(Guerry,1833)中,显示出识字率的显著高低空间集中度(左图)和财产犯罪与识字率的显著关联(右图)。
集成经典的数据聚类方法分析空间数据
现在,你可以用几种经典的非空间聚类技术绘制模式,包括主成分分析(左图)、k-means(右上图)和层次聚类(右下图)。使用与上例中相同的数据,下面的地图显示了财产犯罪、识字率和自杀的局部聚类。
检测空间相关性边界阈值
非参数空间自相关测试(corlogram)现在可以用来确定相邻对的值不再相关时的距离阈值。
探索多种空间数据分类
通过新的类别编辑器,您可以探索您的结果对分类数据的阈值变化的敏感度。在这个例子中,条件图(右)中的阈值是基于可以在类别编辑器(左)中调整的类别。
使用GeoDa连接Carto云端空间数据库
现在你可以将CartoDB的数据加载到GeoDa中,并将结果保存回CartoDB表。请看这是如何工作的。
geoda能进行空间自相关分析,这一功能是空间分析中的重要功能,不过不少用户初次使用不知道怎么操作,这里小编就带来步骤方法,让你快速入门这一功能的使用:
1.将数据输入为txt文本。
如上,第一行的意义是总共有21个观测点,共5列;第二行是标题行,意义分别是城市、唯一的ID号、维度、经度、人均gdp;剩下的21行为观测值的数据。
2.打开geoda095i软件(新版的不行哦),选择tools>shape>points from ASCII;
3.点击Inputfile行后的文件夹,在弹出窗口中通过路径选择gdp.txt文件。点击Outputfile行后的图标输入文件名:gdp。在X一coords栏中选择LON,在y-coords栏中选择LAT,点击Create完成。
这样就创建好一个shp格式的文件。
4.构建空间权重文件
我比较笨,所以这块儿构建空间权重矩阵用最新版的geoda了。
打开新版geoda,首先用file<-new project from<esri shp 导入刚才创建的shp格式文件;
然后,tools<-weights<-create
打开weights file creation框,点击add id variable...在existing
variables中选择ID项(也可以选其他的,但是其中包含的数值要唯一),如下图,
然后,点击add variable;点击 threshold distance,将distance metric中选择arc distance(km),其他为默认,从而创建出空间权重矩阵。如下图,
4.全局空间自相关分析和局部空间自相关分析全局,在新版geoda软件space<-univariate moran's I,在弹出的variable settings中选择first
variable(x)为GDP,点击ok.在弹出的select weight中的select from file选择刚才创建的空间权重矩阵gdp.gwt,点击ok.结果如下,
局部,在新版geoda软件 space<-univariate local moran’s I,在弹出的variable settings中选择GDP,点击ok.接下来,添加空间权重矩阵,在弹出来的what windows to open ?全选那几个框,点击OK.
结果如下,
Geoda的空间权重矩阵生成功能对于距离数据的分析非常重要,可以大大降低用户的数据效率,提升实验速度,那么应该如何生成呢?下面小编就带来教程,一起来了解下吧:
1、打开Geoda软件,导入包含经纬度的地图文件,文件格式为.shp;
2、打开tools—Weights Manager,点击Create,出现Weights File Creation窗口;
3、点击Add ID Variable,在Enter new ID variable name:中输入新建变量名POLY_ID(即关键字POLY_ID),点击Add Variable;
4、在Weights File ID Variable 中选择POLY_ID,选中Threshold distance,X_coordinate variable选择经度,Y_coordinate variable选择纬度,点击Create,生成距离权重矩阵;
5、打开stata,输入以下命令打开刚刚生成的距离权重矩阵,本文命名为空间距离权重矩阵.gwt;
// M为新名称 spmat import M using 空间距离权重矩阵.gwt, geoda
6、距离权重矩阵转换为stata格式,并保存;
spmat getmatrix M W
//将变量命名为x1,x2...
getmata (x*)=W
7、打开保存为stata格式的距离权重矩阵。
spatwmat using 空间距离权重矩阵.dta,n(W1)
显著性水平可以由标准化Z值的P-值检验来确定:通过计算Z值的P-值,再将它与显著性水平a(一般取0. 05 )作比较,决定拒绝还是接收零假设。如果P一值小于给定的显著性水平,则拒绝零假设;否则接收零假设。
对Moran' s I值进行假设检验,Z≥1.96或≤-1.96则认为空间具有空间自相关性(Moran' s I >0表示空间正相关性,其值越大,空间相关性越明显,Moran's I < 0表示空间负相关性,其值越小,空间差异越大,否则,Moran's I = 0,空间呈随机性)。
GeoDa最新发布的版本是1.14。新版本包含了很多新的功能,比如:单变量和多变量的局部Geary聚类分析,集成了经典的(非空间)聚类分析方法(PCA,K-Means,Hierarchical聚类--详细请参考Hoon et al's 2013 "C Clustering Library")。同时GeoDa也支持更多的空间数据格式,支持时空(space-time)数据,支持包括Nokia和Carto提供的底图(Basemap)显示,均值比较图表(averages charts),散点图矩阵(scatter plot matrices),非参数的空间自相关图(nonparametric spatial autocorrelation--correlogram),以及灵活的数据分类方法(flexible data categorization)。