GIS基础讲稿第3章

发布 2023-05-20 01:36:28 阅读 5071

第三章地理信息系统的数据结构。

数据结构(data structure )是指数据的组织形式,这种组织形式需满足三个条件:一是一种人为约定,要具备规范化与标准化;二是有利于存储处理;三是符合信息表达的要求。可分为抽象数据结构与内部存储结构。

抽象数据结构是从逻辑的角度(数据间的联系和组织方式)上来观察数据、分析数据,它从概念上描述数据之间的排列与联系,不涉及数据的物理实现细节,与数据的存储位置无关;内部存储结构是为实现某一抽象数据结构而设计的数据存储管理方式,是指数据在计算机中存放的位置,即抽象数据结构在计算机中的实现形式。典型的抽象数据结构有:串、数组、栈、表、树和有向图等;典型的内部存储结构有:

向量、链表和丛表等。抽象数据结构一般比较稳定且具理论性,而基于某种数据结构的存储结构则是依任务、软件系统和设计者的不同而可灵活改变的。

地理信息系统可采用的数据结构有多种:如拓扑矢量结构、非拓扑矢量结构、网络结构、四叉树结构与三角网结构等。

就数据库管理而言,涉及到三个问题:概念模型(真实世界)、逻辑模型(数据结构)与物理模型(数据存储装置)。概念模型是对现实世界的抽象,在地理信息系统中是如何用点、线、多边形与拓扑关系等描述一幅地图。

逻辑模型是对数据结构的抽象,在地理信息系统中就是研究如何组织、编码与操作点、线、多边形等地图图元及其相互间的拓扑关系。物理模型是对存储装置的抽象。

数据编码是指在数据处理过程中,用计算机与人可以识别的符号体系表示数据的过程。在地理信息系统中,地理数据的编码是指按一定的数据结构,把地图、遥感影像和属性数据等转换成适合于计算机存储和处理形式的过程。

然而,至今数据结构并没有一个标准的定义。但一般数据结构应包括数据的逻辑结构、存储结构与数据计算。也即数据间的逻辑关系、存储方式和数据运算三方面。

如一个线性表,哪个元素是表中的第一个元素,哪些元素在一个给定元素之前或之后属于逻辑结构(关系);元素在存储器中是顺序连接(邻接存放),还是用指针连在一起等属于存储结构(方式);插入和删除元素属于数据的运算。因此可如下定义数据结构:按某种逻辑关系组织起来的一批数据,按一定的存储表示方式把它存储在计算机的存储器中,并在这些数据上定义了运算的集合。

模型是对现实世界的抽象、概括、简化、本质的模拟(表达)。数据的表达方式就是数据模型。根据数据表达方式(数据模型)的不同将空间数据分为矢量数据与栅格数据两种。

用坐标来表达基本点元素称矢量表示法,即矢量数据模型;用像素来表示基本点元素称栅格表示法,即栅格数据模型。或说采用一个没有大小的点(坐标)来表达基本点元素的数据模型是矢量数据模型;采用一个有固定大小的点(像素、面元)来表达基本点元素的数据模型是栅格数据模型。

数据模型一旦确定,就该研究就如何组织数据了,这就是数据结构问题,然后再选择文件格式。空间数据结构通俗地说是空间数据以什么形式在计算机中储存、管理和处理,根据数据模型分为矢量结构与栅格结构两种。

经常说到的数据建模,就是先选择一种数据模型来表达现实世界,再选择一种对应的数据结构来组织数据(模型),然后选择一种适合记录该数据结构的文件格式。

3.1 栅格数据结构及其编码。

3.1.1 栅格数据结构概念。

栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。栅格结构是用大小相等、分布均匀、紧密相连的像元(网格单元)阵列来表示空间地物或现象分布的数据组织形式。是最简单、最直观的空间数据结构,它将地球表面划分为大小、均匀、紧密相邻的网格阵列。

每一个单元(像素)的位置由它的行列号定义,所表示的实体位置隐含在栅格行列位置中,数据组织中的每个数据表示地物或现象的非几何属性或指向其属性的指针。像元有多种形式,见图3.1。

图3.1 三角形、方格和六角形划分。

对于栅格结构:

点实体由一个栅格像元来表示;

线实体由一定方向上连接成串的相邻栅格像元表示;

面实体(区域)由具有相同属性的相邻栅格像元的块集合来表示。

栅格结构的最显著特点是:数据直接记录属性的指针或属性本身,而其所在位置则根据行列号转换成相应的坐标给出。也就是说,定位是根据数据在数据集合中的位置得到的。

图3.2 栅格数据模型。

如图3.3(a)所示,数据1表示属性或编号位的一个点,其位置由所在的第3行、第5列得到。因为栅格结构是按一定的规则排列的,因此所表示的实体位置很容易隐含在网格文件的存储结构中。

在网格文件中每个**本身明确地代表了实体的属性或属性编码,如果为属性编码,则该编码可作为指向实体属性表的指针。图3.3 (a)中表示了**分别为1,3,6的实体,图3.

2 (b)表示了一条**为8的线实体,图3.3 (c)表示了3个**分别为4,7,9的面实体。

a) 点b)线c)区域。

图3.3 栅格结构的数据组织方法。

栅格结构是用有限的网格逼近某个图形,因此用栅格数据表示的地表是不连续的,是近似离散的数据。栅格单元的大小决定了在一个像元所覆盖的面积范围内地理数据的精度 ,网格单元越细栅格数据越精确,但如果太细则数据量太大。尤其按某种规则在像元内提取的值,如对长度、面积等的度量,主成分值、均值的求算等,其精度由像元的大小直接决定。

由于栅格结构中每个**明确地代表了实体的属性或属性值,点实体在栅格结构中表示为一个像元,线实体表示为具有方向性的若干连续相邻像元的集合,面实体由聚集在一起的相邻像元表示,这就决定了网格行列阵列易为计算机存储、操作、显示与维护,因此,这种结构易于实现,算法简单,易于扩充、修改,直观性强,特别是容易与遥感影像的联合处理。

3.1.2 栅格数据的获取途径与原则。

1)栅格数据的获取途径。

栅格数据的获取主要由以下几个途径:

栅格法:在待输入的图形上均匀划分栅格单元,逐个栅格地决定其属性**,最后形成栅格数字地**件。这是人工编码,当数据量太大时,该法费工费时,工作量相当大。

转换法:用手扶跟踪数字化或自动跟踪数字化得到矢量结构数据,在转换为栅格结构。由矢量数据向栅格数据转换是理想的方法。

扫描数字化:逐点扫描待输入的专题地图,对扫描数据重新采样与再编码,从而得到栅格数据文件。

分类影像输入:将经过分类解译的遥感影像数据直接或重新采样后输入系统,这是高效获取数据的方法。

2)栅格像元**的确定原则。

当依据一定的要求给定单位网格后,而网格中有多种地物类型(或说属性)时,则根据需要采取如下方案之一决定栅格单元的**。

中心点法:即用处于栅格中心处的地物类型(属性或量值或属性记录指针)或现象特征决定该栅格单元的**。对于具有连续分布特征的地理要素,如降水分布、人口密度等问题,中心法是被首要选用的。

长度占优法:当覆盖的栅格过中心位置时,横线占据该格中的大部分长度的属性值定为该栅格单元的**。

面积占优法:以占矩形面积最大的地物或现象特性的重要性决定栅格单元的**,此法常见于分类较细,地物类别斑块较小的情况。

重要性法:根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元**。此法常见于具有特殊意义而面积较小且不在栅格中心的地理要素。

尤其是点、线状地理要素,如城镇、交通枢纽、交通线、河流水系等。

以上4点正确使用,则能较好地保持地表的真实性,尽可能地保持原图或原始数据的精度问题。当然,缩小单个栅格单元面积,使每个栅格单元代表更为精细的地面矩形单元,减少混合单元、混合类型与混合面积,可大大提高量算精度,保持真实形态及更细小的地物类型。但增加栅格个数会使数据多,冗余严重。

为解决此问题,产生了一系列各具特色的栅格数据压缩编码方法。

3.1.3 栅格结构的编码方法。

在栅格文件中,每个栅格只能赋予一个唯一的属性值,所以属性个数的总数是栅格文件的行数乘以列数的积,而为了保证精度,栅格单元分得一般都很小,这样需要存储的数据量就相当大了。通常一个栅格文件的栅格单元数以万计。但许多栅格单元与相邻的栅格单元都具有相同的值,因此使用了各式各样的数据编码技术与压缩编码技术。

主要的编码技术简介如下:

1)直接栅格编码。

直接栅格编码是将栅格数据看作一个数据短阵,逐行或逐列逐个记录**。可每行从左到右逐个记录,也可奇数行从左到右,偶数行从右到左记录,为特定目的也可采用其它特殊顺序。通常称这种编码的图像文件为栅格文件,这种网格文件直观性强,但无法采用任何种压缩编码方法。

图3.3 (c)的栅格编码为:4,4,4,4,7,7,7,7;4,4,4,4,4,7,7,7;4,4,4,4,9,9,7,7;0,0,4,9,9,9,7,7;0,0,0,9,9,9,7,7;0,0,0,9,9,9,9,9;0,0,0,0,9,9,9,9;0,0,0,0,0,9,9,9。

可用程序设计语言按顺序文件或随机文件记录这些数据。

2)链式编码。

链式编码又称弗里曼链码或世界链码。它由某一原始点和一系列在基本方向上数字确定的单位矢量链。基本方向有东、东南、南、西南、西、西北、北、东北等8个,每个后继点位于其前继点可能的8个基本方位之一。

8个基本方向的**可分别用0,1,2,3,4,5,6,7表示,即可按顺时针也可按逆时针表示。栅格结构按逆时针编码图3.3 (b)可记录为:

1,3,7,7,7,6,6,5,4。其中前两个数字1与3表示线状物起点的坐标,即在第一行第三列,从第三个数字起表示单位矢量的前进方向。

《GIS原理》第3章作业

成都信息工程学院资源环境学院。gis原理 作业。1 在矢量数据结构 栅格数据结构中,分别是如何表示点 线 面对象?答 2 简要说明矢量数据结构中,链状双重独立编码结构中面对象空间信息的表示方式及拓扑关系的表示方式?arcgis的哪种原生数据格式是采用的这种结构?答 3 有一栅格数据文件按行方向由左到...

《GIS原理》第3章作业

成都信息工程学院资源环境学院。gis原理 作业。1 在矢量数据结构 栅格数据结构中,如何表示点 线 面对象?答 矢量数据结构通过记录实体坐标及其关系,尽可能精确地表示点 线 多边形等地理实体,坐标空间设为连续,允许任意位置 长度和面积的精确定义。在栅格结构中,点用一个栅格单元表示 线状地物沿线走向的...

会计基础第3章

第3章练习。单选题。1 存在对应关系的科目称为 a 总分类科目。b 联系科目。c 明细类科目。d 对应科目。答案d2 权益类科目的余额一般在 a 无余额。b 借方。c 借方或贷方。d 贷方。答案d3 某企业所有者权益总额为6000万元,负债总额为4000万元。那么该企业的资产总额为 万元。a 600...