对于一个包含A的平方减B的平方是求什么连续的100个A和50个B的文件,用行程编码压缩后二进制数的长度是?要过程详细

邬国锋 武汉大学资源与环境科学学院
地理信息系统原理 邬国锋 武汉大学资源与环境科学学院

第三讲 空间数据的表达 地理系统(地理空间) 地理现象(地理空间实体) 地理空间认知模型 地理空间实体(对象)的描述方法
地理空间实体(对象)的矢量表达(矢量结构) 地理空间实体(对象)的栅格表达(栅格结构) TIN

地理系统是一个开放的复杂巨系统,主要涉及地球表层空间,按照层次划分,可分为岩石圈、水圈、生物圈、大气圈和电离层。地理信息系统目前所涉及的范围主要在岩石圈和大气圈之间的地理现象。 地理系统表现出来的各种各样的地理现象代表了现实世界,地理信息系统即是人们通过对各种地理现象的观察、抽象、综合取舍,得到实体目标,然后对实体目标进行定义、编码结构化和模型化,以数据形式存入计算机内,建立地理数据库。

地理空间上至大气电离层,下至地幔莫霍面,有着广阔的范围。但一般地理空间指的是地球表层,其基准是陆地表面和大洋表面,它是人类活动频繁发生的区域,是人地关系最为复杂、紧密的区域。 设E1,E2,…,En为n个不同类的地理空间实体, E={E1,E2,…,En}表示地理空间中各组成部分的集合;R表示地理空间实体之间的相互联系、相互制约关系,那么地理空间可以表为为S={E,R}

地理现象(地理空间实体) 地理空间实体是依附于地理空间存在的各种事物或者现象,它们可能是物质的,也可能是非物质的,它们的一个典型特征是与一定的地理空间位置有关,都具有一定的几何形态。

地理现象(地理空间实体) 空间特征 空间位置:表示地理空间实体在一定的坐标参考系中的空间位置,通常用地理坐标系、平面直角坐标系来表示。也称几何特征,包括空间实体的位置、大小、形状、分布状况等。 空间关系:指地理空间实体之间存在的一些具有空间特性的关系. 拓扑关系:拓扑变化下的拓扑不变量,如邻接关系、关联关系和包含关系等 方位关系:实体在地理空间中的某种顺序,如左右、东南西北等 度量关系:用地理空间中的度量来描述的实体之间的关系,实体之间的距离

地理现象(地理空间实体) 属性特征:是与地理空间实体相联系的、具有地理意义的数据或变量。属性通常分定性和定量两种,定性属性包括名称、类型、特征等;定量属性包括数量、等级等。 时间特征:指地理实体随着时间而变化的特征。地理空间实体的位置属性和属性相对于时间来说,常常呈现相互独立的变化。

地理现象(地理空间实体) 特征 关系 行为 选择 抽象 综合 估计 模拟 测量 表达 编码 组织 建立关系 观察 人对地理现象的认识方法
影像图 测量 表达 编码 组织 建立关系 特征 关系 行为 选择 抽象 综合 估计 模拟 观察 人对地理现象的认识方法 获取数据操作 结果 地理现象的状态 类型 名称 坐标 机场

地理空间认知模型 概念数据模型 (地理空间认知模型) 概念世界 设计 逻辑数据模型 (地理数据模型) 实现 数据世界 物理数据模型 现实世界
地理实体或者现象 概念数据模型 (地理空间认知模型) 概念世界 设计 逻辑数据模型 (地理数据模型) 实现 数据世界

地理空间认知模型 现有的地理空间认知模型主要有三个: 场模型:强调空间要素的连续性 基于对象的模型:强调空间要素的离散性
网络模型:强调空间要素的交互

地理空间认知模型 基于域(场)(field-based)的地理空间认知模型
把地理空间中的事物和现象作为连续的变量或体来看待,根据不同的应用可以表示为二维的,也可表示为三维的

地理空间认知模型 基于域(场)的地理空间认知模型
在空间信息系统中,场模型一般指的是栅格模型,其主要特点就是用二维划分覆盖整个连续空间。划分可以是规则的或不规则的,通常是采用正多边形作为划分的单位,如三角形、方格、六边形等。

地理空间认知模型 基于域(场)的地理空间认知模型
栅格模型把空间看作像元的划分,每个像元都记录了所在位置的某种现象,用像元值表示。该值可以表示一个确定的现象,也可以是一种模糊的现象。但一个像元应该只赋一个单一的值。 栅格模型的一个重要特征就是每个栅格中的像元的位置是预先确定的,因此描述同一区域的不同现象的栅格数据之间很容易进行重迭运算。

地理空间认知模型 基于实体或对象(object-based)的地理空间认知模型
将研究的整个地理空间看成一个空域,地理实体和现象作为独立的对象分布在该空域中。按照其空间特征的分为点、线和面三种基本对象,对象也可能是由其它的对象构成构成的复杂对象,并且与其它的对象保持着特定的关系。每个对象对应着一组相关的属性以区分出各个不同的对象。只适合于那些具有完整边界的地理现象。

地理空间认知模型 点实体:有特定的位置,维数为0的实体
如城镇、乡村居民地、交通枢纽、车站、工厂、学校、医院、机关、火山口、震中、山峰、隘口、基地等等 从较大的空间规模上来观测这些地物,就能把它们都归结为呈点状分布的地理现象。

地理空间认知模型 点实体 1)实体点:用来代表一个实体。 2)注记点:用于定位注记。 3)内点:用于负载多边形的属性,存在于多边形内。
4)角点、节点Vertex: 表示线段和弧段上的连接点。

地理空间认知模型 线实体:维数为1的实体,由一系列坐标点表示,有以下特征: 实体长度:从起点到终点的总长;
弯曲度:用于表示象道路拐弯时弯曲的程度; 方向性:如水流从上游到下游,公路则有单双向之分; 如河流、海岸、铁路、公路、地下管网、街道、行政边界等

地理空间认知模型 多边形实体:维数为2的实体,,有以下特征: 面积范围; 周长; 独立性或与其它地物相邻:如北京及周边省市;
内岛或锯齿状外形:岛屿及海岸线; 重叠性与非重叠性。 如土壤、森林、草原、沙漠等等,属于大范围连续分布的自然地理现象,此外城市区划、耕地等属于社会经济现象

地理空间认知模型 体实体:维数为3的实体,,有以下特征:
立体状实体用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性,立体状实体一般具有以下一些空间特征: ·体积,如工程开控和填充的土方量 ·每个二维平面的面积 ·周长 ·内岛 ·含有弧立块或相邻块 ·

对象模型强调的是空间要素的个体现象,研究的是个体现象本身或与其他个体现象的关系。任何现象,无论大小,都可以被确定为一个实体。如人为现象:建筑物、道路、管理区域等;自然现象:河流、湖泊、森林等。空间实体必须符合三个条件: 可被识别 重要(与问题相关) 可被描述:位置、属性等

在对象模型中,空间实体的空间位置、关系和度量的描述是非常重要的。空间实体见的空间关系可以抽象为点、线、多边形之间的六种关系: 点—点: 点—线: 点—多边形: 线—线: 线—多边形: 多边形—多边形: 拓扑空间关系 方位空间关系; 度量空间关系

地理空间认知模型 拓扑空间关系描述——9交模型
现实世界中的两个实体A和B:用B(X)表示实体X的边界,I(X)表示实体X的内部,用E(X)表示实体X的外部。基于上述概念,Egenhofer在1993年为空间实体间的拓扑关系描述构造了“9交空间关系模型”(9-Intersection Model,9-IM): B(A)ПB(B) B(A)ПI(B) 矩阵中每个元素的取值可为“空”和“非空”,9个元素共可以产生29 = 512种情形,即可描述512种空间关系。

地理空间认知模型 邻接关系 相交关系 相离关系 包含关系 重合关系 点-点 * 点-线 点-面 线-线

地理空间认知模型 拓扑关系 邻接:指空间图形中同类元素之间的拓扑关系,结点与结点,弧段与弧段,多边形与多边形
关联:指空间图形中不同类元素之间的拓扑关系,如结点与弧段,多边形与弧段 包含:指空间图形中同类但不同级元素之间的拓扑关系

地理空间认知模型 方位空间关系 方位空间关系指的是空间实体之间的上下、前后、左右、东西南北等顺序关系。可以根据实体类型分为:多边形-多边形、多边形-线、多边形-点、线-线、线-点、点-点之间的方位空间关系。 点-点方位空间关系最好确定,只需计算两点连线与某一基准方向的夹角即可。多边形-点、线-点方位空间关系也可以在一定程度上简化为点-点方位空间关系。 其余方位空间关系的计算就相对复杂得多了,目前尚未有很好的解决办法。

地理空间认知模型 度量空间关系 基本度量空间关系指的是空间实体之间的距离,在此基础上,还可以构造出实体群之间的度量关系。距离度量有不同的计算方式:大地测量距离、曼哈顿距离(经度差加上纬度差)、时间距离等。 此外,还有其他的一些空间量算的指标: 几何指标:位置、距离、面积、体积形状、方位等 自然地理参数:坡度、坡向、地表辐射度、地形起伏度、通达度等 人文地理指标:交通便利程度、吸引范围、人口密度等

地理空间认知模型 空间关系的应用 点—点 点—线 点—面 住宅 学校 海岸线 码头 肺癌病例 区域 学校和住宅接近吗? 码头在海岸线上吗?

地理空间认知模型 空间关系的应用 线—点 线—线 线—面 乘车线路 河流 小路 这条线路过镇上吗? 小路穿过河流吗? 河流在区域内吗?

地理空间认知模型 空间关系的应用 面—点 面—线 面—面 该邮政区包括学校吗? 该区域包括铁路吗? 区域彼此影响吗? 区域重叠吗?

地理空间认知模型 基于网络的地理空间认知模型 描述不连续的地理现象 考虑通过路径相互连接多个地理现象之间的相交情况
是基于对象的模型的一个特例,它是由点对象和线对象之间的拓扑关系所构成

地理空间认知模型 基于网络的地理空间认知模型
网络模型是从图论中发展而来。在网络模型中,空间要素被抽象为链、节点等对象,同时还要关注其间的连通关系。这种模型适合用于对相互连接的线状现象进行建模,如交通线路、电力网线等。网络模型可以形式化定义为: 网络图 = (节点,{节点间的关系,即链})

地理信息的描述方法 地球空间模型 为了研究地理现象,有必要建立地球表面的几何模型。根据大地测量学的研究成果,地球表面几何模型可以分为四类: 地球的自然表面:起伏不定,十分不规则的表面,马利亚纳海沟-11022米,珠穆朗玛峰 米)。非常复杂,难以用一个简单的数学表达式描述出来,所以不适合于数学建模。

地理信息的描述方法 地球空间模型 相对抽象的面,即大地水准面:假设当海水处于完全静止的平衡状态时,从海平面延伸到所有大陆下部,而与地球重力方向处处正交的一个连续、闭合的水准面。它有高达百米以上的起伏变化。

地理信息的描述方法 地球空间模型 模型,地球椭球体模型:绕地球自转轴旋转而成的椭球体。它是一个规则的数学表面。长半径、短半径和扁率成为地球椭球体的基本元素。 数学模型:为解决大地测量中其他一些问题提出的。

双轴椭球体模型(旋转椭球体)

地理信息的描述方法 地理坐标系的建立 建立地理空间坐标系,主要的目的是确定地面点的位置,也就是求出地面点与大地水准面的关系,它包括地面点在大地水准面上的平面位置和地面点到大地水准面的高度。 地理坐标系:地球上任意一点都可以用该点经度和纬度来表示。但地理坐标系是一种球面坐标,难以进行距离、方向、面积等参数的计算。

地理信息的描述方法 地理坐标系的建立 地面上任一点的位置,通常用经度和纬度来决定。经线和纬线是地球表面上两组正交(相交为90度)的曲线,这两组正交的曲线构成的坐标,称为地理坐标系。地表面某两点经度值之差称为经差,某两点纬度值之差称为纬差。例如北京在地球上的位置可由北纬39°56'和东经116°24'来确定。 设椭球面上有一点P,通过P点作椭球面的垂线,称之为过P点的法线。法线与赤道面的交角,叫做P点的地理纬度(简称纬度),通常以字母φ表示。纬度从赤道起算,在赤道上纬度为0度,纬线离赤道愈远,纬度愈大,至极点纬度为90度。赤道以北叫北纬、以南叫南纬 过P点的子午面与通过英国格林尼治天文台的子午面所夹的二面角,叫做P点的地理经度(简称经度),通常用字母λ表示。国际规定通过英国格林尼治天文台的子午线为本初子午线(或叫首子午线),作为计算经度的起点,该线的经度为0度,向东0-180度叫东经,向西0-180度叫西经。

地理信息的描述方法 地理坐标系的建立 笛卡尔平面直角坐标系:运用地图投影的方法,建立地球表面和平面上点的函数关系,使地球表面上任意一个由地理坐标确定的点,在平面上必有一个与其相对应的点。地图投影变换引起了地理空间要素在平面形态上的变换,包括长度变换、方向变换和面积变化。但是,平面直角坐标系却建立了对地理空间良好的视觉感,并易于进行距离、方向和面积等空间参数的量算,以及进一步空间数据处理和分析。

地理信息的描述方法 地图对地理空间的描述 地图是现实世界的模型,它按照一定的比例、一定的投影原则,又选择地将复杂的三维世界的某些内容投影到二维平面介质上,并用符号将这些内容要素表现出来。在地图学上,把地理空间的实体分为点、线、面三种要素,分别用点状、线状、面状符号来表示。

地理信息的描述方法 遥感影像对地理空间的描述
遥感影像对空间信息的描述主要通过不同的颜色和灰度来表示的。这是因为地物的结构、成分、分布等的不同,其反射光谱特性和发射光谱特性也各不相同,传感器记录的各种地物在某一波段的电磁辐射反射能量也各不相同,反映在影像上则表现为不同的颜色和灰度信息。所以说,通过遥感影像可以获取大量的空间地物的特征信息。

地理信息的描述方法 GIS对地理空间的描述 1、描述的内容 3、数据类型 4、数据结构 2、基本特征 几何数据(空间数据、图形数据)
关系数据—实体间的邻接、关联包含等相互关系 属性数据—各种属性特征和时间 元数据 矢量、栅格、TIN(专用于地表或特殊造型) RDBMS属性表----采用MIS较成熟 空间元数据 位置、形状、尺寸 、 识别码(名称)实体的角色、功能、行为、实体的衍生信息 时间 测量方法、编码方法、空间参考系等 空间特征:地理位置和空间关系 属性特征—名称、等级、类别等 时间特征 2、基本特征

地理信息的描述方法 栅格表达形式

地理信息的描述方法 栅格表达形式 点:所在的栅格表示 线:经过的栅格表示 面:覆盖的栅格表示 适合于表达连续的实体或现象

地理信息的描述方法 矢量表达形式

地理信息的描述方法 矢量表达形式 点:坐标(x、y)表示 线:坐标(x1、y1), (x2、y2),… (xn、yn)表示
面:坐标(x1、y1), (x2、y2),… (xn、yn), (x1、y1)表示 适合于表达有精确的形状和边界的离散实体

矢量结构 一、定义 矢量结构是表达空间数据的另一种常见的数据结构,它通过记录坐标的方式尽可能精确地表示呈点、线和面等分布的地理实体。
空间信息 标识码 属性信息

矢量结构 二、空间实体的表示方法-空间对象 将空间现象进行抽象得到空间对象或空间目标
空间对象的定义与数据模型和数据结构有关,不同的系统有所不同

矢量结构 二、空间实体的表示方法-空间对象 点实体:唯一标识码,一对(X,Y)坐标,地物编码,制图符号等。
线实体:唯一标识码,起始结点,终止结点,中间拐点,地物编码,制图符号等。 面实体:唯一标识码,组成面的点或者线,地物编码,制图符号等。

矢量结构 三、数据获取途径 矢量数字化法:矢量数据 扫描数字化法:栅格数据-〉矢量数据 野外测量数据(全站仪、GPS等):矢量数据
影像:栅格数据-〉矢量数据 手工输入:矢量数据

无拓扑关系的编码方法:仅记录空间目标的位置和属性信息,而不记录拓扑关系。 Spaghetti模型(独立实体法) 点位字典法 拓扑关系的编码方法:不仅记录空间目标的位置和属性信息,而且记录拓扑关系。 网络模型(Network Model)

矢量结构 Spaghetti模型 Spaghetti模型:以实体为单位进行编码 点目标:唯一标识码,地物编码,(X,Y)
线目标:唯一标识码,地物编码,(X1,Y1…Xn,Yn) 面目标:唯一标识码,地物编码,(X1,Y1…Xn,Yn,X1,Y1)

矢量结构 优点:编码容易,数字化操作简单,数据编码直观,易实现以实体为单位的运算和显示 缺点:
1、相邻多边形的公共边界被数字化并存储两次,造成数据冗余(Redundancy)和碎屑多边形—数据不一致(Inconsistency) ,浪费空间,导致双重边界不能精确匹配。 2、自成体系,缺少多边形的邻接信息,无拓扑关系(Topological Relationship) ,难以进行邻域处理,如消除多边形公共边界,合并多边形。 3、岛作为一个单个图形,没有与外界多边形联系。不易检查拓扑错误。 所以,这种结构只用于简单的制图系统中,显示图形。

矢量结构 点位字典法 点位字典法:点坐标作为一个文件,点、线和多边形由点号组成,即 点位字典:点号、(X,Y)
点目标:唯一标识码,地物编码,点号 线目标:唯一标识码,地物编码,(点号1…点号n) 面目标:唯一标识码,地物编码,(点号1…点号n, 点号1) 优点:编码比较容易,数字化操作比较简单,数据编码比 较直观 缺点:操作比较困难,拓扑关系不完整.

概念 节点(Node):连接弧段的点 弧段(Arc):开始于节点,而终止于节点的线 应用

矢量结构 网络模型 节点表:唯一标识码,(X,Y) 弧段表:唯一标识码,起始结点,终止结点, 左多边形,右多边形,中间点坐标串。
网络模型(Network Model) 主要包含两个表: 节点表:唯一标识码,(X,Y) 弧段表:唯一标识码,起始结点,终止结点, 左多边形,右多边形,中间点坐标串。 表示的拓扑关系: 节点-节点之间的邻接关系, 多边形-多边形之间的邻接关系, 节点-弧段之间的关联关系, 弧段-多边形之间的关联关系

矢量结构 拓扑模型 拓扑模型(Topological Model) 包含三或四个个文件: 结点文件:唯一标识码,(X,Y)
弧段文件:唯一标识码,起始结点,终止结点,左多边形,右多边形,指向中间点坐标的指针或者坐标串 多边形文件:唯一标识码,组成多边形的弧段号及面积、周长及中心点坐标等 弧段坐标:如果弧段中的中间点为指针 四个 三个

表示的拓扑关系:节点-节点之间的邻接关系,多边形-多边形之间的邻接关系,节点-线段之间的关联关系,线段-多边形之间的关联关系。 优点:数据结构紧凑、数据冗余小;拓扑关系明晰使得拓扑查询、拓扑分析效率高 缺点:对单个地理实体的操作的效率低、难以表达复杂的地理实体、查询效率低、局部更新困难。

美国计算机图形及空间分析实验室研制,是当今各种图形数据结构的基本框架(链状双重独立式 )。

矢量结构 基于矢量数据结构的基本操作 长度: 面积: 查询:(后面详细讲解)

拓扑关系的建立 采用人机交互的方式建立拓扑关系 邻接关系:同类目标之间,如点-点之间的邻接关系
关联关系:异类目标之间,如点-线之间的关联关系

拓扑关系的建立 1 核心 2 数据预处理 空间拓扑关系的核心是建立点(结点)、线(弧段)、面(多边形)之间的邻接关系和关联关系。
在建立拓扑关系的过程中,一些在数字化输入过程中的错误需要被改正,否则,建立的拓扑关系将不能正确地反映地物之间的关系。

拓扑关系的建立 2 数据预处理 伪节点(Pseudo Node):伪节点使一条完整的线变成两段,造成伪节点的原因常常是没有一次录入完毕一条线。编辑:去处伪节点。 悬挂节点(Dangling Node):如果一个节点只与一条线相连接,那么该节点称为悬挂节点,悬挂节点有多边形不封闭、不及和过头、节点不重合等几种情形。编辑:移位、咬合、节点匹配等 多边形不封闭 节点不重合 不及 过头

拓扑关系的建立 2 数据预处理 “碎屑”多边形或“条带”多边形(Sliver Polygon):条带多边形一般由于重复录入引起,由于前后两次录入同一条线的位置不可能完全一致,造成了“碎屑”多边形。另外,由于用不同比例尺的地图进行数据更新,也可能产生“碎屑”多边形。 编辑:删除重复线

拓扑关系的建立 2 数据预处理 不正规的多边形(Weird Polygon)
不正规的多边形是由于输入线时,点的次序倒置或者位置不准确引起的。在进行拓扑生成时,同样会产生“碎屑”多边形。 编辑:移位 正常多边形 不规则多边形

拓扑关系的建立 3 点线拓扑关系的自动建立 与弧段相连接的节点(ArcID,FromNode,ToNode)
主要内容 与弧段相连接的节点(ArcID,FromNode,ToNode) 与节点相连接的弧段(NodeID,*ArcIDs) 与弧段相连接的弧段(ArcID1,*ArcIDs) 建立方法 一种在图形采集和编辑的时候自动建立

拓扑关系的建立 4 多边形的自动建立(多边形与弧段拓扑关系) 顺时针方向构多边形 a最靠右边的链为b 多边形面积计算

4 多边形的自动建立(多边形与弧段拓扑关系)
拓扑关系的建立 4 多边形的自动建立(多边形与弧段拓扑关系) 1 2 3 4 5 6 7 8 9

拓扑关系的建立 5 岛屿问题 对于岛屿 找出正面积多边形包含的负面积多边形的基本过程
每条链关联的多边形,一面积为正,一面积为负,面积正的必然包含面积负的。步骤为: 计算多边形的面积。 分别对面积为正的多边形和面积为负的多边形排序。 从面积为正的多边形中,顺序取每个多边形,取完为止。若负面积多边形个数为0,则结束。 找出该多边形所包含的所有面积为负的多边形,并把这些面积为负的多边形加人到包含它们的多边形中,转上一步。 找出正面积多边形包含的负面积多边形的基本过程 (1)找出所有比该正面积多边形面积小的负面积多边形。 (2)用外接矩形法去掉不可能包含的多边形。 (3)取负面积多边形上的一点,看是否在正面积多边形内,若在内,则被包含;若在外,则不被包含。

拓扑关系的建立 6 确定多边形的属性 在追踪出每个多边形的坐标后,经常需确定该多边形的属性。如果在原始矢量数据中, 每个多边形有内点,则可以把内点与多边形匹配后,把内点的属性赋于多边形。由于内点个数必然与多边形的个数一致,所以,还可用来检查拓扑的正确性。如果没有内点, 必须通过人机交互,对每个多边形赋属性。

栅格结构 一、定义 栅格结构是最简单、最直观的空间数据结构,又称网格结构或者像元结构,是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个像元或者像素,有行、列号定义,并包含一个代码,表示该网格的属性值或者量值,或者仅仅包含指向其他属性记录的指针。

栅格结构 一、定义 栅格数据结构实际就是像元阵列,每个像元行列确定它的位置。由于栅格结构是按一定的规则排列的,所表示的实体位置很容易隐含在文件的存储结构中,且行列坐标可以很容易地转为其它坐标系下的坐标。在文件中每个代码本身明确地代表了实体的属性或属性的编码。

栅格结构 一、定义 栅格数据的比例尺就是栅格(象元)的大小与地表相应单元的大小之比,当象元所表示的面积较大时,对长度、面积等的量测有较大影响。每个象元的属性是地表相应区域内地理数据的近似值,因而有可能产生属性方面的偏差。

栅格结构 二、空间目标的表示方法 点:用一个栅格单元表示; 线:用沿线走向的一组相邻栅格单元表示; 面:用相邻栅格单元的集合表示。

栅格结构 二、空间目标的表示方法

栅格结构 三、特点 属性明显:数据直接记录属性的指针或者属性本身; 定位隐含:位置根据行列号转换为相应的坐标给出。

栅格结构 四、数据获得途径 目读法: 矢量数字化法: 扫描数字化法:

栅格结构 五、决定栅格单元代码的方法 中心点法:用处于栅格中心处的地物类型或现象特征决定栅格代码 C

栅格结构 五、决定栅格单元代码的方法 面积占优法:以占据栅格单元面积最大的地物类型或现象特征决定栅格代码,常用于分类较细,地物类别斑块较小的情况; (不做统计) B

栅格结构 五、决定栅格单元代码的方法 重要性法:选取最重要的地物类型或现象特征决定栅格代码,如城镇,交通枢纽等;

栅格结构 五、决定栅格单元代码的方法 百分比法:根据栅格内各地理要素所占面积的百分比确定栅格单元的代码。

栅格结构 直接栅格编码 最简单最直观而又非常重要的一种栅格结构编码方法。直接编码就是将栅格数据看作一个数据矩阵,逐行或逐列逐个记录代码。

栅格结构 直接栅格编码 2 1 3

优点 编码简单,信息无压缩、无丢失 缺点 数据量大

链码(Chain Codes) 又称Freeman编码或边界编码。主要记录线状地物或面状地物的边界。它把线状地物或面状地物的边界表示为:由某一起始点开始并按某些基本方向确定的单位矢量链。前两个数字表示起点的行列号,从第三个数字开始的每个数字表示单位矢量的方向。 优点:很强的数据压缩能力,并具有一定的运算功能,如面积,周长等的计算,类似于矢量数据结构,比较适合于存储线和面图形数据。 缺点:叠置运算,如组合、相交等很难实施,对局部的改动涉及到整体结构,而且相邻区域的边界重复存储。

栅格结构 游程长度编码 栅格数据压缩的重要编码方法。它的基本思路是:对于一个栅格图形,常常有行(列)方向上相邻的若干栅格单元具有相同的属性代码,因而可采取某种方法压缩那些重复的内容。编码方案为:只是在各行(列)栅格单元的代码发生变化时依此记录该代码以及相同代码重复的个数①或者记录代码及变化的位置(列数)②

栅格结构 游程长度编码 特点: 优点: 缺点: 属性的变化愈少,行程愈长,压缩比例越大,即压缩比的大小与图的复杂程度成反比。
压缩效率高(保证原始信息不丢失);易于检索、叠加、合并操作。 缺点: 只顾及单行单列,没有考虑周围的其他方向的代码值是否相同。压缩受到一定限制。

是将游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包含相邻的若干栅格,数据结构有初始位置和半径,再加上记录单元的代码组成。

栅格结构 四叉树编码: 基本思想是将一幅栅格图象等分为四部分。逐块检查其格网属性值。如果某一子区的所有栅格的属性值相同,则这个子区不再继续分割,否则还要把这个子区再分割为四个子区。这样依此地分割,直到每个子区都有相同的属性值。

栅格结构 四叉树编码:

栅格结构 七、基本算法 距离的计算 面积的计算

栅格结构 七、基本算法 叠置分析 土地利用 行政区划

在栅格数据结构中,点实体表示为一个像元;线实体则表示为在一定方向上连接成串的相邻像元集合;面实体由聚集在一起的相邻像元集合表示。这种数据结构很适合计算机处理,因为行列像元阵列非常容易存储、维护和显示。

用栅格数据表示的地表是不连续的,是量化和近似离散的数据,是地表一定面积内(像元地面分辨率范围内)地理数据的近似性,如平均值、主成分值或按某种规则在像元内提取的值等;另一方面,栅格数据的比例尺就是栅格大小与地表相应单元大小之比。像元大小相对于所表示的面积较大时,对长度,面积等的度量有较大影响。

栅格、矢量结构的比较与转换 1、两种数据结构的比较 *两者结合,优势互补 栅格结构和矢量结构是模拟地理信息的两种不同的方法。
栅格数据结构具有“属性明显、位置隐含”的特点,它易于实现,操作简单,有利于栅格的空间信息模型的分析,但栅格数据表达精度不高,数据存储量大,工作效率低。因此基于栅格结构的应用来说,需要根据应用项目的自身特及其精度要求来恰当地平衡栅格数据结构的表达精度和工作效率两者之间的关系。 矢量数据结构具有“位置明显、信息隐含”的特点,它操作起来比较复杂,许多分析操作(如叠置分析)用矢量数据结构难于实现;但它的数据表达精度高,数据存储量小,输出图形美观却工作效率高。 *两者结合,优势互补

两种数据结构的对照表 比较内容 矢量结构 栅格结构 数据结构 结构复杂、紧凑、冗余度低 简单、冗余度高 数据量 小 大 图形精度 高 低
遥感影像格式 不一致 一致或接近 数据共享 不易实现 容易实现 拓扑和网络分析 叠置分析

场模型的数字表达 栅格 等高线 不规则三角网

不规则三角网(TIN)模型 不规则三角网(Triangulated Irregular Network, TIN)是另外一种表示连续地理实体或者现象的方法,它既减少规则格网方法带来的数据冗余,同时在计算(如坡度)效率方面又优于纯粹基于等高线的方法。

不规则三角网(TIN)模型 TIN是一个三维空间的分段线性模型

不规则三角网(TIN)模型 TIN数据组织 存储每个点的高程,还要存储其平面坐标、节点连接的拓扑关系,三角形及邻接三角形等关系。

TIN的数据组织 TIN数据模型 三角形 + 边 + 顶点 三角形:三个指向它三个组成边的ID
边:两个指向相邻三角形记录的ID和它的两个顶点的记录的ID 顶点:坐标(X,Y,Z)

TIN的数据组织 TIN数据模型 顶点 + 相邻三角形 三角形:三个顶点和三个相邻三角形 顶点:坐标(X,Y,Z)

}

图像压缩是一种减少描绘一幅图像所需数据量的技术和科学。图像和视频通常在计算机中表示会占用很大的空间,而出于节省硬盘空间的考虑,往往要进行压缩。

数据压缩是指减少表示给定信息量所需数据量的处理不同数量的数据可以用来表示相同数量的信息,包含不相关或重复信息的表示被认为包含冗余数据。

若令b和b'代表相同信息的两种表示中的比特数(或信息携带单元),则用b比特表示的相对数据冗余R是

式中,C通常称为压缩率,定义为

二维灰度阵列受如下可被识别和利用的三种主要类型的数据冗余的影响:

  1. 编码冗余。编码是用于表示信息实体或事件集合的符号系统(字母、数字、比特和类似的符号等)。每个信息或事件被赋予一个编码符号的序列,称之为码子。每个码字中的符号数量就是该码字的长度。在多数二维灰度阵列中,用于表示灰度的8比特编码所包含的比特数要比表示该灰度所需要的比特数多。
  2. 空间和时间冗余。因为多数二维灰度阵列的像素是空间相关的(即每一个像素类似于或取决于相邻像素),在相关像素的表示中,信息被没有必要地重复了。在视频序列汇总,时间相关的像素(即类似于或取决于相邻帧中的那些像素)也是重复的信息。
  3. 不相关的信息。多数二维灰度阵列中包含有一些被人类视觉信息忽略或与用途无关的信息。从没有被利用的意义上看,它是冗余的。

假设在区间[0,L-1]内的一个离散随机变量rk用来表示一幅MxN的图像的灰度,并且每个rk发生的概率为pr(rk)。

其中,L是灰度级数,nk是第k级灰度在图像中出现的次数。如果用于表示每个rk值的比特数为l(rk),则表示每个像素所需的平均比特数为

给每个灰度级分配的码字的平均长度,可通过对用于表示每个灰度的比特数与该灰度出现的概率的乘积求和来得到。

当对事件集合(如灰度值)分配码的时候,如果不取全部事件概率的优势,就会出现编码冗余。当用自然二进码表示一幅图像时,编码冗余几乎总是存在的。

8.1.2 空间冗余和时间冗余

在对应的二维灰度阵列中:

  1. 所有256种灰度都是等概率的。
  2. 因为每条线的灰度是随机选择的,在垂直方向上,每条线的像素彼此是独立的。
  3. 因为沿每条线的像素是相同的,因此在水平方向上它们是最大相关的(完全互相依赖)。

压缩数据集的最简方法之一是,从集合中消除多余的数据。在数字图像压缩方面,被人类视觉系统忽略的信息或与图像预期的应用无关的信息显然都是要删除的对象。

8.1.4 图像信息的度量

信息论的基本前提是,细心地产生可用一个概率过程建模,该过程可以用一种与直觉一致的方式加以度量。根据这一推测,我们可以说概率为P(E)的随机事件E包含

单位的信息。如果P(E)=1(即事件总会发生),则I(E)=0,并认为它没有信息。因为没有与该事件相关的不确定性,所以在通信中不会传递关于这个事件已经发生的任何信息。

从一个可能事件的离散集合{a1,a2,...,aj},给定一个统计独立随机事件的信源,与该集合相联系的概率为{P(a1),P(a2),...,P(aj)},则每个信源输出的平均信息称为该信源的熵,即

式中是表示所有n重符号组所需编码符号的平均数。

当信息损失可以表示为压缩处理的输入和输出的数学函数时,则称其是以客观保真度准则为基础的。令f(x,y)是输入图像,并令是f(x,y)的近似,它是对输入先压缩后解压缩的结果。对任意x和y的值,f(x,y)和之间的误差e(x,y)为

因此,两幅图像间总误差为

其中,图像的大小为MxN。而f(x,y)和之间的均方根误差erms是在MxN阵列上平均误差的平方的平方根,或写为

图像压缩系统是由两个不同的功能部分组成的:一个编码器和一个解码器。编码器执行压缩操作,解码器执行解压缩操作。

量化器根据预设的保真度准则降低映射器输出的精度,目的是排除压缩表示的无关信息。这一操作不可逆,当我们希望进行无误差压缩时,这一步必须省略。

在第三阶段,即信源编码处理的最后阶段,符号编码器生成一个定长编码或变长编码来表示量化器的输出,并根据该编码来映射输出。大多数情况下会使用变长编码。 

解码器仅包含两个部分:一个符号解码器和一个反映射器。它们以相反的顺序执行编码器的符号编码器和映射器的反操作。

8.1.7 图像格式、容器和压缩标准

图像文件格式是组织和存储图像数据的标准方法。它定义了数据排列方式和所用的压缩类型——如果有的话。图像容器类似于文件格式,但处理多种类型的图像数据。另一方面,图像压缩标准对压缩和解压缩图像定义了过程,也就是定义减少表示一幅图像所需数据量的过程。

单独对信源的符号进行编码时,霍夫曼编码对每个信源符号产生最小数量的编码符号。

#根据Huffman树的思想:以节点为基础,反向建立Huffman树 #根据输入的字符及其频数生成节点 #因为要排序的是结构体里面的某个值,所以要用参数key #lambda是一个隐函数,是固定写法 #数组pop默认删除最后一个元素,参数为-1可加可不加,并返回该值 #在数组最后添加新对象 #最后一个节点作为根节点 #用递归的思想生成编码 #输入的是字符及其频数

0和1仅作为区分,没有硬性规定概率大或概率小为1。在编码过程中,概率小的信源被分配了更长的码长,概率大的信源被分配了更短的码长。

Golomb编码是具有指数衰减概率分布的非负整数输入的编码。下面的讨论中,符号表示小于等于x的最大整数,表示大于等于x的最小整数,x mod y表示x被y除的余数。

算数编码生成非块码。在算数编码中,信源符号和码字之间不存在一一对应关系。相反,信源符号(或消息)的整个序列被分配了单一的算数码字。这个码字本身定义了一个介于0和1之间的实数间隔。当消息中的符号数量增加时,用于表示消息的间隔会变小,而表示该间隔所需的信息单位(假设为比特)的数量则会变大。消息的每个符号根据其出现的概率来减小该区间的大小。

下图说明了算数编码的基本过程。

自适应上下文相关的概率估计

上图给出了二值信源符号的自适应上下文相关算数编码包括的步骤。当对二值符号编码时,通常使用算术编码。当对每个符号(或比特)开始编码过程时,其上下文由(a)的上下文决定模块形成。(b)到(d)显示了3种可被使用的上下文:(1)前一符号;(2)前一组符号;(3)前一些符号加上前一扫描行上的符号。

LZW编码思想:不断地从字符流中提取新的字符串,通俗地理解为新“词条”,然后用“代号”也就是码字表示这个“词条”。这样一来,对字符流的编码就变成了用码字去替换字符流,生成码字流,从而达到压缩数据的目的。

特点:编码字典或码书是在对数据进行编码的同时创建的。在LZW解码器对编码数据流进行解码的同时,建立了一个同样的解压缩字典。

行程编码技术是沿其行(或列)重复灰度的图像,通常可用相同灰度的行程表示为行程对来压缩,其中每个行程对指定一个新灰度的开始和具有该灰度的连续像素的数量。

压缩二值图像时,行程编码特别有效。因为仅有两种可能的灰度(黑和白),所以邻近像素的灰度更可能是相同的。

接下来使用二值图像进行行程编码处理尝试。首先对一张普通图片进行处理,获得其二值化图像。

# 模式L”为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。 # 自定义灰度界限,大于这个值为白色,小于这个值为黑色

 接下来对获得二值图像进行RLE压缩

使用同样的方法对原图像进行压缩,对原图像(左上)、二值图像(右上)、RLE处理后原图像(左下)、RLE处理后二值图像(右下)进行比较,可以发现RLE处理的二值图像比原图像效果更佳。

8.2.6 基于符号的编码

在基于符号或记号的编码中,图像被表示为多幅频繁发生的子图像的一个集合,称为符号。每个这样的符号都存储在一个符号字典中,且该图像以一个三元组{(x1,y1,t1),(x2,y2,t2),...}的集合来编码,其中每个(xi,yi)对规定了图像中的一个符号的位置,而记号ti是该符号或子图像在字典中的地址。即每个三元组表示图像中的一个字典符号的一个实例。通过仅存储一次重复的符号,可以有效地压缩图像,特别是在文档存储和检索应用中,在这种情况下,符号通常是重复多次的字符位图。

先前讨论的行程编码技术和基于符号的编码技术,可通过单独处理图像的比特平面的方法用于两级以上灰度的图像。概念:把一幅多级(单色或彩色)图像分解为一系列二值图像,并使用几种熟知的二值压缩方法之一来压缩每幅二值图像。

一幅m比特单色图像的灰度可以用如下形式的基2多项式来表示:

基于这种特性,可以将该图像分解为二值图像集的一种简单方法是把该多项式的m个系数分离为m个1比特的比特平面。一般来讲,每个比特平面都由给其像素置一个来自原始图像每一像素的合适的比特值或多项式系数来重建。例如,一个灰度为127(二进制为:)的像素与一个灰度为128(二进制:)的像素相邻,每个比特平面将包含一个对应0到1的转换。

一种代替分解方法(降低较小灰度变化带来的影响)是,首先用一个m比特格雷码表示图像。

块变换编码技术把图像分成大小相等切不重叠的小块,并使用二维变换单独地处理这些块。在块变换编码中,用一种可逆线性变换(如傅里叶变换)把每个块或子图像映射为变换系数集合,然后对这些变换系数进行量化和编码。

预测编码不需要较大的计算开销就可实现较好的压缩效果,并且可以是无误差的或有损的压缩。

预测编码通过消除紧邻像素在空间和时间上的冗余来实现,他仅对每个像素中的新信息进行提取和编码,一个像素的新信息定义为该像素的实际值与预测值之间的差。

小波编码基于以下概念:对图像像素解除相关的变换系数进行编码,比对原图像像素本身进行编码的效率更高。如果变换的基函数(此时为小波函数)将大多数重要的可视信息包装到少量系数中,则剩下的系数可被粗略地量化或截取为零,而图像几乎没有失真。

上图中正变换和逆变换的基所选择的小波影响着小波编码系统的设计和性能的各个方面,它们直接影响到变换的计算复杂性,或间接影响压缩和重建具有可接受误差的图像系统能力。基于小波的压缩广泛使用的展开函数是Daubechies小波和双正交小波

另一种影响小波编码计算复杂性和重建误差的因素是变换分解级别的数量。由于P尺寸快速小波变换涉及P个滤波器组的迭代,正变换和反变换计算中的操作次数会随分解级数的增加而增加。此外,对更高分解级别导致的越来越低的尺度系数进行量化,会影响重建图像中越来越大的区域。

影响小波编码压缩和重建误差的最重要因素是系数量化。尽管最广泛使用的量化器是均匀的,但量化的效果可以通过以下方法进一步改进:

  1. 引入一个以零为中心的较大量化间隔,称为死区。
  2. 从一个尺度到另一个尺度自适应调整量化间隔的大小。

不论哪种情况,选择的量化间隔都必须随着编码图像的比特流传送给解码器。间隔本身可被试探地决定,或根据被压缩的图像自动地计算。

# 0是表示直接读取灰度图 # 小波变换之后,低频分量对应的图像: # 小波变换之后,水平方向高频分量对应的图像: # 小波变换之后,垂直平方向高频分量对应的图像: # 小波变换之后,对角线方向高频分量对应的图像: # 根据小波系数重构回去的图像 # 图像处理函数,要传入路径

低频分量代表图像中亮度或灰度变化缓慢的区域,高频分量代表图像变化剧烈的部分,即轮廓边缘或者噪声及细节部分。

JPEG-2000扩充了流行的JPEG标准,在连续色调静止图像的亚索和压缩数据的访问方面提供了更大的灵活性。

编码过程的第一步是,通过减去,对被编码的Size比特的无符号图像的样本进行直流电平平移。如果图像具有多于一个的分量:如彩色图像的红色、绿色和蓝色平面,则单独平移每个分量。如果恰好有三个分量,就可用使用一个可逆的或非可逆的线性组合来对它们有选择的进行去相关处理。

图像经过级别平移和选择性去相关后,其分量可以被分成多个像块,这些像块是被单独处理的像素的矩形阵列。之后计算每个像块分量的行和列的一维离散小波变换,对于无误差压缩,这种变换是以双正交、5-3系数尺度-小波向量为基础的。对于非整数值变换系数还定义了一个四舍五入过程。在有损应用中,采用了9-7系数尺度-小波向量。

数字图像水印不能从图像本身分离出来,作为水印图像的组成部分,它们以各种方法保护所有者的权益,包括:

  1. 版权识别。当所有者的权益受到侵犯时,数字水印可提供作为所有权证据的信息。
  2. 用户识别或指纹。合法用户的神分可以再水印中编码,并用于识别非法复制源。
  3. 著作权认定。水印的存在可保证一幅图像不被篡改——假定水印被设计成对图像的任何修改都将破坏水印。
  4. 自动监视。水印可以通过系统来监测,系统可在任何时间和地点跟踪所使用的的图像(可搜索放在Web网页上的图像)。对于征收版税和/或非法用户定位监测很有用。
  5. 复制保护。水印可制定使用和复制图像的规则(如对DVD播放器)。
}

摘要:小波变换是在傅里叶变换无法分析突变信号和非平稳信号的基础上产生的、具有多分辨率分析的时-频分析方法。它具有良好的时域和频域局部特性,因而在数据通信领域得到了广泛的领域。本文描述了小波变换技术在图像压缩编码中的简单应用,并在MATLAB平台上进行仿真,实现了一级、二级两种扫描的图像压缩,突出了图像处理中采用小波变换技术的可行性和优越性。

关键词:小波分析;图像压缩;数据通信;MATLAB

随着多媒体信息时代的到来,需要对大量的数据进行处理,而存储空间和网络带宽常受到限制,所以面对具有大量数据的信息时,必须作相应的压缩处理。而小波变换压缩编码以其压缩质量好、压缩比高、能弥补傅里叶变换等特点,在图像压缩等领域得到了广泛的关注和应用。本文首先对图像编码及小波变换图像编码进行了理论苗顺,然后利用MATLAB平台中的小波函数来做图像的压缩,并与行程编码等方式进行比较,验证了小波变换编码的可行性和优越性。

图像压缩编码即:在保证质量的前提下,通过减少图像中的各种冗余,用尽量少的比特数来表示图像信息。对数字图像进行压缩通常利用两个基本原理:一是数字图像的相关性,二是人的视觉心理特征。图像压缩编码的过程可以概括成图1所示的过程,图像压缩编码过程遵循“图像变换――量化――熵编码”这三个处理环节,而这正是图像压缩编码技术的核心。

从图1能够看出图像编码的整个过程由以下三步来完成:

(1)图像变换削弱甚至解除了图像信号内部的相关性,降低结构上的冗余度;

(2)对图像的数据进行量化,减少输入图像的心理视觉冗余;

(3)熵编码生成一个固定的或可变长编码,用于表示量化器输出,然后将输出转化为与编码相一致的格式。

三、小波图像编码原理:

式中a,b和t均是连续变量,b是时移因子,a是尺度因子,ψ(t)为母小波。取 , ,则可以得到离散二进制小波,即

小波变换用于图像压缩的原理,是因为生成的小波图像的能量主要集中于低频部分(亮度图像),而水平、垂直和对角线部分的能量则较少(细节图像)。小波变换的分解方式非常接近于人的视觉感知模型,有利于采用不同编码方法分别进行处理,从而获得符合要求的高压缩比图像。小波图像编码采用二维小波变换的形式,即分别在行和列方向做一维小波变换,对水平方向和垂直方向的冗余去相关性。图像经二维小波变换分解成为一系列不同频率、方向、空间局部变化的子带图像。

一幅图像经过一次小波变换后产生4个子带图像:LL表示原图像的最佳逼近,反映了原图像的基本特性;HL,LH和HH分别表示水平高频分量、垂直高频分量和对角线高频分量,反映图像信号水平方向、垂直方向和对角线方向的边缘、轮廓和纹理。其中,LL子带集中了图像的大部分能量,下一级的小波变换都是针对上一级变换产生的低频子带(LL)再进行变换(如图2)。

对一幅N×N图像 在变换的每一层次上,图像都被分解成四个四分之一大小的图像,如图2所示。这四个图像的每一个都是由原图像与一个小波基图像的内积后,再经过在x和Y方向都进行2倍的间隔抽样而生成的。对第一层次j=1(设原图像为 ):

; ----图像低频近似分量,可对其进一步分解;;----图像高频水平细节分量;

;----图像高频垂直细节分量;

;----图像高频对角细节分量。

以后的每一层次(j>1)依次类推。

a.二维图像的小波分解.选择适当的小波和恰当的分解层数(本文选择2层分解,N=2),计算图像在各个尺度上的小波系数。

b.量化各尺度细节(高频)部分的小波系数并压缩。

c.恢复信号.利用第N层上的近似(低频)小波系数和1~N各层量化的细节(高频)小波系数恢复图像。

在MALAB的小波工具箱中有专门用于压缩处理的函数,本文通过MATLAB7.0实验平台,采用小波基bior3.5,以两层的分解层次实现了离散小波变换的压缩编码,输出结果如图所示:

在工作窗口中同时会显示这样的结果:

由上图可以看出,原始图像中小波分解第一层的低频信息用于第一次压缩,此时压缩效果较好,压缩比较小(3.704);小波分解第二层的低频部分用于第二次压缩的提取,其压缩比较大(12.642),压缩效果在视觉上也能接受,但效果明显不如第一次的压缩。这是一种简单的压缩方法,只保留原始图像中的低频信息,不经过其他处理也可以获得较好的压缩效果。

此外,为了验证小波变换用于图像压缩的优越性,以同样的图片进行仿真实验,分别实现行程编码、离散余弦变换压缩编码方法与小波变换。通过实验,我得到如下结果:

在行程编码的工作窗中显示:

我们可以看出:利用游程压缩编码得到了较大的压缩比,也可以看到像素压缩编码主要是减少编码冗余达到压缩的效果,但这样的编码只是纯粹的压缩,并不能保证图像质量。

而在利用离散余弦变换编码的时候,看到如下的图像显示(如图4)

图4.DCT压缩变换对比图

由此看出:因为其原本的样本值得到相应的系数,所以离散余弦变换本身并不能压缩图像。但是可以对高频分量和低频分量设置不同的量化,使大多数高频分量为0。

小波变换用于信号与图像压缩是其应用的一个重要方面,它克服了传统压缩方法的不足,具有压缩比高、压缩质量好、压缩速度快、抗干扰等特点。伴随着互联网、多媒体以及视频技术等的高速发展,图像压缩的前景十分广阔,小波变换也越来越深得研究者的关注,相信随着小波理论在图像压缩中更深层次的研究,图像压缩技术会越来越成熟。

[1]周伟.MATLAB小波分析高级技术[M].西安:西安电子科技大学出版社,2006

[4]王树亮,任灵萍,郑成增.基于小波变换的图像压缩方法[J].计算机工程与应用,):68-70

[5]黄建华.小波变换在图像压缩中的应用研究[J].辽宁工学院学报,):27-30

}

我要回帖

更多关于 A的平方减B的平方是求什么连续的 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信