您的当前位置:首页基于多源数据融合的统计数据空间网格化模型研究

基于多源数据融合的统计数据空间网格化模型研究

2022-06-16 来源:乌哈旅游
第23卷第3期 浙江水利水电专科学校学报 Vo1.23 No.3 2011年9月 J.Zhejiang Wat.Cons&Hydr.College Sep:2011 基于多源数据融合的统计数据空间网格化模型研究 卢克,吴建玉 (浙江水利水电专科学校,浙江杭州310018) 摘要:统计数据调查多以行政单元为空间范围,为解决其在多源数据综合应用分析等方面的空间范围局限性,需 对其进行网格化转换.提出一种基于多源数据融合的通用模型,先确定影响统计指标分布的因子,然后对单元格进 行各因子的影响权重计算,将各因子的权重值叠加,最后通过单元格上的权重值和去调整统计指标值的分布.实验 表明,该模型在基于遥感、地形、生态等数据融合基础上,能使网格结果在空间分配上更科学化. 关键词:统计数据;网格化;多源数据融合;模型 中图分类号:TP271 文献标志码:A 文章编号:1008—536X(2011)03—0055—04 Research on G rid Transformation Model of StatisticaI Data Based on Multi—source lnformation Fusion LU Ke.WU Jian—yu (Zhejiang Water Conservancy and Hydropower College,Hangzhon 310018,China) Abstract:In china,administration space units are used as statistical areas by current official statistics survey.which need griddling based on the GIS because of its limits in integrated application of multi—source statistical data.The grid transfor・ marion model is introduced in the paper in view of multi—sources information fusion,confirming the factors that would impact the distribution of statistics index.The influentia1 weight of relative factors on space units is evaluated and overlaid.in or. der to adjust the covariance index.It iS found by experiments that the model ensures more scientific space distirbution in grid transformation based on the multi—source information fusion of remote sensing,terrain,ecology,etc. Key words:statistical data;griddling;multi—sources information fusion;model 统计数据记录着国家和社会的发展状况,是一 是该行政单元内统计指标的总数或均值,不能体现统 个国家和地区最重要、最基本的信息资源,是认识 计指标的空间分布特征,缺少单元内部的细节信息; 国情(区情)的重要依据.在制定国策(地区政策)、 (2)在进行综合分析时,研究区域不一定与行 经济发展计划时,将自然资源、人口、环境及社会经 政单元范围相一致,导致需要先对数据加工处理, 济发展等统计数据进行综合分析,是解决区域环境 加大分析难度; 和社会问题,实现地区可持续、科学发展的基本条 (3)多源数据融合的基础不同.资源、环境等 件.要实现这些数据的综合分析利用,须先要解决 类型的数据基于的空间单元一般不是行政区划单 统计数据的空间统计单元问题.一般社会经济统计 元,所以与统计数据存在着空间尺度差异,进行融 数据是以行政区划为统计单元,经过普查或抽样调 合分析时存在较大难度. 查等方法,然后逐级汇总,最终获得的数据综合反 由于统计空问单元的局限,不便于区域专业数 映了该行政区某统计指标数据的总和.因此,在与 据综合开发利用,不能充分利用已有的社会经济统 其他数据进行融合分析时存在以下问题: 计数据.实践表明,将统计数据空间网格化方法是 (1)以行政单元为统计范围所得到的统计数据 解决这一问题的有效方法之一.可以将基于行政单 收稿日期:2011—06.23 元的统计数据离散网格化,这样与基于栅格的空间 基金项目:浙江水利水电专科学校校科研基金资助项目 数据(如遥感、DTM地形数据等)基础相一致,便于 (XK2008-25) 作者简介:卢克(1982一),男,浙江瑞安人,讲师.主要研究方 开展分析;亦可以通过对网格单元进行组合,形成 向为地理信息系统应用开发. 所需的研究区域.本文针对统计数据网格化的模型 56 浙江水利水电专科学校学报 第23卷 进行分析,得出一种利用多源数据进行融合的通用 网格化模型. 1 统计数据网格化原理分析 统计数据空间网格化是指将以行政区为空间 范围的统计数据按照一定的策略和规则,采用某种 汁算方法将指标值科学地分配到一定尺度的规则 地理栅格上,以便与环境、地形等数据综合使用,最 终实现多源数据融合分析功能.研究区域统计数据 网格化示意见图1.一般设计的网格尺寸较小,可以 反映区域内部细节信息,在GIS空间分析技术的支 持下,经过网格化后的数据和派生出来的结果,在 时间上形成以网格为基础的时间序列,便于分析其 变化规律;在空间上形成网格间的数据梯度,可以 进行空问分异规律研究;同时也为和遥感,DEM等 栅格数据融合提供了基础¨J. 行政区划单元分布情况 ②研究区域分别情况 I 、 \ / \ , / \ / 、 / \ , , ③统汁数据网格化 ④网格化数据叠加研究区域 图1 研究区域统计数据网格化示意 社会统计数据可以分为两种类型 ,即和值变 量型统计数据和均值变量型统计数据.和值型统计数 据是反映一个区域的社会、经济等属性的总量水平的 一类统计指标,如:GDP、人口数、第三产业总产值等. 均值型统计数据是指反映一个区域的社会、经济等属 性的平均水平的一类统计指标,如:人均住房面积、人 均国内生产总值、人口密度等.该类指标一般是由两 种或多种和值型统计数据经过复合运算而来的. 对于均值变量型统计数据,网格化后的行政单元 内的各网格值按面积加权平均值应等于这个统计单 元的统计值;而对于和值变量型统计数据,网格化后 的行政单元内的各网格值相加总和应等于这个统计 单元的统计值.由于矢量面数据的统计指标值不能简 单地平均分摊到每个网格单元上,需根据统计指标的 特点(专业意义)和其他的影响(限制条件)因子来加 以调整,并由其他类型相关数据辅助,找出与统计指 标的分布存在较强相关关系的影响因子,通过对这些 多源数据进行融合建模,来调整网格化后的统计指标 的空间分布,使之更符合空间实际分布情况. 2 多源数据融合网格化模型 2.1 格网单元大小的确定 合理确定格网单元的大小十分重要.网格单九 面积选择过大则不能体现网格化的作用,且应用还 是存在问题;网格单元面积选择过小则会增大计算 的难度,以及与之匹配的多源数据的处理也会存在 难度.大量的研究文献资料以及实验得出:在选择 格网大小尺度时可以采用源区域单元平均面积大 小的0.2%进行 . 2.2网格化计算模型 下面以人口数据为例,对该网格化模式进行介 绍¨j.此案例在进行人口数网格化时主要考虑到面 积和核心点距离这两个影响因子.这里的核心点数 据选取行政单元驻地点.为了使人口密度分布更符 合实际情况,这里使用行政驻地点数据为辅助,对 单个行政单元内的人口密度分布进行调节,并认为 人口密度的分布是由行政中心向外辐射的,离中心 越近,密度值越大. 设定 为含有人口数属性的行政区划矢量图 层,G为将生成结果的网格单元(栅格)图层. 图层 的属性表中有行政单元 (i=1,2,…,/'/2)面积的字 段A,其值用A 表示;同时属性表中含有表示人口 数的字段C,其值用C 表示.同时假设G图层有n 个网格单元.模型计算流程为: (1)在 图层的属性表中生成一个单位面积 人口数字段 ,计算方法如公式(1): Ti=C /A i:1,2,…,m (1) 在 图层的属性表中生成两个新的字段 、 ,用来存放其各自单元的行政中心驻地点的坐标. 在G图层的属性表中生成两个新的字段 一 ,用来存放其各自的网格中心点坐标. (2)对图层 和c进行空间多边形叠加Union 操作,见图2.Union命令将产生一个新的图层,并保 留原来两个图层的所有区域,新图层U的属性表中 包含V、G图层的相应属性字段.参与后面计算步骤 第3期 卢 克等:基于多源数据融合的统计数据空间网格化模型研究 57 的属性字段有:V图层的ID码字段 、 字段(其值 用 表示)、C字段(其值用C 表示)和 、 字段 (其值用 、yp 表示),G图层的ID码字段G 和 输入涂层 。、yr字段(其值用 、 表示),另外新图层 将 自动生成各新多边形的面积字段 ,其值表示为 A ,i表示V图层的ID码, 表示G图层的ID码 . 叠加图层 结果图层 并保留两个输入图层 的所有多边形 厂’ ‘、J ,、 图2空间多边形并(Union)示意图 . ,、 在u图层中添加一个字段R来存放权重,采用 格网叠加的交集. 距离倒数来作为权重,其值计算如式(2): :— ==== 二二二= (2) (4)在G图层中新建字段P,将U图层中字段 G—ID等于J(J=1,2,…,n)的所有U 字段值相加, 其结果值作为G图层中字段G—ID等于. 对应的P 字段.如式(5): =√(Xp — c,) +(Yp —Ycj) 为了避免网格间的数值差别过大,可以给其设 定范围[Min,Max],当R 小于Min的时候取Min,大 于Max的时候取Max. ∑ (i=1,2,…,m, =1,2,…,n)(5) 在 图层中添加一个字段E来存放调节参数, 由同一个行政单元生成出的新多边形有相同的值, 记为E . 计算结束以后,G图层P字段的内容即是网格 化的结果. 按照上述模型,利用广西市级人口数据来进行网 格化处理,结果见图3.从中可以看出,该方法产生的结 果保持了行政单元统计数据的特征,如果行政单元数 据的空间尺度比较高,则网格的分辨率也会提高,有利 于准确描述统计数据的空间分布;核心点数据也可以 选取居民点或其他点数据,这样一个行政单元内可以 通过公式(3)可以计算出E的值 的取值为G图 层中落在 图层i对象内部或相交的G,对象编号. C =∑E A 形对应的人口数值,其值按公式(4)计算: U f=E ×R ×Ti×A ,(i:1,2,…,m, …(3) (3)在U图层中新建字段 ,用来存储新多边 =1,2, 有多个核心点,这样更能提高其空间分布的精度;另外 如果还能融合DEM、土地利用覆盖等其他与统计指标 相关数据,也可以使其更符合实际的空间分布状况. (4) ,n) 式中, ,表示 图层的 行政单元与G图层的G 统计指标矢量数据 统汁指标栅格化数据 网 图3人口统计数据网格化结果 58 浙江水利水电专科学校学报 第23卷 3 通用模式使用 根据以上分析可以对参与多源融合的辅助数 据分为以下3类: 源数据融合的统计数据的空间网格化方法进行lr 介绍,主要目的是建立一种通用模型,来利用多源 辅助数据将统计指标值更合理的分配到空间网格 单元上.文中以距离行政区划驻地数据作为影响人 口分布的因子,来说明该通用模型的技术实现流 程.对于其它类型的辅助数据,只要合理选择影响 (1)点类数据(如:驻地、居民点数据):采用反 距离权重方式施加影响,正反影响.记为 多个点距离权重的和值. s 提 因子和权重,都可以使用该通用模型来实现空间分 配的更科学化.随着统计数据社会综合应用分析的 深入发展,其网格化将是一项基础工作,本文提出 (2)面类型数据(如:土地利用类型):对其进行 分类分级,不同的类别或等级,赋予不同的权重,可 以是等比、等差的或者是指数、对数的,具体根据统 计指标的意义来确定.将面类型数据和生成的格网 数据进行叠加操作,落在某一类别或等级区域中的 格网获得相应的权重.如果一个网格落在多个类型 的区域上,则该网格的权重值由多个类型确定.记 该类型的权重值为S,. (3)网格类型数据(如:DEMDTM数据):如果网格 的网格化通用模式,在基于遥感、测量、生态和实地 调查等多源数据融合基础上,使统计数据格网化将 向动态方向发展,能提高网格结果数据的实用性和 合理性. 参考文献: [1]范一大,史培军,辜智慧,等.行政单元数据向刚格单元转化的 技术方法[J].地理科学,2004,24(1):105—108. 的大小相同,则不用进行转换;如果分辨率不一致,则 需要对其进行重采样,使其与生成的网格大小相一致. [2]廖顺宝,孙九林.基于GIS的青藏高原人口统计数据空间化 [J].地理学报,2003,58(1):25—33. 对应的网格根据辅助数据获得相应的权重值.记为z,. 结合以上辅助类型数据,该网格化模式需对公 式(3)修改为: [3] 符海月,李满春,赵军,等.人口数据格网化模型研究进碰综 述[J].人文地理,2006,89(3):ll5一l19. [4] 闫庆武, 正富.基于GIS的社会统计数据空间化处理方法 [J].云南地理环境研究,2007,19(2):92—95. C =∑EiSiZiA s ,=l (6) (7) [5] 朱良峰,吴信才,刘修国.GIS中矢量多边形网格化问题研究 公式(4)改为: U ,=E x SR x Ti x A ,×Sj×z [J].地理与地理信息科学,2004,20(1):12—15. [6] MENNIS,JEREMY.Generating Surface Models of Population Using Dasymetric Mapping[J].Professional Geographer,2O03(1):31—43 [7]COHEN M,GREENBERG D P,IMMEL D S,et a1.An efficient radiosity approach for realisity image synthesis[J J.IEEE Comput— er Graphics and Application,1986,6(3):26—35 4 结 语 本文是以人口统计数据网格化为例,对基于多 一・・—■一・・— ・・—+一・・——卜“+“-4-・・--}一”—+一・・—- 一” ・.-4-・・-4--・+・・+・・-4-・・-4-・・+t・ ”+“+“+“-4-”+・.-4-“-4-”+”-4-”+”+”+一+”十一+“+“+“— ”—卜 (上接第36页) 3.7.3健全组织机构和运行机制 级管理人员进行水文化知识的专业培训,以全面掌 要结合水利体制、机制的改革,对组建水文化 握水文化知识,提高工作能力,充分发挥其在水文 化建设中的骨干带头作用.要不断加大水文化软硬 件建设,为水文化建设提供必要的资金支持和物质 组织进行可行性研究,尽快解决组织体系、人员配 置、责任归属、考核措施等制约水文化建设的体制 性问题;各单位党政主要负责人是水文化建设第一 责任人,所在单位党委宣传部门应配备专(兼)职干 部,负责组织实施水文化实践活动;要把水文化建 设纳入考核评价工作的总体部署,列入文明单位创 建、以及干部绩效考核等综合考核范畴. 3.7.4强化人才保证,确保必要的资金和物质投入 要有针对性地组织水文化专(兼)职人员和各 保障,设立水文化建设专项经费并纳入单位预算. 参考文献: [1] 陈雷.大力加强水文化建设,为水利事业发展提供免进文化 支撑——在首届中国水文化论上的讲话[J].河南水利与南水 北调,2009(12):1—4. [2]李宗新.再论水文化的深刻内涵[Jj.水利发展研究,2009(7): 7l一73 

因篇幅问题不能全部显示,请点此查看更多更全内容