非结构化数据特征建模关键技术研究
2023-05-15
来源:乌哈旅游
l S nj rt Grid 第33卷第1期 2017年1月电网与清洁能源 Power System and Clean Energy Vo1.33 No.1 Jan.2017 文章编号:1674—3814(2017)01—0013—05 中图分类号:TM76 文献标志码:A 非结构化数据特征建模关键技术研究 蔡宇翔 ,付婷 ,倪时龙z,苏江文z,刘心z (1.国网福建省电力有限公司信息通信分公司,福建福州350003;2.福建亿榕信息技术有限公司, 福建福州1 350000) Study on Key Technology of Unstructured Data Modeling Features CAI Yuxiang ,FU Ting ,NI Shilong2,SU Jiangwen ,LIU Xin (1.Information&Telecommunication Branch,State Grid Fujian Electirc Power Company,Fuzhou 350003,Fujian,China; 2.Fujian Yirong Information Technology Co.,Ltd.,Fuzhou 350000,Fujian,China) ABSTRACT:In the smart grid data・the unstructured data occupies the largest proportion,and its growth rate is 10 to 50 times of the structured data and the processing of the data has 数据量已高达PB级,即已经进入智能电网大数据时 代。但智能电网还缺乏有效的大数据分析及处理技 术,也缺乏存储海量数据用于提升智能电网运行水 平及效率的方法㈣。因此,进行智能电网海量数据 的存储,构建高效集约的大数据处理平台至关重 要。智能电网大数据内部差异巨大,依据数据内部 become the key technology in the processing of sman grid big data.In view of the large quantity and hysteresis mode of the unstructured data and based on many features of the real data, this paper proposes to build the model for the unstuctrured data. This paper mainly discusses the key technical features of the unstructured data modeling based on smart g d big data are mainly discussed,coveting storage,query and data visualiza— 结构特性,可将数据结构分为结构化、半结构化以 及非结构化3种。其中非结构化数据占据比例最大, 占数据总量的85%以上,且数据增速远超结构化数 据以及半结构化数据。目前,非结构化数据处理已 成为智能电网大数据处理的关键技术,也是大数据 技术的价值体现。 tion and feature space selection of the original data and feature data. KEY WORDS:smart d big data;unstructured data;feature modeling;key technology 摘要:在智能电网大数据中,非结构化数据占据比例最大,且 增速是结构化数据的1O 5O倍,已成为智能电网大数据处理 在智能电网大数据中,非结构化数据具有大规 模、多样、时效等特点,采用传统非结构化处理方式 已难以满足数据处理需求,具体表现为[4_q:传统的 非结构化数据关系模型难以有效表达非结构化数 据;传统非结构化数据模型在数据处理方面难以解 决数量海量需求。为有效解决智能电网大数据的非 结构化数据模型问题,本文从全新角度出发,基于 现实数据特征[71,构建非结构化数据特征模型。并针 对在非结构化数据特征建模过程中面临的原始数 的关键技术。针对非结构化数据存在数量巨大、模式滞后问 题,基于现实数据存在的诸多特征,提出来非结构化数据特 征模型建模。文中重点论述了基于智能电网大数据的非结构 化数据特征建模的关键技术,包括原始数据以及特征数据的 存储、查询以及数据可视化、特征空间的选取等。 关键词:智能电网大数据;非结构化数据;特征建模;关键技术 随着智能电网建设的不断推进,特别是用电采 集系统、在线监控系统的实施及应用,电网公司的 基金项目:国家高技术研究发展计划(863计划)资助项目 据以及特征数据的存储,特征空间的选用,以及信 息查询和数据可视化[8-9]等关键问题进行重点分析。 (2O15AAO5o2O2);福建省电力有限公司科技项目(521320135095 o Project Supposed by the National Hi gh Technology Research and Development Program(863 Program)(2015AA050202);Science 1 非结构化数据及数据特征建模 1.1非结构数据 nd Technology Projecta of State Grid Fujian Electric Power Company Limited(521320135095). 非结构化数据种类繁多,既有常见的文本、音 番 Sm积rl Gr d 1 4 蔡字翔,等:非结构化数据特征建模关键技术研究 可以依据需求定义新的特征。对于非结构化数据 的管理,由于具有海量特点,因此数据对象的快速 定位以及查询已成为数据特征建模的关键。解 决这一关键的问题关键技术则是基于特征的索引 技术。 频、视频及网页数据等,还包括公司企业内部的文档 数据、天气、地理等科学数据。对于任一数据,我们都 可以通过数据对象进行描述,为此,我们可以把非 结构化数据看成一个大集合 。集合当中的每个元 素则可以作为一个数据对象,数据对象无论从物理 角度还是从逻辑考虑,必须是可以区分的独立实 特征类型指具体特征的抽象化形式,主要用于 体。从数据本身考虑,数据也存在粒度问题。一个数 据对象既可以数据较大数据对象的组成成分,也可 以是其他多数据对象的组成的整体。为此,针对具体 问题,必须对数据对象的粒度进行具体划分。 每个数据对象都有一定的意义,且数据本身也 含有复杂的信息,因此,我们可以从不同角度发现 信息,通过不同特征对数据对象所含的信息进行展 现。实际上,现实数据总包涵者很多的特征1111,同样 一幅图,按照图片的格式读取,可以获得很多信息, 依照文本方式读取信息则是乱码,人们很难从中获 得信息。这表明,非结构化数据具有以下特点,即: 数据对象含有很多冗余信息;数据对象的信息主要 通过特征进行表现。为此构建数据特征模型,对非 结构化数据进行管理,可以很好地实现数据的表达 以及展现。 1.2数据特征建模 非结构化数据特征建模重点是进行非结构化 数据管理系统建模,包括3部分,即:原始数据库、特 征数据库以及特征空间。图1所示为基于数据特征 模型的非结构化数据管理系统模型,其中系统的每 个特征对应一个处理类,每个特征处理类都完成特 征抽取、索引以及查询的功能。 回 Raw Database Feature Database Feature Space 图1 基于非结构化数据特征的数据管理系统模型 Fig.1 Data management system model based on the characteristics of the unstructured data 特征是指某些数据或整体数据所具有的共同 特征。特征既可以依据需要定义,也可以依据数 据本身的共性定义。数据对象既有多个特征,也 定义特征意义或表征取值空间和特征值域的度量 关系。若数据对象拥有某个特征且包含该特征类 型,需要满足3点,即:数据对象可以依据某种方式 抽取该特征类型的特征数据;抽取的特征数据必须 具有描述意义;特征数据的取值必须满足特征类型 的取值空间。 非结构化数据管理,必须对所有数据进行统一 管理,但目前还没有合适统一管理模式,即在非结 构化数据特征建模中,进行数据统一管理是关键问 题。为解决这一问题,我们利用郎波等人【 21提出的四 面体数据模型。 数据类型是指几个非结构化数据的特征集合。 特征类型种类繁多,但在具体应用过程中,每个数 据对象意义有限,非结构化数据复杂,但存在清晰 的分类特性。因此,从逻辑上讲,极易抽取有限特 征,并将其映射到特征空间,这几个特征集合则是 数据类型。在非结构化数据特征建模过程中,如何 科学定义数据类型是关键。 2建模关键技术研究 智能电网大数据的非结构化数据内容多样,且 在不断丰富,但还没有一种标准路径或者是普适方 法满足所有非结构化数据的转换需求,也没有方法 能够进行批量自动处理。为有效解决智能电网大数 据的非结构化数据模型问题,进行特征建模至关重 要。在基于智能电网大数据,进行非结构化数据特 征建模过程中,原始数据以及特征数据的存储、查 询以及数据可视化、特征空间的选取等极为关键, 本文主要针对这几个问题进行关键技术研究。 2.1 基于原始数据及特征数据的存储关键技术研究 基于智能电网大数据的非结构化数据主要来 源于技术人员的个人存储介质以及企业的现有系 统。即非结构化数据包括两部分:原始数据和特征 数据。针对原始数据的存储,智能电网系统主要基 于分布式文件系统HadoopIl】】(HDFS)作为原始数据 1 5 的仃储媒介进行 作为 个 源的分 式义什系 统,ll loopl/l ̄f 通},(:l IIf以 效进i 分布式 储 以及处 ,ji、- 逆j人优坍 J 良好的 锵特性和j叮扩 腱 lI{l{loop这种特 Iq ̄4f.@r集群系统』JJ1人数 j 人的 题. 1人J 结构 统 ,¨ 数 仔储方式 要利用原生念 (Raw Jara)进行,这种_f=;! 的非结构化数据汁算机 址尢法 l刖的。为r对 问类 数据进行统一处 ,智能IU 的ttG! ̄构化数据采用捕述性信息,结 点, 效扩 仔储 i L I I『以 r效解决智能IU 的 结构化数 合p LI 休模J 进行 结构化数据的统一管蝉。 【fIi 体模Jll』仃1个顶点和4个刎面以及刎而之问的交线, 如降13I ̄i:, 特 数 = 婴川j:拊述数 埘象的符f特 , J 仆干}}J.1== l所/J: 特 数 类, 彩样,他 符、 数、浮点数等 II1 J 多数膻川系统、J 务 多 个f卜命川j9J。II_流干‘一 、I 务完结 他h:接进入9 I 状念,这 致数 战收llIf小-Ll{,匕 ̄IfJr1- 按泼H义流 小 或 嚣附什, 增JJll r IIG 构化数据的检索雄度 m车『火特 数 仃储川题,』. Map I ̄e(1u( 汁锋卡jl J ,把复杂 题分解成多个 lII题进{】 独 处川 , f』l擎 』弋选择分 式 储 仔储f』l /f Nam㈨Ⅲ ,JI 警卡I! fil1)at洲o( j I卡ll 2种,am i川 引擎攸』 要将仃储数拆 利JI JM}JIl 式进 分 I 形成符l: J 块, 进i J 块的分眦;1)ilIa『mt Jc,jI 模式则足接 受这些 块,外 成数 特 的仃储以及永久保 仃 此外№川t洲,rlt 还『1lJ‘以实现埘处 过程的追踪 2为分 储fJl 卡I!』 I冬1. 表I 牝 00 结构表哥 Fetdure l Name Fealtlrt ̄l I)ata Fea/ure2 Name Fealun-2 Dala Feature3 NaBe Featur('3 Data Feature4 Name Feature4 I)ata 匝墓园 臣 巫 圈2分布式存储引擎校式网 }、ig.2 1)istril’Iite(I ()rage enlline IIIO(1e 2l2基于非结构化数据统一管理的关键技术研究 以文本、 像、音频等为基础的 { 结构化数据, 数捌标 (V) 3闪幽体投型立体 iR. }’ st)et‘“、C“ 、Ilf a t 【ralu ̄(Ira{i1mdei I『I『休模型的组成可以表示成 retrahe(Irf】n: (V,BA,Ig,I,F,RI),CONJS)形式:v代表四 体顶 ・ ,,个数为 ,且足BA、SI'、、LF的交点,这表明四面体 唯一;IjA代表四面体綮本的属性刻面,用于展爪数 据 本 ,但这些数据不包含 称、类型等在内 的数据 “义属性;SF指代四面仆的语义特征【fI=『,指 代数 的i 义特征,臀 ,—E’题说明、创作意图等;I F 则指代 nf体的底 特 面,主要川 :指代数据的 底层特 ,包括图像颜色、纹理等;RDI)IIJ表爪原始数 据刎【fii,川r指代数据的原始存储文件;CONJStL ̄JIH 于表示/f 川刻 相交的连接线,用于指代两刻而问 的连接 L{面体模型既IJJ 以集成语义、底层等特征, 实现非结构化数据的统一表达,也可以支持语义特 、底 特 等的扩展,}L四面体模 进行数据统 一僻 彻 有效 2.3基于特征空间存储的关键技术研究 特 问,也被人f『】称作索引库结构,埘于每 个特 ,都对应一个特征维度,每个特征维度有独 的特 ff[ 问。存进行智能电网的非结构化数据 对象存储时,其在每个维度都有自己的取值。对于 特征 数据的存储,主要以“特征维度”作为 础,即每个特征都具有一个存储对象。为有效存储 特征 问,常选用HBase作为存储媒介。HBase作为 一个类似 J:Bi gtable的分布式数据库,是一个稀疏 的、可以K期存储的、具有对维度排序的映射表。对 于映射农, 上的数据 要取决于关键字、列关键 砸 禁 翔,等: 占构化数据特 矬模火键技术研究 型,往进行智能电网的非结构化数据构建时,本文 选用UQI 一种非结构化数据杏询语言。 UQL查询语 既可以完成非结构化数据的多利t ;著 _- 字以及时问戳等,每个特征在Hl;ase当中对应一个 表进行,对于特征的每个元素都呵以在映射衷中 定义I1 。 查询功能,还可以进行数据定义以及数据基本统计 等。其基本功能包括:依据基本属性以及语义特征 进行数据基本检索功能;依据Hj户输入,譬女¨图像 等,通过底层特征匹配方式进行数据检索;依据基 本属性、语义特征、底层特征等进行多模态关联榆 索;以数据某刻面信息为基础,进行多种类型、多数 主流非结构化数据存储主要利用自定义数据 规范键值对数据本 存储,在进行数据提取时,需 要特定的单条数据..然而在电力服务企业的智能电 网系统中,非结构化数据检索不是为了获得特定单 条数据,而是对具有某类特征的系列数据进行记 录。为进行有效检索,技术人员通过手工或者系统 辅助模式进行,这不仅提高成本,还对技术人员提 出更高要求。 据的关键检索;针X寸聚类、分类、多维数据分析等查 询结果,进行智能检索;还可以定义数据,并对数据 进行统计等。UQL的各种检索方式可以复合使用进 行数据综合检索i 31。 为优化非结构化数据检索,实现数据的快速检 索,智能电网的非结构化数据检索系统以MaD Re iuce模型为基础,构建Master-S1ave的并行化检索 框架,进行数据的并行化处理。MasterX;]所用Slave进 基于四面体模型的非结构化数据特征模型,其 基本属性及语义特征都利用文本进行描述。由于 XML具有极佳的手,‘展性,为此,。口J 以基于XMI 进行四 行管理,并承担检索任务分解与分配功能,可实现 检索结构的高效整合。slave模块具有承上启下作 面体模型的基本属性刻面与语义特征刻面。我们主 要以目前广泛使用XQuery语言为基础进行研究。在 XML查询语言中,XQuery应用最为广泛,但无法进 行底层特征查询、智能查询等。为实现底层特征以 及智能查询,本文结合uQI进行xQuery扩展,即 于 XQuery的非结构化数据查询语言uQL。UQL文法,其 描述语言采用扩展巴科斯一瑙尔范式(EBNF)。UQL 定义了3类操作语句,即:数据查询、定义以及统计。 其中主要查询语句为Query语句,其整体结构的获 用,既可以将数据检索的具体人员上传给Master,也 可以将检索结构进行并行化处理。如图4所示,为基 于数据查询的并行化处理框架结构图。 行化榆索0I擎 Master 匝囹臣 Slavel slave2 / \得,主要经过改写XQuery查询语言的FLWOR表达 臣 臣四臣姻… 臣圜 式得到。具体改写方式为:省去Let语句与c,rderbv 语句,添加intelligence与filepath,这一语句,其主要 功能是实现智能查询以及实例查询。如下所示,为 Query语句: Query Clause::-For Clause Where Clause Return } {4 j { l、、…mt} 簟臻l} i { 譬 l j; 《州 、、 £ }球 Ⅲ t e Intelligence Clause?File Path Clause? {一j};dai s) UQL数据查询语言来讲:Define Clause为数据 2 s 毒匀 I矗的 连移≯ ^, 蠢 定义语句,主要定义数据的类别以及语义项字段信 息,基于XML模式,完成个性化定制数据的基本属 性与语义特征;Count CIause作为数据统计语句, 应用非结构化数据进行搜索,需要与用户接口 使用。人们通常采用关键词输入模式进行操作,这 种方式操作简单,但无法实现全面准备的信息表 达,也不利于用户分析处理复杂数据。为此,进行基 主要依据统计数据的类别、基本属性等,完成数据 的统计功能。UQL结合四面体模型,通过基于语义 与底层特征的单项、关联等检索方式,结合聚类等 于大数据的非结构化数据管理,必须创建统一查询 语言,使其满足用户的多种需求,可以完整的表示 查询意图。针对四面体数据的非结构化数据特征模 智能化操作,实现基于非结构化数据的上层应用 操作。 Smart Grid 第33卷第1期 电网与清洁能源 1 7 3 结论 本文基于智能电网大数据的非结构化数据,进 行特征建模,并对建模过程中存在的关键问题进行 研究,结果如下: 1)在进行非结构化数据特征建模过程中,主 要涉及的关键问题包括原始数据以及特征数据 的存储、查询以及数据可视化、特征空问的选取等, 有效解决这些问题,可以很好地实现数据特征的 建模。 2)针对原始数据以及特征数据的关键,本文主 要通过Hadoop分布式系统,基于ap Reduce计算模 型,把复杂问题分解成多个子问题进行独立处理, 进行分布式存储引擎方式;针对非结构化数据的统 一管理问题,主要基于四面体模型,将多源数据进 行统一存储以及关联操作;基于特征空间的存储, 则主要基于HBase作为存储媒介进行存储;有效进 行数据的快速检索,主要利用Map Reduce模型,构 建并行化框架体系Master—S1ave,进行并行化处理; 对于查询语言,则使用非结构化数据查询语音UQL 进行。 这些关键技术的实施,可有效提高智能电网大 数据的非结构化数据特征建模的效率,有效解决传 统非结构化数据关系模型难以有效表达非结构化 数据,有效解决非结构化数据的海量特性及数据处 理方面不足的问题。 参考文献 [11】 王金丽,盛万兴,王金宇,等.中低压配电网统一数据采 集与监控系统设计和实现【J】.电力系统自动化,2012, 36(18):72—76. WANG Jinli,SHENG Wanxing,WANG Jinyu,et a1. Design and implementation of a uniifed data acquisition and monitoring system for medium and low voltage distli- bution networks[J].Automation of Electric Power Systems, 2012,36(18):72—76(in Chinese). 【2]姚成,黄国方,仲雅霓,等.基于站控层GOOSE的站域 控制实现方案【J】.电力系统自动化,2012,36(18):159— 160. YAO Cheng,HUANG Guofang,ZHONG Yani,et a1. Power station control based on station GOOSE[J].Auto— marion of Electirc Power Systems,2012,36(18):159— 160(in Chinese). 【3】 SUDIPTA G,GHOSHAL S P,SARADINDU G.Optimal sizing and placement of distributed generation in a network system[J].Electircal Power and Energy Systems,2010,32 (18):849—856. [4]田万鹏,王建民.一种基于特征的非结构化数据演化管 理建模框架[JJ.计算机研究与发展,2010,47(Z1):394— 399. TIAN Wanpeng,WANG Jianmin.Framework of unstnrc— tured data evolvement management based on feature[J]. Journal of Computer Research and Development,2010, 47(Z1):394—399(in Chinese). [5】石松.基于企业架构的非结构化数据管理平台建设研 究『J1.软件导刊,2012,l1(9):115—118. SHI Song.Study on the construction of unstructured data management platform based on enterprise architecture[J]. Acta Automatica Sinica,2012,11(9):115—118(in Chinese). 【6】冯国平,古明生,吉小恒.电网非结构化数据管理平台 研究与实现[J】.南方能源建设,2015,2(Z1):222—225. FENG Guoping,GU Mingsheng,Ji Xiaoheng.Study and realization of unstructured data management platform for power grid[J].South China Energy Construction,2015,2 (Z1):222—225(in Chinese). 【7J李玉坤,孟小峰,张相於.数据空间技术研究【J】_软件学 报,2008,19(8):2018—2031. LI Yukun,MENG Xiaofeng,ZHANG Xiangyu.Study on data space technology[J].Journal of Software,2008,19 (8):2018—2031(in Chinese). 【8】潘云鹤,庄越挺,孙建伶,等.一种非结构化数据管理 的全过程建模方法,CN102779186A[P].2012. [9】韩晶.大数据服务若干关键技术研究【D】.北京:北京邮 电大学,2013. [10】ZHANG Jing.A new heuristic reduct algorithm base on rough sets theory.Advances in Web—Age Information Management,International Conference,WAIM 2003, Chengdu,China,August 17-19,2003,Proceedings, 2003:247-253. 【1 1】郎波,张博宇.面向大数据的非结构化数据管理平台关 键技术[J】.信息技术与标准化,2013(10):53—56. LANG Bo,ZHANG Boyu.Key technologies of unstructured data management platform for large data[J].Information Technology and Standardization,2013(10):53—56(in Chinese). 【12】WANG Lizhe,TAO Jie,RAJIV Ranjan,et a1.G-hadoop: map reduee across distributed data centers for data— intensive computing[J].Future Generation Computer Sys一 (下转第23页) Smart Grid 第33卷第1期 电网与清洁能源 23 eelosure of EHV transmission lines[J].Electric Power Au— and UHV transmission lines[J].High Voltage Engineering, 2014,40(6):1822—1827(in Chinese). tomation Equipment,1995,15(2):10—18(in Chinese). f1 11李永丽,李博通.带并联电抗器输电线路三相永久性和 瞬时性故障的判别方法fJ].中国电机工程学报,2010, 30(1):82—90. LI Yongli,LI Botong.Identiicatifon of three—phase per— 『161梁振锋,索南加乐,宋国兵.基于电流差动的双端带并 联电抗器输电线路三相重合闸永久性故障判别【J1.电网 技术,2011,35(6):183—187. LIANG Zhenfeng,SUONAN Jiale,SONG Guobing.Dif— ferential current-based identiifcation of permanent faults or tfhree—phase autoreclosure on transmission line with manent or temporary fault at transmission lines with shunt reactors[J].Proceedings of the CSEE,2010,30(1):82- 90(in Chinese). shunt reactors at both ends[J].Power System Technology, 【l2】邵文权,加玛力汉,宋国兵,等.基于电容参数识别的 201 1,35(6):183—187(in Chinese). 永久性故障判别方法fJ】.西安交通大学学报,2008,42 (6):708—712. SHAO Wenquan,JIAMA Lihan,SONG Guobing,et a1. Permanent fault identification based on capacitance para- [17】梁振锋,索南加乐,宋国兵,等.基于模型识别的三相 重合闸永久性故障判别『J].电力系统自动化,2010,34 (8):81—85. LIANG Zhen ̄ng,SUONAN Jiale,SONG Guobing,et a1. Discrimination of permanent faults for three—phase autor- meterfJ】.Journal of Xi’an Jiaotong University,2008,42 (6):708—712(in Chinese). eclosing based on modal identification[J].Automation of Electirc PowerSystems,2010,34(8):81-85(in Chinese). 『131邵文权,宋国兵,索南加乐,等.带并联电抗器输电线 路三相自适应重合闸永久性故障判别[J].中国电机工程 学报,2010,30(4):91—98. SHAO Wenquan,SONG Guobing,SUONAN Jiale,et a1. Identification of permanent fault for three—phase adaptive 【18】索南加乐,张怿宁,齐军,等.Ⅱ模型时域电容电流补 偿的电流差动保护研究【JJ.中国电机工程学报,2006, 26(5):12—18. SUONAN Jiale,ZHANG Yining,QI Jun,et a1.Study of current differential protection using time-domain capaci— reclosure on transmission lines with shunt reactors[J].Pro— ceedings of the CSEE,2010,30(4):91-98(in Chinese). tive current compensating algorithm on H-model[J].Pm— ceeding of the CSEE,2006,26(5):12—18(in Chinese). [14】索南加乐,梁振锋,宋国兵.采用模量参数识别的三相 重合闸永久性故障判别原理[J].中国电机工程学报, 2010,30(25):81—86. SUONAN Jiale,LIANG Zhenfeng,SONG Guobing.Per— manent faults identification based on mode component for 【19]宋国兵,李森,康小宁,等.一种新相模变换矩阵[J]_电 力系统自动化,2007,31(14):57—60. SONG Guobing,LI Sen,KANG Xiaoning,et a1.A novel phase—mode transformation matirx[J].Automation of Elec— trie Power Systems,2007,31(14):57—60(in Chinese). three—phase autoreclosing on transmission lines with shunt reactors[J].Proceedings ofthe CSEE,2010,30(25):81— 86(in Chinese). 收稿日期:2016—09—25。 作者简介: 【15】邵文权,南树功,张望妮,等.利用过渡电阻特征的超/ 特高压输电线路电弧性故障及熄弧时刻识别『J].高电压 技术,2014,40(6):1822—1827. SHAO Wenquan,NAN Shugong,ZHANG Wangni,et a1. Arcing fault detection and arc extinction time capture based on characteristics of transition resistances for EHV 邵文权(1978一),男,博士,副教授,研究方向为输电线路继 电保护及自适应重合闸; 刘悦(1992一),女,硕士研究生,研究方向为输电线路自 适应重合闸。 (编辑粤 冉每妻 牟 8卑 碎 每 李沈) 斗粤 尊卅- 习? 聿 辱蔓 讳: 皇 辞 希尊 f上接第17页) tems,2013,29(3):739—750. 收稿日期:2016—06—22。 【13】王立峰.HBase数据库中大对象存储方案的研究[J].电脑 知识与技术,2014(23):5401—5402. WANG Li ̄ng.Study of large object storage scheme in hbase database[J].Computer Knowledge and Technology, 作者简介: 蔡宇翔(1984一),男,高级工程师,主要研究方向为大数据、 信息安全,荣获“国家电网公司信息化架构专家”,“国家电网公司 优秀专家人才”等。 2014(23):5401—5402(in Chinese). (编辑李沈)