热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

半结构化数据

1、半结构化数据定义结构化数据:传统数据库中定义的数据,商业的交易数据等都是拥有固定的数据结构。非结构化数据:另一个极端,对于图片、声音和生文本(指未经计算机处理的预料),这些数据

1、半结构化数据定义

结构化数据:传统数据库中定义的数据,商业的交易数据等都是拥有固定的数据结构。

非结构化数据:另一个极端,对于图片、声音和生文本(指未经计算机处理的预料),这些数据完全没有固定结构,故被称为非结构化数据。

半结构化数据(semi-structured data):处于两个极端之间,结构隐含在数据中的,或者模式繁多且经常变化以至于会忽略的数据称为半结构化数据。


政府开放数据各个源数据模式不确定,多属于半结构化数据范畴。



2、半结构化数据特征

(1)数据结构自描述性。结构与数据相交融,在研究和应用中不需要区分“元数据”和“一般数据”(两者合二为一)。

(2)数据结构描述的复杂性。结构难以纳入现有的各种描述框架,实际应用中不易进行清晰的理解与把握。

(3)数据结构描述的动态性。数据变化通常会导致结构模式变化,整体上具有动态的结构模式。


3、半结构化数据模型

结构化数据模型:E-R模型、关系模型和对象模型

半结构化数据模型:



  • OEM(ObjectexchangeModel),对象交换模型

  • OIM(ObjectIntegrationModel),对象融合模型【找不到!】

    ​ + IntegratedObjectModel(IOM),集成对象模型【好像不是一个东西】

    ​ + https://support.sas.com/rnd/itech/doc/dist-obj/iom.html​

  • MFRO(MinimalFullRepresentationObjects),最小完整表示对象【找不到?】


在数据库方法中,半结构化数据的表示一般用OEM(Object Exchange Model)[4]模型.也可用OIM(Object Integration Model)模型[4,5,6],

用MFRO(Minimal Full Representation Objects)[7,8]方法实现其模式抽取。OIM是OEM的一种变形数据模型。数据库方法的应用集中在模式发现、多层数据库的建立或数据向导(Data Guides)的建立以及web查询系统。






作者:西伯尔




出处:http://www.cnblogs.com/sybil-hxl/


本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。



推荐阅读
author-avatar
守护琳的心
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有