作者:守护琳的心 | 来源:互联网 | 2023-10-12 09:36
1、半结构化数据定义结构化数据:传统数据库中定义的数据,商业的交易数据等都是拥有固定的数据结构。非结构化数据:另一个极端,对于图片、声音和生文本(指未经计算机处理的预料),这些数据
1、半结构化数据定义
结构化数据:传统数据库中定义的数据,商业的交易数据等都是拥有固定的数据结构。
非结构化数据:另一个极端,对于图片、声音和生文本(指未经计算机处理的预料),这些数据完全没有固定结构,故被称为非结构化数据。
半结构化数据(semi-structured data):处于两个极端之间,结构隐含在数据中的,或者模式繁多且经常变化以至于会忽略的数据称为半结构化数据。
政府开放数据各个源数据模式不确定,多属于半结构化数据范畴。
2、半结构化数据特征
(1)数据结构自描述性。结构与数据相交融,在研究和应用中不需要区分“元数据”和“一般数据”(两者合二为一)。
(2)数据结构描述的复杂性。结构难以纳入现有的各种描述框架,实际应用中不易进行清晰的理解与把握。
(3)数据结构描述的动态性。数据变化通常会导致结构模式变化,整体上具有动态的结构模式。
3、半结构化数据模型
结构化数据模型:E-R模型、关系模型和对象模型
半结构化数据模型:
- OEM(ObjectexchangeModel),对象交换模型
- OIM(ObjectIntegrationModel),对象融合模型【找不到!】
+ IntegratedObjectModel(IOM),集成对象模型【好像不是一个东西】
+ https://support.sas.com/rnd/itech/doc/dist-obj/iom.html
- MFRO(MinimalFullRepresentationObjects),最小完整表示对象【找不到?】
在数据库方法中,半结构化数据的表示一般用OEM(Object Exchange Model)[4]模型.也可用OIM(Object Integration Model)模型[4,5,6],
用MFRO(Minimal Full Representation Objects)[7,8]方法实现其模式抽取。OIM是OEM的一种变形数据模型。数据库方法的应用集中在模式发现、多层数据库的建立或数据向导(Data Guides)的建立以及web查询系统。
作者:西伯尔
出处:http://www.cnblogs.com/sybil-hxl/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。