作者:只爱裙装 | 来源:互联网 | 2024-10-15 11:42
编辑手记:Oracle 12.2 在内核上有许多创造性的改进,这些改进让数据库的操作更加高效便捷,同时一些面向智能运维和大数据的改进,则迈出了云和大数据时代的重要一步。在今年的DB-Engines的评选中,Oracle位居榜首,而我们从12.2的这些更新中便知道,Oracle是DBMS当之无愧的领导者。
注:文章内容来自官方文档翻译。若需要了解更多,请查阅官方文档。
1、Partition-Specific Near Real-Time Indexes(近实时索引的配置)
12.2中可以在分区级别指定使用近实时索引的选项(STAGE_ITAB设置),频繁更新的分区可以启用接近实时的索引,而较少频繁更新的表可以关闭它。
当使用STAGE_ITAB索引选项创建CONTEXT索引时,将创建一个空的$ G表,其中包含$ H btree索引。 将g_index_clause子句与STAGE_ITAB索引选项结合使用可改善广泛用于DML操作的CONTEXT索引的SQL查询的性能。
并且在12.2中可以指定近实时$ G索引表的最大大小,若调整最大大小,会将更新写入主$ I表,指定最大大小可防止近实时$ G索引表过大而无法容纳到内存中。
2、Partitioning: Auto-List Partitioning(自动列表分区)
数据库会自动为表的每个不同分区键值创建一个单独的(新)分区。自动列表分区减少了DBA管理分区的负担,为需要单独分区的大量不同键值手动维护分区表列表。 它还自动处理未计划的分区键值,而不需要DEFAULT分区。
3、Adding New Document Formats(添加新的文档格式)
在12.2版本中,Oracle Outside-In Technology支持的格式可以使用AUTO_FILTER编制索引,新添加的格式也可以索引。
4、Structured/Sort Data (SDATA) Section Improvements
对SDATA节进行了以下改进:
B树支持的SDATA部分可进行范围搜索,以获得更好的性能。
SDATA可以针对SEARCH或SORT操作进行优化
多值SDATA节 - 组数在结果集接口中的SDATA节上可用。
这些SDATA改进在Oracle Text索引环境中提供更好的性能和更灵活的混合查询。
5、Availability of Updated Documents in Index(更新文档在索引中的可用性)
在早期版本中,当文档更新时,在索引同步之前,无法搜索它们。
在12.2中,可以选择保留旧的甚至过期的索引条目,以便仍然可以从其原始内容中找到文档。
若对文档做小的改动,不必立即执行索引同步,仍然可以进行索引。
6、Read-Only MDATA Sections(只读MDATA段)
普通的MDATA段可以在不需要重新索引整个文档的情况下呗更新,但这样做会产生性能成本。
在12.2中,可以选择将MDATA段指定为read-only,这意味着它们只能在文档更新和索引同步时被更改。
此功能为查询提供更好的性能,因为不需要额外的游标来处理read-only MDATA段。 减少所需的光标数量也可以防止超过OPEN_CURSORS系统参数的限制。
7、 Sentiment Analysis and Collocates(情绪分析和搭配)
情绪分析?!
介个好像听起来很神奇的样子,是否很多人跟我一样第一次听说数据库还能实现这功能,一种被打脸的感觉。
Oracle文本支持情感分析和搭配。 情绪分析提供与搜索词相关联的积极和消极趋势的识别。与搜索术语相关联的积极或消极趋势的识别允许构建更丰富的搜索应用。
想了解更多的朋友看这里:
Oracle文本能够通过训练以识别情感元数据的情感分类器来对主题或文档执行情绪分析。
随着数据量的增加,如果组织能够获得对其数据的更多洞察,而不仅仅是响应于搜索查询获得"命中",这将会产生很大的价值。洞察可以是回答某些基本类型的查询(例如天气查询或关于最近事件的查询)或提供关于用户指定的主题的意见的形式。关键字搜索提供包含搜索字词的结果列表。但是,要识别关于搜索术语的情感或意见,则需要通过浏览所有结果,然后手动查找所需的情绪信息,进行进一步的数据分析。情绪分析提供一个一步过程来识别一组文档内的情感信息。
情感分析是从一组文档中识别和提取与指定主题或实体相关的情感元数据的过程。使用训练的情绪分类器来识别情绪。当使用情绪分析运行查询时,除了搜索结果之外,还标识和显示情绪元数据。情绪分析提供诸如"产品评论是肯定的还是否定的"或"客户满意还是不满意"的问题的答案。例如,从由针对特定产品的多个评论组成的文档集中,可以确定指示产品是好还是坏的整体情绪。
8、 Extracting Synonyms of Words in Documents(提取文档中单词的同义词)
CTX_DOC PL / SQL包中的TOKENS和POLICY_TOKENS函数现在允许指定同义词库名称,执行该操作,返回的结果包括文档中的实际词以及由指定的词库定义的那些词的所有同义词。
此功能为数据分析和数据挖掘软件提供了优势,因为可以处理文档中找到的单词的所有变体。
9、Changes to NDATA, NEAR2, and NESTED NEAR Query Operators(对NDATA,NEAR2和NESTED NEAR查询运算符的更改)
新的Oracle Text BESTMATCH查询运算符可以找到文档中的术语集合,即使这些术语不存在或以变体形式存在也是如此。
此功能可在未知精确查询字词时提高召回率。
10、Materialized Views: Refresh Statistics History(物化视图:刷新统计历史信息)
物化视图刷新统计信息可以以不同的粒度进行收集,以提供用于分析和报告的历史数据。
存储历史物化视图刷新统计信息可以深入了解物化视图生态系统(或单个特定物化视图)是如何演进的, 这些数据为历史分析和诊断提供了独特的见解。
11、Process Management(进程管理)
此功能通过预先创建过程资源来提高连接时间和并行处理时间。 管理员可以控制预先创建多少进程,以便新连接不必等待。 相反,进程可以使用预创建的进程资源,从而减少连接和并行处理时间。
此功能可提高用户连接的连接和故障转移时间,以及后台进程的进程生成时间。
12、Partitioning: Read-Only Partitions(只读分区)
分区和子分区可以单独设置为只读状态,这样将禁用这些只读分区和子分区上的DML操作,这是对现有只读表功能的扩展。
只读分区和子分区启用对DML活动的精细控制,这增强了分区表的数据管理功能。
13、Partitioning: Multi-Column List Partitioning(多列列表分区)
列表分区功能已扩展为启用多个分区键列。
使用多个列来定义列表分区表的分区标准,可使新类应用程序从分区中受益。
在Oracle12.2中,内核设计方面有很多重要的创新性改进,这些改进使得Oracle数据库的运维能够更好地应对大数据分析和各种智能管理。
更多新特性请登录官网学习。
欢迎加入『云和恩墨大讲堂』,参与我们的学习和讨论。