当前位置: 开发笔记 > 编程语言 > 正文

为什么Lucene使用数组而不是哈希表作为倒排索引？

作者：LoveCherryz | 来源：互联网 | 2023-01-29 07:18

如何解决《为什么Lucene使用数组而不是哈希表作为倒排索引？》经验，应该怎么弄，您有好建议吗？

我正在观看Adrien Grand 关于Lucene索引架构的演讲,他提出的一点是Lucene使用排序数组来表示其倒排索引的字典部分.使用排序数组而不是哈希表("经典"反向索引数据结构)背后的原因是什么？

散列表提供O(1)插入和访问,对我来说,似乎它可以帮助快速处理查询和合并索引段.另一方面,排序的数组只能提供O(logN)访问和(gasp)O(N)插入,尽管合并2个排序的数组与合并2个哈希表的复杂性相同.

我能想到的散列表的唯一缺点是更大的内存占用(这可能确实是一个问题)和更少的缓存友好性(尽管像查询排序数组这样的操作需要二进制搜索,这就像缓存不友好一样).

那么这是什么一回事？Lucene开发人员必须有一个很好的理由使用数组.这与可扩展性有关吗？磁盘读取速度？还有别的吗？

推荐阅读

tree
java中集合选择（精简）

集合类中只能存放对象，而不能存放原始数据类型的元素，所以当有原始数据类型需要存放时，只能将其转换成相应的包装类对象。1）访问和遍历数组元素时，ArrayList的 ... [详细]

蜡笔小新 2023-08-21 16:00:14
hash
HashMap和HashTable的实现原理

一、HashMap1.HashMap概述：HashMap是基于哈希表的Map接口的非同步实现。此实现提供所有可选的映射操作，并允许使用null值和null键。此类不保证映射的顺序，特别是 ... [详细]

蜡笔小新 2023-08-08 13:57:40
hash
哈希表(HashTable)的开放定址法和链地址法的实现

散列表（Hashtable，也叫哈希表），是根据关键码值(Keyvalue)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速 ... [详细]

蜡笔小新 2023-09-18 20:42:52
hash
java1.7集合源码赏析系列：HashTable、ConcurrentHashMap、HashMap差异分析

HashTable与ConcurrentHashMap均可实现HashMap的功能，对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别，性能上的差异到底在哪里又是如何导致的 ... [详细]

蜡笔小新 2023-09-14 08:45:47
import
关于LinkedHashMap实现LRU缓存算法

缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ... [详细]

蜡笔小新 2023-09-10 10:48:58
hash
HashMap 和Hashtable 的区别?

hashmap线程不安全允许有null的键和值效率高一点、方法不是Synchronize的要提供外同步有containsvalue和containsKey方法HashMap是Java1 ... [详细]

蜡笔小新 2023-08-30 01:25:20
filter
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
hash
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
go
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
tree
HashMap、Hashtable、LinkedHashMap 和TreeMap之间的区别

HashMap、Hashtable、LinkedHashMap和TreeMap之间的区别Map主要用于存储健值对，根据键得到值，因此不允许键重复(重复了覆盖了),但允许& ... [详细]

蜡笔小新 2023-09-25 07:41:02
hash
Java中的HashTable哈希表是什么？

一：概念顺序结构以及平衡树中，元素关键码与其存储位置之间没有对应的关系，因此在查找一个元素时，必须要经过关键码的多次比较。顺序查找时间复杂度 ... [详细]

蜡笔小新 2023-09-24 20:08:16
tree
HashMap、TreeMap、LinkedHashMap、hashtable的区别

Map主要用于存储健值对，根据键得到值，因此不允许键重复(重复了覆盖了),但允许值重复hashMap是hashtable的轻量级实现(非线程安全的实现)，他们都完成了Map接口，主要区 ... [详细]

蜡笔小新 2023-09-23 11:39:44
tree
HashMap JDK1.8原理分析

HashMap、Hashtable、LinkedHashMap和TreeMap下面针对各个实现类的特点做一些说明：(1)HashMap：它根据键的hashCode值存储数据，大多数 ... [详细]

蜡笔小新 2023-08-21 11:49:18
hash
Java 8中HashMap冲突解决

在Java8之前，HashMap和其他基于map的类都是通过链地址法解决冲突，它们使用单向链表来存储相同索引值的元素。在最坏的情况下，这种方式会将HashMap的get方法的性能从O ... [详细]

蜡笔小新 2023-08-19 09:25:50
hash
ArrayList、Vector、HashMap、HashTable、HashSet的默认初始容量、加载因子、扩容增量、具体区别

要讨论这些常用的默认初始容量和扩容的原因是：当底层实现涉及到扩容时，容器或重新分配一段更大的连续内存（如果是离散分配则不需要重新分配，离散分配都是插入新元素时动态分配内存），要将容器原来的数据全部复 ... [详细]

蜡笔小新 2023-08-06 12:58:52

LoveCherryz

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章