作者:Lucifer叨 | 来源:互联网 | 2023-09-03 11:08
Lucene是业界最罕用的搜素引擎,咱们所熟知的solr和elasticsearch都是基于Lucene所实现。然而随着数据体量的一直减少,当处于万亿数据的场景之下,所有的惯例操作都会面临海量数据带来的微小压力,如何在保留Lucene高效的全文检索能力的状况下应答万亿数据的挑战,同时突破大数据技术栈各组件性能繁多,适配简单的问题。
— QCon寰球软件开发大会(北京) —
Lucene是业界最罕用的搜素引擎,咱们所熟知的solr和elasticsearch都是基于Lucene所实现。然而随着数据体量的一直减少,当处于万亿数据的场景之下,所有的惯例操作都会面临海量数据带来的微小压力,如何在保留Lucene高效的全文检索能力的状况下应答万亿数据的挑战,同时突破大数据技术栈各组件性能繁多,适配简单的问题。针对于此,咱们将会在本次QCon寰球软件开发大会上分享咱们这些年在实现基于Lucene的万亿数据挑战中所遇到的问题和解决方案。
01 讲师介绍
郑其华 录信数软 技术总监
原FNST(富士通南大)资深工程师,富士通零碎监督中间件产品项目经理,10年以上软件开发与保护教训
富士通中间件Lifecycle Management和Job Management认证专家
曾负责华为RTOS(实时嵌入式操作系统)的保护,对Linux内核、零碎监督等方面有丰盛教训
中汽研《2020汽车企业数字化研讨会》受邀演讲嘉宾
02 内容预报
万亿数据的挑战与实现
万亿挑战之一:数据存储
如何解决读写不平衡问题,让磁盘盲目分工,实现主动平衡?
如何解决数据安全问题,防止磁盘损坏、误删失落对于生产的影响?
如何解决数据存储老本过高,适度依赖于SSD盘的硬件困局?
万亿挑战之二,检索性能
如何实现在万亿数据的全文检索中的秒级响应?
万亿挑战之三,多维统计
如何升高IO耗费,实现百万条数据霎时导出?
万亿挑战之四,区域检索
如何晋升地理位置检索能力,晋升地理位置检索的精确性?
万亿挑战之五,计算框架
如何晋升Spark性能从而大幅提高零碎的响应工夫?
5月29日,咱们北京见!