spark读取elasticsearch中数据不完整问题

作者：ik82jht | 来源：互联网 | 2023-01-14 12:02

使用spark读取elasticsearch中的数据，使用es提供的api来进行，sc.esRDD("logstash").values官方网站也是这种方式读取数据的，但是我测试的

使用spark读取elasticsearch中的数据，使用es提供的api来进行，

sc.esRDD("logstash").values

官方网站也是这种方式读取数据的，但是我测试的时候有时候会出现读取数据不完整的情况，比如本来读取的数据是这样的

Map(msg -> 2016-03-18 15:24:14 System_ID=ruijie sp_malware:Client_IP=172.40.1.100 Server_IP=61.4.184.50 URL=app.weather.com.cn/dataService/appManage file_name=web scanner2,virus_name=CIH3 Action=block_log Method=POST, srcip -> 172.40.1.100

但是我读取的数据却是这样的

Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:03 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:04 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:04 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:04 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:04 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:05 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:05 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:05 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:05 CST 2017)
Map(@version -> 1, @timestamp -> Wed Jun 28 14:36:05 CST 2017)

看来这种读数据的方式是有问题的，后来就改成读取方式为下面这种方式，加上type

sc.esRDD("logstash/count").values

然后问题解决，

推荐阅读

php
ELK+filebeat安装部署监控springboot日志

ELK服务器端部署1.安装dockercompose，略2.配置docker-compose.ymlcdrootelkvidocker-compose.ymlversion:&am ... [详细]

蜡笔小新 2023-10-11 20:43:29
get
CentOS 7 中配置开机自动挂载 NFS 的解决方案

本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法，并解决了常见的配置失败问题。 ... [详细]

蜡笔小新 2024-11-13 12:05:24
get
深入解析Android Audio系统中的mpAudioPolicy->get_input

在分析Android的Audio系统时，我们对mpAudioPolicy->get_input进行了详细探讨，发现其背后涉及的机制相当复杂。本文将详细介绍这一过程及其背后的实现细节。 ... [详细]

蜡笔小新 2024-11-12 18:52:04
main
理解和优化进程与线程状态转换机制

在Cisco IOS XR系统中，存在提供服务的服务器和使用这些服务的客户端。本文深入探讨了进程与线程状态转换机制，分析了其在系统性能优化中的关键作用，并提出了改进措施，以提高系统的响应速度和资源利用率。通过详细研究状态转换的各个环节，本文为开发人员和系统管理员提供了实用的指导，旨在提升整体系统效率和稳定性。 ... [详细]

蜡笔小新 2024-11-09 18:33:35
php
如何在PHP中计算腾讯云接口签名，实现人脸核身接口的对接与签名配置

在PHP中实现腾讯云接口签名，以完成人脸核身功能的对接与签名配置时，需要注意将文档中的POST请求改为GET请求。具体步骤包括：使用你的`secretKey`生成签名字符串`$srcStr`，格式为`GET faceid.tencentcloudapi.com?`，确保参数正确拼接，避免因请求方法错误导致的签名问题。此外，还需关注API的其他参数要求，确保请求的完整性和安全性。 ... [详细]

蜡笔小新 2024-11-08 21:58:28
get
Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案

Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案 ... [详细]

蜡笔小新 2024-10-26 16:29:42
hook
利用Jenkins与SonarQube集成实现高效代码质量检测与优化

本文探讨了通过在 Jenkins 多分支流水线中集成 SonarQube，实现高效且自动化的代码质量检测与优化方法。该方案不仅提高了开发团队的代码审查效率，还确保了软件项目的持续高质量交付。 ... [详细]

蜡笔小新 2024-10-26 13:04:29
hook
工具系列 | 分布式日志管理graylog 实战

Graylog是一个开源的日志聚合、分析、审计、展现和预警工具。功能上和ELK类似，但又比ELK要简单，依靠着更加简洁，高效， ... [详细]

蜡笔小新 2024-10-01 00:16:40
ip
优秀到卓越就差比他更快搭建elk集群架构上篇

工作原理开源分布式搜索引擎，特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制 ... [详细]

蜡笔小新 2023-10-10 19:47:17
php
E L K ⽇志分析系统

ELK⽇志分析系统elk介绍1.应⽤需求前景（1）业务发展越来越庞⼤，服务器越来越多；（2）各种访问⽇志、应⽤⽇志、错误⽇志量越来越多，导致运维⼈员⽆法很好的去管理⽇志；（3）开 ... [详细]

蜡笔小新 2023-10-10 16:24:00
process
如何更有效地提升对支持部门的协助与支撑？ - Enhancing Support for the Support Department: Strategies and Best Practices

尽管我们尽最大努力，任何软件开发过程中都难免会出现缺陷。为了更有效地提升对支持部门的协助与支撑，本文探讨了多种策略和最佳实践，旨在通过改进沟通、增强培训和支持流程来减少这些缺陷的影响，并提高整体服务质量和客户满意度。 ... [详细]

蜡笔小新 2024-11-07 06:55:33
process
C#微信开发入门教程第二篇：新手快速上手指南，含详细视频讲解

在距离上次课程一个多星期后，我们终于带来了第二讲的内容。虽然原计划是一周一次更新，但由于工作繁忙有所延迟。近期在交流群中发现，一些初学者已经能够熟练调用微信接口，但对微信公众平台的消息接收处理机制还不够了解。因此，本次课程将详细介绍如何高效处理微信公众平台的消息接收，并提供详细的视频讲解，帮助大家快速上手。 ... [详细]

蜡笔小新 2024-11-02 11:21:57
process
探讨 jBPM 数据库表结构设计的精要与实践

探讨 jBPM 数据库表结构设计的精要与实践 ... [详细]

蜡笔小新 2024-10-29 12:46:10
php
如何在微信公众平台构建新浪云服务应用程序

如何在微信公众平台集成新浪云服务应用摘要：新浪云服务平台SinaAppEngine（简称SAE）自2009年启动内部研发，并于同年对外开放。本文详细介绍了如何利用SAE的强大功能，在微信公众平台上构建高效、稳定的云服务应用程序，涵盖从环境配置到应用部署的全流程，为开发者提供详尽的技术指导与实践案例。 ... [详细]

蜡笔小新 2024-10-26 19:45:54
main
Logstash之TCP插件

TCP是一种网络传输控制协议，很多公司的数据不一定是在本地的，而是在传承网络的；这个时候使用TCP简历连接后，通信双王就可以 ... [详细]

蜡笔小新 2023-09-24 10:12:21

ik82jht

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章