热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

使用ElasticStack分析地理空间数据(一)

文章转载自:https:blog.csdn.netUbuntuToucharticledetails106531939随着人类在不断地探索空间,地理空间数据越来越多。收集信息的速度

文章转载自:https://blog.csdn.net/UbuntuTouch/article/details/106531939

随着人类在不断地探索空间,地理空间数据越来越多。 收集信息的速度以及提供位置信息的来源正在迅速增长。政府和商业卫星继续扩张。与GPS一起,它们提供了一系列不同的空间丰富的数据源,包括天气和温度模式,土地使用,土壤化学,减灾和响应,电信等。

移动设备和底层网络将人员,汽车,卡车和大量踏板车变成了位置信息的来源。计算机网络将位置信息嵌入IP地址元数据中,这可以帮助IT管理员在分布式基础架构中为用户提供支持,或者帮助执法部门以及我们的网络运营商找到并阻止坏人。所有这些数据都是令人兴奋的,它激发了每个人内部的创造力来利用它。提出新的问题,构思新的想法,并建立新的期望。这些新事物不容易解决。他们需要以不同格式存储的数据或跨非空间维度(如主题标签或网络域)的相关性存储的数据。尽管专家长期以来拥有执行复杂的地理空间分析的工具,但这些工具并不总是能够完成非传统来源的混合或处理当今数据集规模的任务。现在事情变得更加复杂。Elastic Stack 是一个高效的存储,分析及搜索软件栈。Elastic Stack 正在积极地推动这一进程。为我们提供更多的数据,更多的用途和更多的利益。

在今天的教程中,我将介绍如何使用 Elastic Stack 来收集这些地理空间位置信息,并对它们进行可视化化分析。

我将使用 opensky network API 来获取飞机的飞行信息,并使用 Kibana 来对数据进行展示。

这个演示分为两个部分:

Observability:使用 Elastic Stack 分析地理空间数据 (一)

Observability:使用 Elastic Stack 分析地理空间数据 (二)

安装

Elasticsearch

我们可参考我之前的文章 “如何在Linux,MacOS及Windows上进行安装Elasticsearch” 来安装我们的Elasticsearch。

Kibana

我们可以参考我之前的文章 “如何在Linux,MacOS及Windows上安装Elastic栈中的Kibana” 来进行我们的安装。

Logstash

我们可以参考我之前的文章 “如何安装Elastic栈中的Logstash” 来安装 Logstash。我们先不要运行 Logstash。

我们可以启动 Elasticsearch 及 Kibana。在我们的电脑的浏览器中输入地址 http://localhost:5601/:

如果能看到上面的界面,则表明我们的 Elasticsearch 及 Kibana 的安装是正确的。

Logstash 配置文件

在这个展示中,我们将使用 Logstash 定期地去 opensky network 网站上去抓取数据,并导入到 Elasticsearch 中。Logstash 的配置文件如下:

fligths_logstash.conf

input {

http_poller {

codec => "json"

schedule => { every => "15s" }

urls => {

url => "https://opensky-network.org/api/states/all"

}

}

}
filter {

split {

field => "states"

add_field => {

"icao" => "%{[states][0]}"

"callsign" => "%{[states][1]}"

"origin_country" => "%{[states][2]}"

"time_position" => "%{[states][3]}"

"last_contact" => "%{[states][4]}"

"location" => "%{[states][6]},%{[states][5]}"

"baro_altitude" => "%{[states][7]}"

"on_ground" => "%{[states][8]}"

"velocity" => "%{[states][9]}"

"true_track" => "%{[states][10]}"

"vertical_rate" => "%{[states][11]}"

"geo_altitude" => "%{[states][13]}"

"squawk" => "%{[states][14]}"

"spi" => "%{[states][15]}"

"position_source" => "%{[states][16]}"

}

}

mutate {

strip => ["callsign"]

rename => { "time" => "request_time" }

remove_field => ["states", "@version"]

}

translate {

field => "[position_source]"

destination => "position_source"

override => "true"

dictiOnary=> {

"0" => "ADS-B"

"1" => "ASTERIX"

"2" => "MLAB"

}

}
if [time_position] =~ /^%{*/ {

drop { }

}

if [callsign] =~ /^%{*/ {

mutate { remove_field => ["callsign"] }

}

if [location] =~ /^%{*/ {

mutate { remove_field => ["location"] }

}

if [baro_altitude] =~ /^%{*/ {

mutate { remove_field => ["baro_altitude"] }

}

if [velocity] =~ /^%{*/ {

mutate { remove_field => ["velocity"] }

}

if [true_track] =~ /^%{*/ {

mutate { remove_field => ["true_track"] }

}

if [vertical_rate] =~ /^%{*/ {

mutate { remove_field => ["vertical_rate"] }

}

if [sensors] =~ /^%{*/ {

mutate { remove_field => ["sensors"] }

}

if [geo_altitude] =~ /^%{*/ {

mutate { remove_field => ["geo_altitude"] }

}

if [squawk] =~ /^%{*/ {

mutate { remove_field => ["squawk"] }

}
mutate {

cOnvert=> {

"baro_altitude" => "float"

"geo_altitude" => "float"

"last_contact" => "integer"

"on_ground" => "boolean"

"request_time" => "integer"

"spi" => "boolean"

"squawk" => "integer"

"time_position" => "integer"

"true_track" => "float"

"velocity" => "float"

"vertical_rate" => "float"

}

}

}
output {

stdout {

codec => rubydebug

}
elasticsearch {

manage_template => "false"

index => "flights"

# pipeline => "flights_aircraft_enrichment"

hosts => "localhost:9200"

}

}

从上面的 input 部分我们可以看出来:

input {

http_poller {

codec => "json"

schedule => { every => "15s" }

urls => {

url => "https://opensky-network.org/api/states/all"

}

}

}

这里,我们使用 http_poller 每隔15秒去抓一次数据。如果大家想知道这个 API https://opensky-network.org/api/states/all 的内容是什么,你可以直接在浏览器的地址栏中输入这个地址,你及可以看出来是什么样的格式的信息。你可以使用工具 http://jsonviewer.stack.hu/ 对这个 JSON 格式的返回信息进行格式化,以便更好地分析它里面的数据。这对在 filter 部分的各个过滤器的使用的理解是非常有帮助的。在 filter 的最后部分,我也对数据的类型进行了转换以便更好地在 Kibana 中进行分析。

为了能够使得我们的 flights 的数据类型和我们转换的数据类型进行很好的匹配,我们必须在 Kibana 中对这个索引定义好它的 mapping:

PUT flights

{

"mappings": {

"properties": {

"@timestamp": {

"type": "date"

},

"baro_altitude": {

"type": "float"

},

"callsign": {

"type": "keyword"

},

"geo_altitude": {

"type": "float"

},

"icao": {

"type": "keyword"

},

"last_contact": {

"type": "long"

},

"location": {

"type": "geo_point"

},

"on_ground": {

"type": "boolean"

},

"origin_country": {

"type": "keyword"

},

"position_source": {

"type": "keyword"

},

"request_time": {

"type": "long"

},

"spi": {

"type": "boolean"

},

"squawk": {

"type": "long"

},

"time_position": {

"type": "long"

},

"true_track": {

"type": "float"

},

"velocity": {

"type": "float"

},

"vertical_rate": {

"type": "float"

}

}

}

}

在 Kibana 的 Dev Tools 中运行上面的指令,这样我们就创建好了 flights 索引的 mapping。

接下来,我就可以启动 Logstash 了。在我的 Mac OS 电脑上,在 Logstash 的安装根目录中,打入如下的命令:

sudo ./bin/logstash -f fligths_logstash.conf

这时,我们可以在 console 中看到如下的输出:

它表明我们的 Logstash 正在工作。

我们接下来在 Kibana 中打入如下命令:

GET _cat/indices

我们可以看到文件大小不断增长的 flights 索引。它表明我们的数据正被导入到 Elasticsearch 中。

为了分析数据,我们必须创建一个 index pattern:

点击 Create index pattern:

点击 Next step:

点击上面的 Create index pattern。这样就完成了创建 Index pattern。

运用 Kibana 可视化

显示目前所有的正在飞行的飞机

我们接下来显示所有目前正在的飞行的飞机。打开 Kibana,并创建 Visualization:

点击上面的 Create new visualization:

选择 Maps:

点击 Add layer:

选择 Documents:

点击上面的 Add layer:

向下滚动:

我们选择飞机机场图标为固定的图标。选择速度为它的颜色,速度越快,颜色越深。

同时,我们绑定图标的方向为 true_track,这是飞机的飞行方向。同时飞机的高度越高,图标就越大。点击 Save & close 按钮:

同时设定每个两秒正抓取数据一次,这样我们就可以看到每个飞机的状态了。点击上面的 Apply:

点击上面的 Save 按钮,并取名为 v1。这样我们就创建了第一个 Visualization。

显示飞机过去7天的数据

和上面的显示一样,只不过这次,我们显示过去7天的数据,而不是最新的一个数据。

点击上面的 Save & close:

从上面,我们可以看到每架飞机的轨迹。

查看哪个国家的飞机航班多

找出各个地区的机场数目

点击 Create map:

我们看一下美国有时间上最多的机场。

我们可以发现从美国起飞的飞机是最多的,颜色最深。




使用 Elastic Stack 分析地理空间数据 (一)的相关教程结束。



推荐阅读
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • V8不仅是一款著名的八缸发动机,广泛应用于道奇Charger、宾利Continental GT和BossHoss摩托车中。自2008年以来,作为Chromium项目的一部分,V8 JavaScript引擎在性能优化和技术创新方面取得了显著进展。该引擎通过先进的编译技术和高效的垃圾回收机制,显著提升了JavaScript的执行效率,为现代Web应用提供了强大的支持。持续的优化和创新使得V8在处理复杂计算和大规模数据时表现更加出色,成为众多开发者和企业的首选。 ... [详细]
  • 华为捐赠欧拉操作系统,承诺不推商用版
    华为近日宣布将欧拉开源操作系统捐赠给开放原子开源基金会,并承诺不会推出欧拉的商用发行版。此举旨在推动欧拉和鸿蒙操作系统的全场景融合与生态发展。 ... [详细]
  • 高端存储技术演进与趋势
    本文探讨了高端存储技术的发展趋势,包括松耦合架构、虚拟化、高性能、高安全性和智能化等方面。同时,分析了全闪存阵列和中端存储集群对高端存储市场的冲击,以及高端存储在不同应用场景中的发展趋势。 ... [详细]
  • 基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装
    一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012,引入SQLServer2012群集提高高可用性,需要对SQLServ ... [详细]
  • MicrosoftDeploymentToolkit2010部署培训实验手册V1.0目录实验环境说明3实验环境虚拟机使用信息3注意:4实验手册正文说 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • Ansible:自动化运维工具详解
    Ansible 是一款新兴的自动化运维工具,基于 Python 开发,集成了多种运维工具(如 Puppet、CFEngine、Chef、Func 和 Fabric)的优点,实现了批量系统配置、程序部署和命令执行等功能。本文将详细介绍 Ansible 的架构、特性和优势。 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • ### 优化后的摘要本学习指南旨在帮助读者全面掌握 Bootstrap 前端框架的核心知识点与实战技巧。内容涵盖基础入门、核心功能和高级应用。第一章通过一个简单的“Hello World”示例,介绍 Bootstrap 的基本用法和快速上手方法。第二章深入探讨 Bootstrap 与 JSP 集成的细节,揭示两者结合的优势和应用场景。第三章则进一步讲解 Bootstrap 的高级特性,如响应式设计和组件定制,为开发者提供全方位的技术支持。 ... [详细]
  • centos 7.0 lnmp成功安装过程(很乱)
    下载nginx[rootlocalhostsrc]#wgethttp:nginx.orgdownloadnginx-1.7.9.tar.gz--2015-01-2412:55:2 ... [详细]
  • Hadoop的文件操作位于包org.apache.hadoop.fs里面,能够进行新建、删除、修改等操作。比较重要的几个类:(1)Configurati ... [详细]
  • VB.net 进程通信中FindWindow、FindWindowEX、SendMessage函数的理解
    目录一、代码背景二、主要工具三、函数解析1、FindWindow:2、FindWindowEx:3、SendMessage: ... [详细]
author-avatar
我们的北京宫
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有