数据查询
- Druid数据查询
- JSON API方式
- JSON查询语法结构
- 使用Postman来测试JSON API查询
- SQL 方式(重点)
- Druid SQL可视化界面
- 查询语法
- 1、语法结构
- 1.1 EXPLAIN PLAN FOR
- 1.2 WITH tableName
- 1.3 GROUP BY
- 1.4 UNION ALL
- 2、Druid SQL不支持的功能
- 聚合函数
Druid数据查询
- 下面以 「 广告点击数据 」为例,演示在Druid中使用不同方式来进行数据查询、分析。
- 1、JSON API方式
- 2、SQL方式(重点)
JSON API方式
JSON查询语法结构
- Druid最早提供JSON API地方式查询数据,通过JSON格式来定义各种查询组件实现数据查询。
- 将JSON数据提交请求到: http://node3:8082/druid/v2?pretty
{"queryType":"search",// 1. 指定要查询的数据源"dataSource":"ad_event",// 2. 聚合器,描述如何进行聚合// 2.1 对哪个指标字段进行聚合// 2.2 进行哪种聚合// 2.3 指定聚合后的列名"aggregations":[{"type":"longSum", "name":"click", "fieldName":"click" },{"type":"longSum","name":"pv","fieldName":"count"}],// 3. 指定查询的时间范围,前闭后开"intervals":["2018-06-02/2019-06-06"]
}
使用Postman来测试JSON API查询
{"queryType":"search","dataSource":"ad_event","aggregations":[{"type":"longSum", "name":"click", "fieldName":"click" },{"type":"longSum","name":"pv","fieldName":"count"}],"intervals":["2018-06-02/2019-06-06"]
}
- 发送请求到 http://node3:8082/druid/v2?pretty
SQL 方式(重点)
- 使用Druid SQL查询,可以使用SQL查询来代替Druid原生基于JSON的查询方式
- Druid SQL将SQL语句解析为原生JSON API方式,再执行查询
Druid SQL可视化界面
- Druid 提供了一个图形界面SQL查询接口
查询语法
- 在Druid中,每一个数据源在Druid中都对应一张表,可以直接通过SELECT语句查询表中的数据
1、语法结构
[ EXPLAIN PLAN FOR ]
[ WITH tableName [ ( column1, column2, ... ) ] AS ( query ) ]
SELECT [ ALL | DISTINCT ] { * | exprs }
FROM table
[ WHERE expr ]
[ GROUP BY exprs ]
[ HAVING expr ]
[ ORDER BY expr [ ASC | DESC ], expr [ ASC | DESC ], ... ]
[ LIMIT limit ]
[ UNION ALL ]
1.1 EXPLAIN PLAN FOR
- 在SELECT语句前面添加EXPLAIN PLAN FOR,可以查看到Druid SQL是如何解释为Druid JSON API查询的
- SELECT语句并没有真正地执行
1.2 WITH tableName
- 定义一个SQL片断,该SQL片断会被整个SQL语句所用到
WITH cr1 AS
(SELECT city, SUM(click) as click from ad_event GROUP BY 1)
select * from cr1 where city = 'beijing'
1.3 GROUP BY
- GROUP BY 语句可以使用 1、2、…位置来替代
SELECT city, SUM(click) as click
from ad_event
GROUP BY 1
- ORDER BY 也支持类似GROUP BY 的语法
1.4 UNION ALL
- UNION ALL操作符表示将多个SELECT语句放在一起(并集),每个SELECT语句都会一个接一个单独执行(并不是并行执行),Druid当前并不支持 UNION(不支持去重)
2、Druid SQL不支持的功能
聚合函数
- Druid SQL中的聚合函数可以使用以下语法:
AGG(expr) FILTER(WHERE whereExpr)
SELECT city, sum("count") filter(where city != 'beijing') FROM "ad_event" GROUP BY city;