热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MySQL查询用户行为,网站用户行为分析

网站用户行为分析步骤1.1本地数据集上传到数据仓库Hive数据集下载与查看数据集预处理把数据集导入HDFS中在Hive上创建数据库1.2Hive数据分析给出数据分析需求用selec

网站用户行为分析

步骤

1.1 本地数据集上传到数据仓库Hive

数据集下载与查看

数据集预处理

把数据集导入HDFS中

在Hive上创建数据库

37653db8fef5625f8eaa111808337e0b.png

ddef114db9bbb9e46f65f9e76c79de22.png

234a9cb7dfa1508cd3965979679b6c0c.png

b0a75c3615d71556ab17e7ff0b310bd1.png

d6857b816f9e2fbf0d78a81435718968.png

2a921f566d3cc97720fd50a761622b51.png

1.2 Hive数据分析

给出数据分析需求

用select语句实现数据分析

数据分析结果查看与保存

1.3 Hive、MySQL、HBase数据互导

Hive数据分析结果(如用户购买与浏览比例),从Hive传输到MySQL中。

Hive数据分析结果(如用户购买与浏览比例),从MySQL传输到Hbase中。

参照博客步骤,依次将user_action传入Hive、MySQL、HBase中。

http://dblab.xmu.edu.cn/blog/1059-2/

4bfb83ad647f22458a8bdeb54345ed2d.png

474ed168ed81f1e5d7b80b8e4e81e790.png

14cfba303fa3bd87b5125b2548c59709.png

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

分析步骤

语句:select count(*) from bigdata_user where visit_date >'2014-12-10' and visit_date

结果截图:运行或存为表格后的查询显示

0e2647f7f46192b3835031582073b29f.png

(2)用户行为分析需求:分析每月1-31号购买情况

语句:代码:select count(distinct uid),month(visit_date) from bigdata_user where behavior_type='4' group by month(visit_date) limit 10;

结果截图:运行或存为表格后的查询

a63a61d76842a26117b67482647cb2a0.png

(3)按某一特殊日期(如双12)进行用户行为分析

各省份购买商品数量

商品购买与浏览比例

用户活跃度分析

购买5件以上商品的用户

d01dcfd6affcce741179be607fa633da.png

a0a2ae111609c53328dc4624d949ce85.png

546546356ce6cd5d7caadf308350032b.png

(4)用户购买与浏览比例。

1.计算拥护购买数与浏览数的比值。

2.创建表格保存结果

49d3492b22d493fc94b556b9e897de46.png

300c3f9f5a679c66fa5da486ed45e4f2.png

标签:数据分析,网站,visit,用户,Hive,购买,MySQL,行为

来源: https://www.cnblogs.com/yeliqin/p/14242702.html



推荐阅读
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • PTArchiver工作原理详解与应用分析
    PTArchiver工作原理及其应用分析本文详细解析了PTArchiver的工作机制,探讨了其在数据归档和管理中的应用。PTArchiver通过高效的压缩算法和灵活的存储策略,实现了对大规模数据的高效管理和长期保存。文章还介绍了其在企业级数据备份、历史数据迁移等场景中的实际应用案例,为用户提供了实用的操作建议和技术支持。 ... [详细]
  • 本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS,然后通过MapReduce清洗数据,使用Hive进行数据分析,并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]
  • 如何将TS文件转换为M3U8直播流:HLS与M3U8格式详解
    在视频传输领域,MP4虽然常见,但在直播场景中直接使用MP4格式存在诸多问题。例如,MP4文件的头部信息(如ftyp、moov)较大,导致初始加载时间较长,影响用户体验。相比之下,HLS(HTTP Live Streaming)协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段,并生成一个M3U8播放列表文件,实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流,包括技术原理和具体操作步骤,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 本文介绍了如何在 Spring Boot 项目中使用 spring-boot-starter-quartz 组件实现定时任务,并将 cron 表达式存储在数据库中,以便动态调整任务执行频率。 ... [详细]
  • Docker 环境下 MySQL 双主同步配置指南
    本文介绍了如何在 Docker 环境中配置 MySQL 的双主同步,包括目录结构的创建、配置文件的编写、容器的创建与设置以及最终的验证步骤。 ... [详细]
  • 本文介绍 DB2 中的基本概念,重点解释事务单元(UOW)和事务的概念。事务单元是指作为单个原子操作执行的一个或多个 SQL 查询。 ... [详细]
  • 包含phppdoerrorcode的词条 ... [详细]
  • Spring Data JdbcTemplate 入门指南
    本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作,包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]
  • EST:西湖大学鞠峰组污水厂病原菌与土著反硝化细菌是多重抗生素耐药基因的活跃表达者...
    点击蓝字关注我们编译:祝新宇校稿:鞠峰、袁凌论文ID原名:PathogenicandIndigenousDenitrifyingBacte ... [详细]
  • Spring 切面配置中的切点表达式详解
    本文介绍了如何在Spring框架中使用AspectJ风格的切面配置,详细解释了切点表达式的语法和常见示例,帮助开发者更好地理解和应用Spring AOP。 ... [详细]
  • DAO(Data Access Object)模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法,它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 在处理数据库中所有用户表的彻底清除时,目前尚未发现单一命令能够实现这一目标。因此,需要采用一种较为繁琐的方法来逐个删除相关表及其结构。具体操作可以通过编写PL/SQL脚本来实现,该脚本将动态生成并执行删除表的SQL语句。尽管这种方法相对复杂,但在缺乏更简便手段的情况下,仍是一种有效的解决方案。未来或许可以通过数据库管理工具或更高版本的数据库系统提供更简洁的处理方式。 ... [详细]
  • SSAS入门指南:基础知识与核心概念解析
    ### SSAS入门指南:基础知识与核心概念解析Analysis Services 是一种专为决策支持和商业智能(BI)解决方案设计的数据引擎。该引擎能够为报告和客户端应用提供高效的分析数据,并支持在多维数据模型中构建高性能的分析应用。通过其强大的数据处理能力和灵活的数据建模功能,Analysis Services 成为了现代 BI 系统的重要组成部分。 ... [详细]
author-avatar
侯faulds_534
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有