2020年寒假假期总结0201

作者：戴劳力士_484 | 来源：互联网 | 2023-05-23 20:29

使用Sqoop将mysql数据传到hive系统环境：hadoop2.65，mysql5.7.28，sqoop1.47，hive1.2.2，虚拟机centos7，物理机windows

　　使用Sqoop将mysql数据传到hive

　　系统环境：hadoop2.65，mysql5.7.28，sqoop1.47，hive1.2.2，虚拟机centos7，物理机windows10

　　注意点：安装sqoop不要将目录设在hadoop下面，否则在运行下面命令时会发生找不到jar包的问题，我估计是系统将hadoop的lib目录认为成了sqoop的lib目录了。因为在我把相应的jar包放在hadoop的lib文件下时就可以通过，由于有很多jar包，所以一个jar找到了，又会有一个jar包找不到，所以建议不要放在hadoop目录下。

　　操作要求：将物理机的mysql数据转到虚拟机的mysql，然后使用sqoop将虚拟机的mysql转到hive中。

　　1.在物理机中使用Navicat的导出向导，获取sql文件，利用里面的建表语句，在虚拟机的mysql中建表，需要注意的是，linux的建表语句和windows有些许差异，比如：在编码的改动，需要将原来的编码utf8mb4_0900_ai_ci改成utf8_general_ci，utf8mb4改成utf8。

　　2.然后利用传输工具将sql文件传给虚拟机，然后虚拟机开启mysql，使用source命令调用sql文件，然后执行文件将所有数据插入mysql中。

　　3.然后我们在hive中创建相应的表，需要注意的是hive中没有varchar，需要使用string代替。

　　4.（可有可无）在hdfs上创建文件夹，来存放mysql数据

　　5.使用sqoop将mysql转到hdfs上，注意点：需要打开hdfs和yarn

\ 用于换行
bin/sqoop用来启动命令
import用来导入配置
connect连接数据库
用户名
密码
执行语句，$CONDITIONS在使用query语句时必须加上
指明hdfs上的目标目录
如果指定文件目录存在则先删除掉
使用1个map并行任务
启动压缩
指定hadoop的codec方式 默认为gzip
使用直接导入方式，优化导入速度，在mysql中速度提升比较明显
字段之间通过制表符分隔
bin/sqoop import \           
--connect jdbc:mysql://192.168.133.130:3306/holiday2020 \　　
--username root \　　
--password 123456 \　　
--query ‘select * where capital_info $CONDITIONS LIMIT 5000‘ \　　
--target-dir /heiyang/data \　　
--delete-target-dir \　　
--num-mappers 1 \　　
--compress \　　
--compression-codec org.apache.hadoop.io.compress.SnappyCodec \　　
--direct \　　
--fields-terminated-by ‘\t‘

　　命令就会开始执行，会得到以下信息：

技术图片

　　表示map完成，然后我们就可以看到hdfs上产生了两个文件

　　注意点：如果是一直停留在job开启的界面，没有运行下去的话，可以尝试检查一下yarn是否有设置好，或者端口问题。

技术图片

　　6.最后使用hive将数据导入到后hive中即可

load data inpath ‘/heiyang/data/‘ into table default.capital_info;

技术图片

2020年寒假假期总结0201

推荐阅读

web
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
python
Pythonmysql数据库

importpymysql#一、直接连接mysql数据库'''coonpymysql.connect(host'192.168.*.*',u ... [详细]

蜡笔小新 2024-11-12 16:51:59
web
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
ip
在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧

在 CentOS 7 环境中安装和配置 Redis 时，需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程，并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外，还探讨了如何优化性能和确保数据安全，帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]

蜡笔小新 2024-11-11 18:27:44
const
[c++基础]STL

cppfig15_10.cppincludeincludeusingnamespacestd;templatevoidprintVector(constvector&integer ... [详细]

蜡笔小新 2024-11-13 13:22:43
java
MySQL 5.7 学习指南：SQLyog 中的主键、列属性和数据类型

本文介绍了 MySQL 5.7 中主键（Primary Key）和自增（Auto-Increment）的概念，以及如何在 SQLyog 中设置这些属性。同时，还探讨了数据类型的分类和选择，以及列属性的设置方法。 ... [详细]

蜡笔小新 2024-11-12 15:57:04
copy
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
copy
解决Win10下MySQL连接问题：Navicat 2003无法连接到本地MySQL服务器（10061）

本文介绍如何在Windows 10环境下解决Navicat 2003无法连接到本地MySQL服务器的问题，包括启动MySQL服务和检查配置文件的方法。 ... [详细]

蜡笔小新 2024-11-12 13:10:39
web
php更新数据库字段的函数是,php更新数据库字段的函数是

php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]

蜡笔小新 2024-11-12 11:37:31
python
MySQL 数据迁移时 .frm 文件报错问题

本文讨论了在进行 MySQL 数据迁移过程中遇到的所有 .frm 文件报错的问题，并提供了详细的解决方案和建议。 ... [详细]

蜡笔小新 2024-11-12 10:47:49
python
Spark中使用map或flatMap将DataSet[A]转换为DataSet[B]时Schema变为Binary的问题及解决方案

本文探讨了在使用Spark的map或flatMap算子将一个数据集转换为另一个数据集时，遇到的Schema变为Binary的问题，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-11-12 08:06:20
java
第二十五天接口、多态

1.java是面向对象的语言。设计模式：接口接口类是从java里衍生出来的，不是python原生支持的主要用于继承里多继承抽象类是python原生支持的主要用于继承里的单继承但是接 ... [详细]

蜡笔小新 2024-11-12 06:43:20
text
第三节 Sqoop：实现数据的精准控制与高效导入

通过使用Sqoop导入工具，可以精确控制并高效地将表数据的特定子集导入到HDFS中。具体而言，可以通过在导入命令中添加WHERE子句来指定所需的数据范围，从而在数据库服务器上执行相应的SQL查询，并将查询结果高效地存储到HDFS中。这种方法不仅提高了数据导入的灵活性，还确保了数据的准确性和完整性。 ... [详细]

蜡笔小新 2024-11-11 22:58:51
spring
彻底清除数据库中的所有用户表（包括删除相关表结构）

在处理数据库中所有用户表的彻底清除时，目前尚未发现单一命令能够实现这一目标。因此，需要采用一种较为繁琐的方法来逐个删除相关表及其结构。具体操作可以通过编写PL/SQL脚本来实现，该脚本将动态生成并执行删除表的SQL语句。尽管这种方法相对复杂，但在缺乏更简便手段的情况下，仍是一种有效的解决方案。未来或许可以通过数据库管理工具或更高版本的数据库系统提供更简洁的处理方式。 ... [详细]

蜡笔小新 2024-11-11 18:30:49
window
在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解

在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解 ... [详细]

蜡笔小新 2024-11-11 17:28:29

戴劳力士_484

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章