当前位置: 开发笔记 > 数据库 > 正文

Hive导入和导出数据

作者：陈柏佩66057 | 来源：互联网 | 2017-05-12 15:07

hive默认的字符编码是utf8格式，所以用utf8模式存储的数据都是可以正常显示的，如果用ssh客户端工具查看时仍是乱码，这可能是你的

hive官方提供两种导入数据的方式

1 从表中导入：

insert overwrite table test

select * from test2;

2 从文件导入：

2.1 从本地文件导入：

load data local inpath '/Hadoop/aa.txt' overwrite into table test11

2.2 从hdfs导入

load data inpath '/hadoop/aa.txt' overwrite into table test11

3 导入文件的列划分

在建表的时候可以指定划分的字符如：

create table test11(id int,name string)

row format delimited

fields terminated by '\;' 以分号划分文件的列这样导入的数据文件就如同 1;张三这种格式。

4 到出数据

一般用：bin/hive -e "select * from test" >> res.csv

或者：bin/hive -f sql.q >> res.csv （其中文件sql.q写入你想要执行的查询语句）

5 中文乱码问题

hive默认的字符编码是utf8格式，所以用utf8模式存储的数据都是可以正常显示的，如果用ssh客户端工具查看时仍是乱码，这可能是你的客户端工具的编码方式决定的，以secureCRT为例，修改 session options -》apperance (这样不影响其他session的编码方式)，，当然 linux系统也需要做一下简单的支持utf8的设置（这个一般都支持）

推荐阅读

sql
全面解析Hive：数据仓库工具概览

本文介绍了Hive作为基于Hadoop的数据仓库工具的核心概念，包括其基本功能、使用理由、特点以及与Hadoop的关系。同时，文章还探讨了Hive相较于传统关系型数据库的不同之处，并展望了Hive的发展前景。 ... [详细]

蜡笔小新 2024-12-05 10:44:18
join
深入浅出：Hadoop架构详解

Hadoop作为大数据处理的核心技术，包含了一系列组件如HDFS（分布式文件系统）、YARN（资源管理框架）和MapReduce（并行计算模型）。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]

蜡笔小新 2024-11-26 13:26:40
mongodb
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
mongodb
深入解析Rsync的工作机制与部署实践

本文详细介绍了Rsync的数据同步工具，包括其核心算法、安装配置方法以及实际应用中的注意事项，适合IT运维人员和技术爱好者阅读。 ... [详细]

蜡笔小新 2024-12-06 12:00:01
mongodb
如何用GPU服务器运行Python

如何用GPU服务器运行Python-目录前言一、服务器登录1.1下载安装putty1.2putty远程登录 1.3查看GPU、显卡常用命令1.4Linux常用命令二、 ... [详细]

蜡笔小新 2024-12-06 11:54:09
数据库
Hadoop集群迁移至Linux环境中的挑战与解决方案

本文旨在分享将Hadoop集群从Windows环境迁移到Linux环境过程中遇到的技术难题及其解决方案，以帮助同行或未来的学习者避免类似问题。 ... [详细]

蜡笔小新 2024-12-01 13:19:51
数据库
探索Hive UDF的应用

本文介绍了在解决Hive表中复杂数据结构平铺化问题后，如何通过创建视图来准确计算广告日志的曝光PV，特别是针对用户对应多个标签的情况。同时，详细探讨了UDF的使用方法及其在实际项目中的应用。 ... [详细]

蜡笔小新 2024-11-26 11:08:12
数据库
Hadoop集群搭建：实现SSH无密码登录

本文介绍了如何在CentOS 7 64位操作系统环境下配置Hadoop集群中的SSH无密码登录，包括环境准备、用户创建、密钥生成及配置等步骤。 ... [详细]

蜡笔小新 2024-11-24 19:47:28
sql
2021年度精选：新手必知的数据分析工具指南

面对众多的数据分析工具，如何选择最适合自己的那一个？对于初学者而言，了解并掌握几种核心工具是快速入门的关键。本文将从数据处理的不同阶段出发，推荐三种广泛使用的数据分析工具。 ... [详细]

蜡笔小新 2024-11-23 19:47:22
mysql
Python 实现监控与运维自动化方案

本文探讨了使用Python实现监控信息收集的方法，涵盖从基础的日志记录到复杂的系统运维解决方案，旨在帮助开发者和运维人员提升工作效率。 ... [详细]

蜡笔小新 2024-11-23 11:25:14
redis
龙蜥社区开发者访谈：技术生涯的三次蜕变 | 第3期

龙蜥社区的开发者们通过自己的实践和经验，推动着开源技术的发展。本期「龙蜥开发者说」聚焦于一位资深开发者的三次技术转型，分享他在龙蜥社区的成长故事。 ... [详细]

蜡笔小新 2024-11-21 11:12:28
mongodb
MongoDB 高可用集群搭建指南：分片、读写分离与负载均衡

本文详细介绍了如何搭建一个高可用的MongoDB集群，包括环境准备、用户配置、目录创建、MongoDB安装、配置文件设置、集群组件部署等步骤。特别关注分片、读写分离及负载均衡的实现。 ... [详细]

蜡笔小新 2024-11-20 18:28:16
json
流处理中的计数挑战与解决方案

本文探讨了在流处理中进行计数的各种技术和挑战，并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性，还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]

蜡笔小新 2024-11-20 13:50:01
database
如何在U8系统中连接服务器并获取数据

本文介绍了如何在U8系统中通过不同的方法连接服务器并获取数据，包括使用MySQL客户端连接实例的方法，如非SSL连接和SSL连接，并提供了详细的步骤和注意事项。 ... [详细]

蜡笔小新 2024-11-19 12:08:19
database
深入解析：存储技术的演变与发展

本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程，详细解释了各种存储模型及其特点。 ... [详细]

蜡笔小新 2024-11-19 11:25:40

陈柏佩66057

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章