作者:风中凌乱2602938623 | 来源:互联网 | 2023-09-13 15:19
本节讲解使用SparkSQL实现经典的单词计数程序WordCount。数据来源仍然是HDFS中的inputwords.txt文件,该文件内容如下:hellohadoophell
本节讲解使用Spark SQL实现经典的单词计数程序WordCount。数据来源仍然是HDFS中的/input/words.txt文件,该文件内容如下:
hello hadoop
hello java
hello scala
java
具体操作步骤如下:
1. 新建Maven项目
在Maven项目的pom.xml中添加Spark SQL的Maven依赖库,代码如下:
org.apache.spark spark-core_2.12 3.2.1 org.apache.spark spark-sql_2.12 3.2.1
2. 编写程序