SparkGraphX示例

2019独角兽企业重金招聘Python工程师标准>>>

Programming Guide中的例子

import org.apache.spark.graphx._val users: RDD[(VertexId, (String, String))] &＃61; sc.parallelize(Array((3L, ("rxin", "student")), (7L, ("jgonzal", "postdoc")),(5L, ("franklin", "prof")), (2L, ("istoica", "prof"))))

val relationships: RDD[Edge[String]] &＃61; sc.parallelize(Array(Edge(3L, 7L, "collab"),Edge(5L, 3L, "advisor"),Edge(2L, 5L, "colleague"), Edge(5L, 7L, "pi"))) val graph &＃61; Graph(users, relationships) val rankedGraph &＃61; graph.staticPageRank(3)

实际的例子&＃xff0c;别踩白快的传输分析&＃xff1a;

val transfer &＃61; sc.textFile("hdfs://LDKJSERVER1046:8020/user/flume/transfer/*/*/*/*.tsv").filter(line &＃61;> line.contains("biecaibaikuai"))val structuredTransferRDD &＃61; transfer.map(line &＃61;> {val trunks &＃61; line.split("\t")if(trunks.length &＃61;&＃61; 35){(trunks(6), trunks(7), trunks(3), trunks(5), trunks(12), trunks(13)) }}) val rdd &＃61; structuredTransferRDD.filter(arg &＃61;> arg !&＃61; ()).map(arg &＃61;> arg.asInstanceOf[(String, String, String, String, String, String)]) val repatitionedRDD &＃61; rdd.repartition(100) repatitionedRDD.cache repatitionedRDD.countval mappedRDD &＃61; repatitionedRDD.map(arg &＃61;> ((arg._1, arg._1.hashCode.toLong),(arg._2, arg._2.hashCode.toLong), arg._3, arg._4, arg._5, arg._6))val vertexs &＃61; mappedRDD.flatMap(arg &＃61;> Array((arg._1._2, arg._1._1), (arg._2._2, arg._2._1))).distinct vertexs.cache vertexs.count import org.apache.spark.graphx._ val edges &＃61; mappedRDD.map(arg &＃61;> (arg._1._2, arg._2._2, arg._3)).distinct.map(arg &＃61;> Edge(arg._1, arg._2, arg._3)) edges.cache edges.count val graph &＃61; Graph(vertexs, edges) val rankedGraph &＃61; graph.staticPageRank(3) rankedGraph.vertices.first rankedGraph.vertices.filter(arg &＃61;> arg._2 !&＃61; 0.15).first

SparkGraphX示例

在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Spring – Bean Life Cycle

如何在R中得到矩阵的右特征向量? - How to obtain right eigenvectors of matrix in R?

利用OpenCV和线性SVM实现人脸识别

（7）Python爬虫——爬取豆瓣电影Top250

Python 中 UTF-8 编码的中文字符被误识别为 GB2312

Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

杜甫《喜晴》的两种英译比较

解决Bootstrap DataTable Ajax请求重复问题

使用Python和smtplib实现邮件发送功能

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

Go (Golang) 语言Golang 定时器Timer和Ticker、time.AfterFunc、time.NewTicker()实例

Go语言中的命令设计模式详解