热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【社区问答第四十一期】ApacheSpark大数据专题

盘点过去两年,ApacheSpark无疑是最热门的开源大数据框架,然而作为一个高速发展的开源项目其生产环境使用仍然存在一些问题。本期问答(2016-5-3----2016-5-8),我们特邀请8位技
盘点过去两年,Apache Spark无疑是最热门的开源大数据框架,然而作为一个高速发展的开源项目其生产环境使用仍然存在一些问题。本期问答(2016-5-3----2016-5-8),我们特邀请8位技术大牛,为大家答疑解惑。

本期问答内容:

1. Spark方向

专家介绍:

1. TalkingData研发副总裁阎志涛



2. 祝海林,现就职于乐视云计算,资深数据工程师。从事大数据平台架构相关工作,现专注在机器学习/数据查询分析领域。对Spark/ES较为熟悉,业余时间喜欢研究通用资源管理相关课题



3. 刘喆(Zhe Liu)2013年加入AdMaster,现任架构师。主要负责数据处理的全流程技术支持, 高性能和高可用的分布式架构设计, DSL 语言抽象, Hadoop/HBase/Storm/Spark等大数据平台优化。2010年硕士毕业后, 刘喆在百度就职, 负责当时全球规模最大的 hadoop 平台的运维开发工作. 2011年底加入人民搜索, 代理运维总监。近 7 年的大学生活和近 5 年的工作经历中, 刘喆一直在追求简单直接,关注于数据挖掘/大数据/DSL/系统架构, 对分布式计算/分布式架构和程序语言情有独钟, 曾多次被51CTO/spark 峰会/into100峰会等邀请为嘉宾分享Hadoop/spark/开源软件等相关经验。



4. 田毅,目前在数据分析服务公司GrowingIO数据平台部门工作,Spark社区的Contributor,北京Spark Meetup组织者,2010年开始在电信领域实践应用hadoop,2013年开始关注Spark,从Shark开始向社区贡献代码。目前主要的研究方向是使用Spark搭建企业级的数据计算分析平台。



5. 黄忠,目前主要从事数据挖掘及大数据平台等相关工作,Spark技术实践和研究者,多次担任Spark线下公开课讲师,曾参与云平台,分布式爬虫,推荐系统等项目。



6. 梁堰波Hortonworks技术专家,曾明略数据技术合伙人,更早的时候还曾就职于France Telecom、美团、Yahoo!等企业。梁堰波是Spark活跃贡献者,主要聚焦Spark ML/MLlib和SparkR项目,精通统计和机器学习算法在类似Spark这样分布式系统上的实现。



7. 顾荣,南京大学计算机系博士生,Alluxio项目核心开发者。完成了Alluxio很多功能/性能增强的工作,并主持实现性能测试框架和社区中文文档等。顾荣曾在微软亚洲研究院、英特尔、百度、星环科技从事大数据系统相关的研发工作



8.  王庚,目前就职于亚信数据,担任橘云大数据平台技术经理。曾经就职于腾讯,从事网络负载均衡,数据中心系统的研发工作;之后加入IBM Platform Computing,从事大数据产品Platform Symphony的研发工作。



欢迎大家留言提问,机会难得,不容错过!

49 个解决方案

#1


该回复于2016-05-03 10:32:09被管理员删除

#2


不了解

#3


支持一下,。,

#4


引用 3 楼 starytx 的回复:
支持一下,。,
.

#5


支持一下,。,

#6


.。。。

一下来了八个。。。

#7


顶,膜拜一下。

#8


支持一下,

#9


支持一下

#10


支持一下,可以结贴了

#11


#12


杀上刊登阿萨德撒打算从[size=24px] [/size]

#13


前排混脸熟

#14


这名字取的,刘备五虎神将之一都来了啊,各种三国神将啊……

#15


支持一下。。。。。。

#16


第一次听说这种东西,是我太孤陋寡闻 了吧

#17


为了拿分 现在什么新闻我都回复

#18


#19


支持一下支持一下

#20


支持一下支持一下

#21


有那么年轻的就自称大牛了???

#22


大数据到底有什么用?可以解答下不?

#23


学java的

#24


请问一下,Spark它在实际生产环境下有哪些应用?
Spark在生产环境中能够构建实时应用吗?
Spark最新的DataSet会最终替代RDD吗?DataSet与RDD之间的区别?

#25


相问一下 Hadoop、HBase、Storm、Spark之间的同异及各种的应用场景(或业务特性)

#26


想问一下,Spark  有交互式的 spark sql,有 准实时计算的 spark streaming ,还有 MLlib。再有五年会完全替代  mapreduce吗。 Hadoop下一步的发展趋势会是怎样的。以后在企业中  hadoop会使用越来越少吗。

#27


#28


spark 1.6 + MLlib 的决策树是否支持交叉校验呢

#29


#30


#31


该回复于2016-05-15 14:17:29被管理员删除

#32


提问了好像没有看到牛人回答啊

#33


顶一下______

#34


#35


引用 21 楼 u011529104 的回复:
有那么年轻的就自称大牛了???


年轻就不能成为大牛了?

#36


厉害   厉害

#37


为了拿分 现在什么新闻我都回复

#38


多多向上面几位技术大牛学习

#39


都是大牛 

#40


大牛们,请问个神奇的问题,目标网站是需要插入加密狗然后连接上它的VPN才能访问,加密狗和VPN我都有了,然后我的爬虫程序要开着HttpAnalyzer V7并启动就能访问到数据,不启动访问目标网站着会报错。。

报错的详细信息:
{System.Net.WebException: 基础连接已经关闭: 发送时发生错误。 ---> System.IO.IOException: 由于意外的数据包格式,握手失败。
   在 System.Net.Security.SslState.StartReadFrame(Byte[] buffer, Int32 readBytes, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.StartReceiveBlob(Byte[] buffer, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.CheckCompletionBeforeNextReceive(ProtocolToken message, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.StartSendBlob(Byte[] incoming, Int32 count, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.ForceAuthentication(Boolean receiveFirst, Byte[] buffer, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.ProcessAuthentication(LazyAsyncResult lazyResult)
   在 System.Net.TlsStream.CallProcessAuthentication(Object state)
   在 System.Threading.ExecutionContext.RunInternal(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
   在 System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
   在 System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state)
   在 System.Net.TlsStream.ProcessAuthentication(LazyAsyncResult result)
   在 System.Net.TlsStream.Write(Byte[] buffer, Int32 offset, Int32 size)
   在 System.Net.PooledStream.Write(Byte[] buffer, Int32 offset, Int32 size)
   在 System.Net.ConnectStream.WriteHeaders(Boolean async)
   --- 内部异常堆栈跟踪的结尾 ---
   在 System.Net.HttpWebRequest.GetResponse()
   在 WindowsFormsApplication10.dafuhao._GetHTML(String URL, Int32 bufflen) 位置 c:\Users\Administrator\Desktop\getRenBaoData\getRenBaoData\dafuhao.cs:行号 173}

#41


微信小程序socket请求协议能不能不使用wss  而使用ws  ?

#42


可以的,支持一下

#43


哇,支持一下

#44


可以的,支持一下

#45



这段代码为什么执行到最后一个scanf直接跳过输入?

#46


支持支持支持支持支持支持支持支持支持支持支持支持支持支持支持支持

#47


听过,没怎么用过, anyway,纯支持

#48


好事情,人才济济,为了拿分,看看回复是不是真能拿分.

#49


好事情,人才济济,为了拿分,看看回复是不是真能拿分. 

推荐阅读
  • 本文介绍了在Python中使用zlib模块进行字符串的压缩与解压缩的方法,并探讨了其在内存优化方面的应用。通过压缩存储URL等长字符串,可以大大降低内存消耗,虽然处理时间会增加,但是整体效果显著。同时,给出了参考链接,供进一步学习和应用。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • RouterOS 5.16软路由安装图解教程
    本文介绍了如何安装RouterOS 5.16软路由系统,包括系统要求、安装步骤和登录方式。同时提供了详细的图解教程,方便读者进行操作。 ... [详细]
  • 如何查询zone下的表的信息
    本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求,并提供了请求示例。 ... [详细]
  • 本文介绍了OpenStack的逻辑概念以及其构成简介,包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]
  • 本文介绍了如何使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换。首先解释了JSON的概念和数据格式,然后详细介绍了相关API,包括JSONObject和Gson的使用方法。接着讲解了如何将json格式的字符串转换为kotlin对象或List,以及如何将kotlin对象转换为json字符串。最后提到了使用Map封装json对象的特殊情况。文章还对JSON和XML进行了比较,指出了JSON的优势和缺点。 ... [详细]
  • SpringBoot整合SpringSecurity+JWT实现单点登录
    SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]
  • 本文介绍了Windows Vista操作系统中的用户账户保护功能,该功能是为了增强系统的安全性而设计的。通过对Vista测试版的体验,可以看到系统在安全性方面的进步。该功能的引入,为用户的账户安全提供了更好的保障。 ... [详细]
  • 本文介绍了解决java开源项目apache commons email简单使用报错的方法,包括使用正确的JAR包和正确的代码配置,以及相关参数的设置。详细介绍了如何使用apache commons email发送邮件。 ... [详细]
  • 本文介绍了关于Java异常的八大常见问题,包括异常管理的最佳做法、在try块中定义的变量不能用于catch或finally的原因以及为什么Double.parseDouble(null)和Integer.parseInt(null)会抛出不同的异常。同时指出这些问题是由于不同的开发人员开发所导致的,不值得过多思考。 ... [详细]
  • 使用freemaker生成Java代码的步骤及示例代码
    本文介绍了使用freemaker这个jar包生成Java代码的步骤,通过提前编辑好的模板,可以避免写重复代码。首先需要在springboot的pom.xml文件中加入freemaker的依赖包。然后编写模板,定义要生成的Java类的属性和方法。最后编写生成代码的类,通过加载模板文件和数据模型,生成Java代码文件。本文提供了示例代码,并展示了文件目录结构。 ... [详细]
  • 本文介绍了在实现了System.Collections.Generic.IDictionary接口的泛型字典类中如何使用foreach循环来枚举字典中的键值对。同时还讨论了非泛型字典类和泛型字典类在foreach循环中使用的不同类型,以及使用KeyValuePair类型在foreach循环中枚举泛型字典类的优势。阅读本文可以帮助您更好地理解泛型字典类的使用和性能优化。 ... [详细]
  • Python15行代码实现免费发送手机短信,推送消息「建议收藏」
    Python15行代码实现免费发 ... [详细]
author-avatar
蔡少暖_171
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有