热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【社区问答第四十一期】ApacheSpark大数据专题

盘点过去两年,ApacheSpark无疑是最热门的开源大数据框架,然而作为一个高速发展的开源项目其生产环境使用仍然存在一些问题。本期问答(2016-5-3----2016-5-8),我们特邀请8位技
盘点过去两年,Apache Spark无疑是最热门的开源大数据框架,然而作为一个高速发展的开源项目其生产环境使用仍然存在一些问题。本期问答(2016-5-3----2016-5-8),我们特邀请8位技术大牛,为大家答疑解惑。

本期问答内容:

1. Spark方向

专家介绍:

1. TalkingData研发副总裁阎志涛



2. 祝海林,现就职于乐视云计算,资深数据工程师。从事大数据平台架构相关工作,现专注在机器学习/数据查询分析领域。对Spark/ES较为熟悉,业余时间喜欢研究通用资源管理相关课题



3. 刘喆(Zhe Liu)2013年加入AdMaster,现任架构师。主要负责数据处理的全流程技术支持, 高性能和高可用的分布式架构设计, DSL 语言抽象, Hadoop/HBase/Storm/Spark等大数据平台优化。2010年硕士毕业后, 刘喆在百度就职, 负责当时全球规模最大的 hadoop 平台的运维开发工作. 2011年底加入人民搜索, 代理运维总监。近 7 年的大学生活和近 5 年的工作经历中, 刘喆一直在追求简单直接,关注于数据挖掘/大数据/DSL/系统架构, 对分布式计算/分布式架构和程序语言情有独钟, 曾多次被51CTO/spark 峰会/into100峰会等邀请为嘉宾分享Hadoop/spark/开源软件等相关经验。



4. 田毅,目前在数据分析服务公司GrowingIO数据平台部门工作,Spark社区的Contributor,北京Spark Meetup组织者,2010年开始在电信领域实践应用hadoop,2013年开始关注Spark,从Shark开始向社区贡献代码。目前主要的研究方向是使用Spark搭建企业级的数据计算分析平台。



5. 黄忠,目前主要从事数据挖掘及大数据平台等相关工作,Spark技术实践和研究者,多次担任Spark线下公开课讲师,曾参与云平台,分布式爬虫,推荐系统等项目。



6. 梁堰波Hortonworks技术专家,曾明略数据技术合伙人,更早的时候还曾就职于France Telecom、美团、Yahoo!等企业。梁堰波是Spark活跃贡献者,主要聚焦Spark ML/MLlib和SparkR项目,精通统计和机器学习算法在类似Spark这样分布式系统上的实现。



7. 顾荣,南京大学计算机系博士生,Alluxio项目核心开发者。完成了Alluxio很多功能/性能增强的工作,并主持实现性能测试框架和社区中文文档等。顾荣曾在微软亚洲研究院、英特尔、百度、星环科技从事大数据系统相关的研发工作



8.  王庚,目前就职于亚信数据,担任橘云大数据平台技术经理。曾经就职于腾讯,从事网络负载均衡,数据中心系统的研发工作;之后加入IBM Platform Computing,从事大数据产品Platform Symphony的研发工作。



欢迎大家留言提问,机会难得,不容错过!

49 个解决方案

#1


该回复于2016-05-03 10:32:09被管理员删除

#2


不了解

#3


支持一下,。,

#4


引用 3 楼 starytx 的回复:
支持一下,。,
.

#5


支持一下,。,

#6


.。。。

一下来了八个。。。

#7


顶,膜拜一下。

#8


支持一下,

#9


支持一下

#10


支持一下,可以结贴了

#11


#12


杀上刊登阿萨德撒打算从[size=24px] [/size]

#13


前排混脸熟

#14


这名字取的,刘备五虎神将之一都来了啊,各种三国神将啊……

#15


支持一下。。。。。。

#16


第一次听说这种东西,是我太孤陋寡闻 了吧

#17


为了拿分 现在什么新闻我都回复

#18


#19


支持一下支持一下

#20


支持一下支持一下

#21


有那么年轻的就自称大牛了???

#22


大数据到底有什么用?可以解答下不?

#23


学java的

#24


请问一下,Spark它在实际生产环境下有哪些应用?
Spark在生产环境中能够构建实时应用吗?
Spark最新的DataSet会最终替代RDD吗?DataSet与RDD之间的区别?

#25


相问一下 Hadoop、HBase、Storm、Spark之间的同异及各种的应用场景(或业务特性)

#26


想问一下,Spark  有交互式的 spark sql,有 准实时计算的 spark streaming ,还有 MLlib。再有五年会完全替代  mapreduce吗。 Hadoop下一步的发展趋势会是怎样的。以后在企业中  hadoop会使用越来越少吗。

#27


#28


spark 1.6 + MLlib 的决策树是否支持交叉校验呢

#29


#30


#31


该回复于2016-05-15 14:17:29被管理员删除

#32


提问了好像没有看到牛人回答啊

#33


顶一下______

#34


#35


引用 21 楼 u011529104 的回复:
有那么年轻的就自称大牛了???


年轻就不能成为大牛了?

#36


厉害   厉害

#37


为了拿分 现在什么新闻我都回复

#38


多多向上面几位技术大牛学习

#39


都是大牛 

#40


大牛们,请问个神奇的问题,目标网站是需要插入加密狗然后连接上它的VPN才能访问,加密狗和VPN我都有了,然后我的爬虫程序要开着HttpAnalyzer V7并启动就能访问到数据,不启动访问目标网站着会报错。。

报错的详细信息:
{System.Net.WebException: 基础连接已经关闭: 发送时发生错误。 ---> System.IO.IOException: 由于意外的数据包格式,握手失败。
   在 System.Net.Security.SslState.StartReadFrame(Byte[] buffer, Int32 readBytes, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.StartReceiveBlob(Byte[] buffer, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.CheckCompletionBeforeNextReceive(ProtocolToken message, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.StartSendBlob(Byte[] incoming, Int32 count, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.ForceAuthentication(Boolean receiveFirst, Byte[] buffer, AsyncProtocolRequest asyncRequest)
   在 System.Net.Security.SslState.ProcessAuthentication(LazyAsyncResult lazyResult)
   在 System.Net.TlsStream.CallProcessAuthentication(Object state)
   在 System.Threading.ExecutionContext.RunInternal(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
   在 System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state, Boolean preserveSyncCtx)
   在 System.Threading.ExecutionContext.Run(ExecutionContext executionContext, ContextCallback callback, Object state)
   在 System.Net.TlsStream.ProcessAuthentication(LazyAsyncResult result)
   在 System.Net.TlsStream.Write(Byte[] buffer, Int32 offset, Int32 size)
   在 System.Net.PooledStream.Write(Byte[] buffer, Int32 offset, Int32 size)
   在 System.Net.ConnectStream.WriteHeaders(Boolean async)
   --- 内部异常堆栈跟踪的结尾 ---
   在 System.Net.HttpWebRequest.GetResponse()
   在 WindowsFormsApplication10.dafuhao._GetHTML(String URL, Int32 bufflen) 位置 c:\Users\Administrator\Desktop\getRenBaoData\getRenBaoData\dafuhao.cs:行号 173}

#41


微信小程序socket请求协议能不能不使用wss  而使用ws  ?

#42


可以的,支持一下

#43


哇,支持一下

#44


可以的,支持一下

#45



这段代码为什么执行到最后一个scanf直接跳过输入?

#46


支持支持支持支持支持支持支持支持支持支持支持支持支持支持支持支持

#47


听过,没怎么用过, anyway,纯支持

#48


好事情,人才济济,为了拿分,看看回复是不是真能拿分.

#49


好事情,人才济济,为了拿分,看看回复是不是真能拿分. 

推荐阅读
  • 阿里云ecs怎么配置php环境,阿里云ecs配置选择 ... [详细]
  • 本文详细探讨了HTML表单中GET和POST请求的区别,包括它们的工作原理、数据传输方式、安全性及适用场景。同时,通过实例展示了如何在Servlet中处理这两种请求。 ... [详细]
  • 深入理解Lucene搜索机制
    本文旨在帮助读者全面掌握Lucene搜索的编写步骤、核心API及其应用。通过详细解析Lucene的基本查询和查询解析器的使用方法,结合架构图和代码示例,带领读者深入了解Lucene搜索的工作流程。 ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
  • 鼠标悬停出现提示信息怎么做
    概述–提示:指启示,提起注意或给予提醒和解释。在excel中会经常用到给某个格子增加提醒信息,比如金额提示输入数值或最大长度值等等。设置方式也有多种,简单的,仅为单元格插入批注就可 ... [详细]
  • 2012年7月30日,语言岛团队宣布其智能记单词软件V0.3.4.554版本正式开源。该版本不仅支持跨平台使用,还引入了多项创新功能,旨在帮助用户更高效地记忆单词。 ... [详细]
  • 本文介绍了如何利用 Spring Boot 和 Groovy 构建一个灵活且可扩展的动态计算引擎,以满足钱包应用中类似余额宝功能的推广需求。我们将探讨不同的设计方案,并最终选择最适合的技术栈来实现这一目标。 ... [详细]
  • 编写了几个500行左右代码的程序,但基本上解决问题还是面向过程的思维,如何从问题中抽象出类,形成类的划分和设计,从而用面向对象的思维解决问题?有这方面的入门好书吗?最好是结合几个具体的案例分析的 ... [详细]
  • 本文详细介绍了如何在不同操作系统和设备上设置和配置网络连接的IP地址,涵盖静态和动态IP地址的设置方法。同时,提供了关于路由器和机顶盒等设备的IP配置指南。 ... [详细]
  • 本文详细介绍了如何在预装Ubuntu系统的笔记本电脑上安装Windows 7。针对没有光驱的情况,提供了通过USB安装的具体方法,并解决了分区、驱动器无法识别等问题。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 全面解析运维监控:白盒与黑盒监控及四大黄金指标
    本文深入探讨了白盒和黑盒监控的概念,以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法,结合四个黄金指标的解读,帮助读者更好地理解和实施有效的监控策略。 ... [详细]
  • 探索新一代API文档工具,告别Swagger的繁琐
    对于后端开发者而言,编写和维护API文档既繁琐又不可或缺。本文将介绍一款全新的API文档工具,帮助团队更高效地协作,简化API文档生成流程。 ... [详细]
  • 智能手机的快速耗电问题困扰着许多人。通过一些简单的设置和调整,你可以显著提升手机的电池续航能力,甚至实现两天一充的目标。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
author-avatar
蔡少暖_171
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有