热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何高效启动大数据应用之旅?

在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。

In my previous article, I discussed what is big data? What are the differences between big data& data mining, what are the future scopes of big data? In this article, we will discuss how to get started with big data?

在上一篇文章中,我讨论了什么是大数据 ? 大数据与数据挖掘之间的区别是什么 ? 大数据的未来范围是什么 ? 在本文中,我们将讨论如何开始使用大数据 ?

As we all know that field of big data is very vast and as it is a new technology these days so, it can be quite challenging to start learning whoever wants to do so. So, in this article, I will try to show you a guided path to start the journey with big data and grab a good job of big data in companies. Here, in this article I have tried to describe & guide through step by step, hope, it will help you all, to get on the right track.

众所周知,大数据领域非常广泛,并且由于这是当今的一项新技术,因此开始学习任何想这样做的人都可能会面临很大的挑战。 因此,在本文中,我将尝试向您展示一条指导性路径,以开始使用大数据的旅程,并抓住公司中的大数据工作。 在本文中,我试图逐步描述和指导,希望对您有所帮助,以使您走上正确的道路。

脚步 (Steps)

The first and the most important step is to determine the right role according to our interests and skillset we have. Without determining our goal (position or role) for which we want to prepare it will be like "shooting in the dark".

第一步也是最重要的一步是根据我们的兴趣和技能确定合适的角色。 没有确定我们要为其准备的目标(位置或角色),就像“在黑暗中射击”

So, first we have to determine our role, now basically if we speak broadly the roles in the big data industry can be classified into two major categories:

因此,首先,我们必须确定我们的角色,现在基本上,如果我们大致讲大数据行业中的角色,可以分为两大类:

  1. Big Data Engineering

    大数据工程

  2. Big Data Analytics

    大数据分析

Let us discuss about the roles and requisites of big data analyst and big data engineer/ developer.

让我们讨论大数据分析师和大数据工程师/开发人员的角色和必要条件。

大数据工程师或开发人员的角色 (Role of Big Data Engineer or developer)

  • As the word engineer suggests, you should know how to engineer the big data, means you should be able to see a different perspective or different outcome of the same data that all others are seeing as normal bulk or mess of data.

    就像工程师一词所暗示的那样,您应该知道如何设计大数据,这意味着您应该能够看到同一数据的不同视角或不同结果,而其他所有人都将它们视为正常的批量或混乱数据。

  • You have to figure out that the bulk of data and also have to figure out how the SQL database works effectively.

    您必须弄清楚大量数据,还必须弄清楚SQL数据库如何有效地工作。

  • You should be able to handle the bulk of data using technologies like Hadoop/Spark, programming languages etc.

    您应该能够使用Hadoop / Spark,编程语言等技术处理大量数据。

BIG DATA开发人员/工程师的需求 (Requisites for BIG DATA developer/engineer)

  1. Should have a good grip over SQL, core Java, JS, OOAD (object-oriented analysis and design).

    应该对SQL , 核心Java , JS ,OOAD有良好的掌握(面向对象的分析和设计)。

  2. Should have preliminary knowledge of R and python

    应该具有R和python的初步知识

  3. Mastering with different tools like Hadoop, MapReduce, Spark etc.

    精通Hadoop,MapReduce,Spark等不同工具

  4. Having a good analytical problem-solving approach, problem- solving, code writing skills.

    具有良好的分析性问题解决方法,问题解决能力,代码编写能力。

Skillset for data scientist

Figure: Skillset for data scientist

图:数据科学家的技能

Image source: https://www.experfy.com/blog/a-big-data-analyst-or-a-big-data-developer-what-do-you-want-to-becom

图片来源:https://www.experfy.com/blog/a-big-data-analyst-or-a-big-data-developer-what-do-you-want-to-becom

大数据开发人员/工程师的需求 (Requisites for Big Data developer/engineering)

The collection of huge data (big data) needs proper analysis for giving expectable and desired results, so, for its proper analysis, there is a need for appropriate database management systems. The main purpose of big data analyzation is to improve or expand the business of companies.

大数据(大数据)的收集需要进行适当的分析以给出预期的结果,因此,为了进行适当的分析,需要适当的数据库管理系统。 大数据分析的主要目的是改善或扩展公司的业务。

Tracking and using the different data of companies like transactions, searches, user profile information, user interest everything should be analyzed in order to extract fruitful outcome.

跟踪和使用公司的不同数据(例如交易,搜索,用户个人资料信息,用户兴趣),应该对其进行分析,以提取出丰硕的成果。

大数据分析的必要条件 (Requisites for BIG DATA ANALYST)

  1. Good knowledge of maths and statistics.

    精通数学和统计学。

  2. Good knowledge of tools and techniques used in big data storing, processing and analysis, such as Hadoop, Spark etc.

    熟悉大数据存储,处理和分析中使用的工具和技术,例如Hadoop,Spark等。

  3. You should have a focused mind and very clear concepts of maths, statistics and different Big Data technologies in order to become a good big data analyst.

    为了成为一名优秀的大数据分析师,您应该有专心的头脑和非常清晰的数学,统计学和不同的大数据技术概念。

Big data analytics

Figure: Big data analytics

图:大数据分析

Image source: https://www.experfy.com/blog/a-big-data-analyst-or-a-big-data-developer-what-do-you-want-to-become

图片来源:https://www.experfy.com/blog/a-big-data-analyst-or-a-big-data-developer-what-do-you-want-to-become

Now, when we have an understanding of roles that suits our skills and interest, so now once we have decided on our role, we can begin with the learning process. As we all know that domain of Big Data is full with various technologies, so, its quite difficult to master them all, so, below I am attaching a Big data engineer/ analyst path flow chart.

现在,当我们了解适合自己技能和兴趣的角色时,那么一旦我们决定了角色,就可以从学习过程开始。 众所周知,大数据领域已经充满了各种技术,因此很难完全掌握所有技术,因此,在下面我附上了大数据工程师/分析师的流程图。

flow chart for big data engineer path

Figure: flow chart for big data engineer path

图:大数据工程师路径流程图

Image source: https://www.analyticsvidhya.com/blog/2017/03/big-data-learning-path-for-all-engineers-and-data-scientists-out-there/

图片来源:https://www.analyticsvidhya.com/blog/2017/03/big-data-learning-path-for-all-engineers-and-data-scientists-out-there/

Conclusion:

结论:

I hope this article might have helped you to clear up some of the mess running over your mind about how to start learning big data! So, now when once you are decided with your role you can follow the tree and also refer to some top certifications that I mentioned in my previous articles Big Data: an emerging trend on IT sector.

我希望本文能帮助您清除一些关于如何开始学习大数据的麻烦! 因此,现在,一旦确定了自己的角色,您就可以沿用这棵树,并参考我在之前的文章《 大数据:IT部门的新兴趋势》中提到的一些顶级认证。

So, now wear your wings and get started, will see you in the next article. Till then Stay connected, be healthy and keep learning!

因此,现在戴上翅膀开始使用,将在下一篇文章中见到您。 直到保持联系,保持健康并继续学习!

翻译自: https://www.includehelp.com/big-data/how-to-get-started-with-big-data.aspx




推荐阅读
  • golang常用库:配置文件解析库/管理工具viper使用
    golang常用库:配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库,是由大神SteveFrancia开发,他在google领导着golang的 ... [详细]
  • [论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)
    Time:4hoursTimespan:Apr15–May3,2012OmarZaidan,ChrisCallison-Burch:CrowdsourcingTra ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 深入解析Android自定义View面试题
    本文探讨了Android Launcher开发中自定义View的重要性,并通过一道经典的面试题,帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识,还提供了实际操作建议。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细介绍了 GWT 中 PopupPanel 类的 onKeyDownPreview 方法,提供了多个代码示例及应用场景,帮助开发者更好地理解和使用该方法。 ... [详细]
  • 三星W799在2011年的表现堪称经典,以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]
  • 本文介绍了如何利用JavaScript或jQuery来判断网页中的文本框是否处于焦点状态,以及如何检测鼠标是否悬停在指定的HTML元素上。 ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
  • 本文基于刘洪波老师的《英文词根词缀精讲》,深入探讨了多个重要词根词缀的起源及其相关词汇,帮助读者更好地理解和记忆英语单词。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • 本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法,并提供了多个实际代码示例,帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目,具有很高的参考价值。 ... [详细]
author-avatar
lady张昕彤
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有