热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据测试_大数据测试笔记测试的3条建议

篇首语:本文由编程笔记#小编为大家整理,主要介绍了大数据测试笔记-测试的3条建议相关的知识,希望对你有一定的参考价值。       大数据,咋一听起来

篇首语:本文由编程笔记#小编为大家整理,主要介绍了大数据测试笔记-测试的3条建议相关的知识,希望对你有一定的参考价值。



      大数据,咋一听起来都觉得很神秘,很高大上,从2013年开始听得越来越多,什么数据挖掘,数据分析、机器学习、算法,让我等听起来天马行空,雾里看花,有幸接触到了大数据项目,让我拨开云雾,原来大数据其实简单,真的简单,大量数据嘛,就是我们说的大数据,基于数据分析,获得有价值的信息。

image

    目前我理解大数据,有数据采集、数据存储、数据分析、数据应用,前两者是基础,后两者是价值,采集存储数据不是目的,利用数据分析有价值的信息,才是我们选择的。

image

    我们不展开聊,作为测试,我关心的是我要测试什么,如何测试,怎么衡量产品的质量情况,拿数据采集来说,从文本、mysql数据库、oracle数据、接口等,采集数据,然后经过清洗,存在hdfs、hbase、solr、es等等位置,该如何做,需要注意什么?

image

建议三步:

1、学习知识点

   虽然我们不是开发,但是作为大数据的测试,我们必须掌握编程能力,java和python、shell三者是少不了的,另外从hadoop、hdfs、hbase、solr、hive、hue、sqoop、flume、kafka、zookeeper、YARN、oozie、spark等基本的原理和api是必须学习和了解的,这些是我们和研发沟通、是我们自己测试的必要条件,有这些知识,我们才能明白自己测什么,怎么测,哪里有风险,才有信心。

image

2、开发小工具

  如果说这个数据有3条,我可能人为处理,如果要我制造10G有格式要求的数据,我想我还是选择自己开发个小工具。做大数据测试,给自己开发合适的工具,才能事半功倍,才能降低测试的复杂度,才能更准确的测试。

image

3、调整思维

常规的测试,都是开发完了,提测,然后测试开始测试,作为大数据,很多场景是无法模拟的,比如数据采集时候出现异常,导致数据采集重置,这样的场景人为模拟很难搞定,这时候我们更需要调整思维,和研发一起探讨实现的逻辑,分析逻辑判断是否有bug,和研发一起做单元测试,做日志埋点策略。另外,时间是宝贵的,我们要尽力提高效率,比如我们针对部署做了一键化部署,研发测试都使用,分布式部署再也不是问题了,比如我们提前根据接口文档,写好接口脚本,快速测试,或者利用脚本做测试数据等等,但是千万别陷入到自动化测试的坑里面了,能则用,不能则 选择用。

image

     好了,时间不早了,这次零星的说说,比较杂,下次我们从头开始详细分析。

     坚持的是分享,搬运的是知识,图的是大家的进步,没有收费的培训,没有虚度的吹水,喜欢就关注、转发(免费帮助更多伙伴)等来交流,想了解的知识请留言,给你带来更多价值,是我们期待的方向,有更多兴趣的欢迎切磋,我们微信订阅号,联系方式如下:

image

推荐的文章

【解密】jmeter随笔(30)-读取自己jar包配置的代码实现

jmeter随笔(29)-关于自己的jar包和beanshell的使用

jenikns系列(7)-一个变量名引发的血案

初探接口测试框架--python系列7

Postman使用小感

飞测,16(一路)17(一起),不忘初心

聊聊我们的线上巡检(2)

聊聊我们的线上巡检

飞测历史文章目录清单

jmeter随笔(34)-WebSocket协议接口测试实战

测试小结之checklist篇

jmeter随笔(36)-fiddler抓jmeter发送的请求

jmeter随笔(35)-jmeter从txt取数,在请求中中文乱码



推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 11月26日,由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,CSDN承办的Hadoop与大数据技术大会(Hadoop&BigDataTechnology ... [详细]
  • 我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  • Azkaban(三)Azkaban的使用
    界面介绍首页有四个菜单projects:最重要的部分,创建一个工程,所有flows将在工程中运行。scheduling:显示定时任务executing:显示当前运行的任务histo ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • 2018深入java目标计划及学习内容
    本文介绍了作者在2018年的深入java目标计划,包括学习计划和工作中要用到的内容。作者计划学习的内容包括kafka、zookeeper、hbase、hdoop、spark、elasticsearch、solr、spring cloud、mysql、mybatis等。其中,作者对jvm的学习有一定了解,并计划通读《jvm》一书。此外,作者还提到了《HotSpot实战》和《高性能MySQL》等书籍。 ... [详细]
  • 一次上线事故,30岁+的程序员踩坑经验之谈
    本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间,作为一个在线医疗项目,他们进行了优惠折扣活动的升级改造。然而,在上线前的最后一天,由于大量数据请求,导致部分接口出现问题。作者通过部署两台opentsdb来解决问题,但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]
  • ZooKeeper 学习
    前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗?如果别人面试官让你给他讲讲ZooKeeper是个什么东西, ... [详细]
  • 如何在mysqlshell命令中执行sql命令行本文介绍MySQL8.0shell子模块Util的两个导入特性importTableimport_table(JS和python版本 ... [详细]
  • 物联网、工业互联网大数据的特点-随着数据通讯成本的急剧下降,以及各种传感技术和智能设备的出现,从手环、共享出行、智能电表、环境监测设备到电梯、数控机床、挖掘机、工业生产线等都在源 ... [详细]
  • 《Spark核心技术与高级应用》——1.2节Spark的重要扩展
    本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章,第1.2节Spark的重要扩展,作者于俊向海代其锋马海平,更多章节内容可以访问云栖社区“华章社区”公众号查看1. ... [详细]
  • 前言折腾了一段时间hadoop的部署管理,写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动,我已经把部署的步骤写成脚本,各位只需要按着本文把脚本执行完,整个环境基本就部署 ... [详细]
author-avatar
159dzhqian449_734
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有