Spark和Hadoop都可以作为开源Apache项目免费获得,这意味着用户都可以零成本安装运行。但是,考虑总体拥有成本才是最重要的,比如维护、硬件和软件购买,雇佣集群管理团队的开销。内部安装的一般经验法则是Hadoop需要更多的磁盘内存,而Spark需要更多的RAM,这意味着设置Spark集群可能会更加昂贵。此外,由于Spark是较新的系统,因此它的专家更为稀少,成本更高。另一种选择是使用供应商进行安装,例如Cloudera for Hadoop或Spark for DataBricks,或使用AWS在云中运行EMR / Mapreduce。