比特币是区块链中最重要的一个应用,在比特币大涨之后又出现了很多币种,比如莱特币、以太币等等,更在2014年以太坊的出现,市面上出现了各种各样的币种以及ICO,在此先简单介绍一下以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统,从数据资料中显示,以太坊从诞生到2017年5月,全球已有了200多个以太坊应用的诞生。以太坊是一个平台和一种编程语言,使开发人员能够建立和发布下一代分布式应用,包括创建各种加密货币、智能合约、还有基于区块链的“去中心化自治组织”,但是以太坊是基于go、python以及自制的一些语言,对于广泛使用java语言的开发人员以及底层框架就是Java的系统而言,很难进行扩展和实际应用,所以我会一步一步的用Java语言帮助你创建属于你的第一个区块链应用。
写本系列教程的一个最终目的就是,帮助你实现区块链技术,并希望你可以应用区块链技术到特有的业务逻辑中去,因为除了已知的比特币、以太坊,区块链在非金融行业、产业链以及传统金融行业中都可以广泛的应用起来。所以在这个教程中将会实现:
1、创建你第一个非常基本的区块链
2、实现一个简单的工作量证明系统即挖矿
3、在此基础上实现各种可能性
在此我必须要首先说明,这里创建的区块链并不是功能完全的完全适合应用与生产的区块链,相反只是为了帮助你更好的理解区块链的概念。事实上现在的区块链技术也没有非常的成熟,还属于探索研究的阶段,换个想法,这也代表了我们有很大的机遇不断的去发展区块链技术,并利用区块链技术来颠覆我们现有的商业世界。
第一步、创建区块链
区块链就是一串或者是一系列区块的集合,类似于链表的概念,每个区块都指向于后面一个区块,然后顺序的连接在一起。那么每个区块中的内容是什么呢?在区块链中的每一个区块都存放了很多很有价值的信息,主要包括三个部分:自己的数字签名,上一个区块的数字签名,还有一切需要加密的数据(这些数据在比特币中就相当于是交易的信息,它是加密货币的本质)。每个数字签名不但证明了自己是特有的一个区块,而且指向了前一个区块的来源,让所有的区块在链条中可以串起来,而数据就是一些特定的信息,你可以按照业务逻辑来保存业务数据。
这里的hash指的就是数字签名 。
所以每一个区块不仅包含前一个区块的hash值,同时包含自身的一个hash值,自身的hash值是通过之前的hash值和数据date通过hash计算出来的。如果前一个区块的数据一旦被篡改了,那么前一个区块的hash值也会同样发生变化(因为数据也被计算在内),这样也就导致了所有后续的区块中的hash值。所以计算和比对hash值会让我们检查到当前的区块链是否是有效的,也就避免了数据被恶意篡改的可能性,因为篡改数据就会改变hash值并破坏整个区块链。
就像上图中看到了一个每一个区块包含一个自身的hash(数字签名),而变量PreviousHash是由前一个区块的hash值和data数据进行hash计算获得而来的。
我定义的区块链格式如下,只包含了最重要的一些信息,你可以在此基础上进行扩展。
第二步、创建数字签名
熟悉加密算法的朋友们,Java方式可以实现的加密方式有很多,例如BASE、MD、RSA、SHA等等,我在这里选用了SHA256这种加密方式,SHA(Secure Hash Algorithm)安全散列算法,这种算法的特点是数据的少量更改会在Hash值中产生不可预知的大量更改,hash值用作表示大量数据的固定大小的唯一值,而SHA256算法的hash值大小为256位。之所以选用SHA256是因为它的大小正合适,一方面产生重复hash值的可能性很小,另一方面在区块链实际应用过程中,有可能会产生大量的区块,而使得信息量很大,那么256位的大小就比较恰当了。
下面我创建了一个StringUtil方法来方便调用SHA256算法。
或许你完全不理解上述代码的含义,但是你只要理解所有的输入调用此方法后均会生成一个独一无二的hash值(数字签名),而这个hash值在区块链中是非常重要的。
接下来让我们在Block类中应用 方法 applySha256 方法,其主要的目的就是计算hash值,我们计算的hash值应该包括区块中所有我们不希望被恶意篡改的数据,在我们上面所列的Block类中就一定包括previousHash,data和timeStamp,
然后把这个方法加入到Block的构造函数中去。
第三步、是时候进行一下测试了
在主方法中让我们创建一些区块,并把其hash值打印出来,来看看是否一切都在我们的掌控中。
就在我的“10分钟理解区块链究竟是什么”中提到的,区块链中的第一个区块我们称之为创世纪区块,因为它是头区块,所以previousHash值我们设定为0。
//创世纪区块
//第二个区块,链接在创世纪区块之后
输出结果类似于下面
每一个区块都必须要有自己的数据签名即hash值,这个hash值依赖于自身的信息(data)和上一个区块的数字签名(previousHash),但这个还不是区块链,下面让我们存储区块到数组中,这里我会引入gson包,目的是可以用json方式查看整个一条区块链结构。
这样的输出结构就更类似于我们所期待的区块链的样子。
第四步、检查区块链的完整性。
在主方法中增加一个isChainValid()方法,目的是循环区块链中的所有区块并且比较hash值,这个方法用来检查hash值是否是于计算出来的hash值相等,同时previousHash值是否和前一个区块的hash值相等。或许你会产生如下的疑问,我们就在一个主函数中创建区块链中的区块,所以不存在被修改的可能性,但是你要注意的是,区块链中的一个核心概念就是去中心化,每一个区块可能是在网络中的某一个节点中产生的,所以很有可能某个节点把自己节点中的数据修改了,那么根据上述的理论数据改变会导致整个区块链的破裂,也就是区块链就无效了。
任何区块链中区块的一丝一毫改变都会导致这个函数返回false,也就证明了区块链无效了。
在比特币网络中所有的网络节点都分享了它们各自的区块链,然而最长的有效区块链是被全网所统一承认的,如果有人恶意来篡改之前的数据,然后创建一条更长的区块链并全网发布呈现在网络中,我们该怎么办呢?这就涉及到了区块链中另外一个重要的概念工作量证明,这里就不得不提及一下hashcash,这个概念最早来自于Adam Back的一篇论文,主要应用于邮件过滤和比特币中防止双重支付。
hashcash其本质就是一个数学难题,希望你可以做大量的工作,也就是付出cpu的计算能力得到正确的结果才能够获取某些资源(比如往你的邮箱中发送垃圾邮件),邮件过滤正是基于这样的原理,我们设定一个规则,所有想给我发送电子邮件的人,我都要求他满足一个计算结果才会接受,要满足这个计算结果必须付出cpu的计算代价。即使一次计算只需要几秒钟,对于垃圾邮件的系统来说都是致命的,因为这些系统每天要发送数以万计的垃圾邮件,多出的cpu时间对它们来说代价是非常大的。
我们在这里实现了hashcash的理论,也就是为了创建一个新的区块必须花费大量的时间和计算能力,所以攻击者想要篡改数据那么他必须比其他节点拥有更多的计算能力。
第五步、挖矿
这里我们要求挖矿者做工作量证明,具体的方式是在区块中尝试不同的参数值直到它的hash值是从一系列的0开始的。下面我们在Block类中增加了一个随机数nonce,在计算hash值中也把nonce计算在内。
//创建一个string值由难度的位数来决定
mineBlock()方法中引入了一个int值称为difficulty难度,低的难度比如1和2,普通的电脑基本都可以马上计算出来,我的建议是在4-6之间进行测试,普通电脑大概会花费3秒时间,在莱特币中难度大概围绕在442592左右,而在比特币中每一次挖矿都要求大概在10分钟左右,当然根据所有网络中的计算能力,难度也会不断的进行修改。
public static int difficulty =5;
这样我们必须修改主方法中让创建每个新区块时必须触发mineBlock()方法,而isChainValid()方法用来检查每个区块的hash值是否正确,整个区块链是否是有效的。
经过测试增加一个新的区块即挖矿必须花费一定时间,大概是3秒左右,你可以提高difficulty难度来看,它是如何影响数据难题所花费的时间的。
如果有人在你的区块链系统中恶意篡改数据:
1、他们的区块链是无效的。
2、他们无法创建更长的区块链
3、网络中诚实的区块链会在长链中更有时间的优势
因为篡改的区块链将无法赶上长链和有效链,除非他们比你网络中所有的节点拥有更大的计算速度,可能是未来的量子计算机或者是其他什么。
由此你的第一个区块链已经创建成功了
总结一下:你的第一个区块链实现的功能包括
1、有很多区块组成用来存储数据
2、有数字签名让你的区块链链接在一起
3、需要挖矿的工作量证明新的区块
4、可以用来检查数据是否是有效的同时是未经篡改的
你可以从下面地址下载工程 NoobChain-Tutorial-Part-1-master
在下一个部分,我会讲述交易、数字签名以及钱包等概念,请持续关注。