我们首先来看一下一些挖矿算法的主要安全要求。如果算法本身不能满足比特币安全性上的基本要求的话,我们也没有必要引入一些新奇的特点。
已经有许多可能的要求,有些我们在前面的第2章和第5章中已经讨论过。挖矿解谜的结果需要被及时验证,因为每个在网络上的节点都在验证每个解谜的结果,即使是那些没有直接参与挖矿的节点,包括SPV(简单支付验证)的客户端。我们还需要解谜的难度具有可调整的特征,解谜难度可以随着新加入用户而增大的哈希算力得到调整。这样一来,解谜过程就可以具备足够的难度使得对区块链的攻击变得代价高昂,同时又能保证解谜本身可以在一个稳定的频率上实现(比特币系统中大约每10分钟完成一个解谜过程)。
到底什么是比特币的挖矿解谜?
到现在为止我们一直在用“比特币解谜”这个名称,更加精确的说法是,我们称它为一个“不完全哈希函数原像解谜”(partial hash-preimage puzzle),因为这个运算的目的,是找到一个不完全的特定哈希函数输出值的原像——也就是一个低于某一特定目标区值的结果。除此之外,一些罕见的特征也可以用来作为比特币的挖矿解谜运算,比如找到一个区块,它的哈希函数值至少有k个点位是零,但是通常直接比较既定目标是最简单的方法。
比特币用的基于SHA-256挖矿解谜哈希函数,很显然已经满足了这两个要求。它可以通过任意调节一个参数(目标)来灵活增加难度。检查这个谜底很容易,只需要一个SHA-256计算和一个与目标的比较即可,不管找到这个谜底的过程有多么困难。
另外一个核心的要求更加微妙:在任意单位时间找到一个谜底的成功率,大致上要与所贡献的哈希算力成比例。这就意味着,大矿工虽然拥有非常强大的挖矿机,他也只是有着一定比例的优势来成为下一个找到谜底的矿工。即使是小矿工,也会有一定的机会能够成功并且获取奖励。
为了说明这一点,我们先来设想一个没有满足这个要求的不合格解谜过程。想象一下某一个挖矿解谜要经过精确的n个步骤找到一个谜底。例如,不同于我们当前要求的“找到一个SHA-256结果低于某一个固定目标的区块”的做法,如果要求计算n个连续的SHA-256函数值,这种做法检查结果会变得没有效率,但是这个问题目前无关紧要,更大的问题在于,因为这个解谜过程需要精确的n个步骤来完成,所以网络上解谜更快的矿工将会永远是获得下一个奖励的赢家。很快这个情况就变得路人皆知,最快的矿工会完成所有解谜,而其他矿工完全没有动力继续参与下去。
再次声明,一个好的解谜方案,是给每个矿工一个按比例性的成功概率来赢得下一个谜底,这个概率是与他们所贡献的哈希算力成比例。就好比往一个不同大小色块组成的目标板上随机地掷飞镖,每个不同大小色块就类似于不同矿工所具有的挖矿运算能力。如果你考虑到这一点,这就意味着你猜中谜底的概率并不取决于你已经做了多少工作去解谜(因为大矿工们总是会做更多的工作量)。所以一个好的解谜是“无关过程的”(progress free)[1]。
从数学角度来看,一个好的挖矿解谜一定是一个“无记忆进程的”(memoryless process)——而任何其他的方法都将由于过去的挖掘工作,不可避免地在一定程度上奖励挖矿工人。因此,任何可行的解谜从根本上都是一个不断试错的过程(trial-and-error)。这种解谜所需要的时间,必然服从一个指数分布[2],我们曾在第2章讨论过。
可以调整的难度、快速验证和无关过程属性,是比特币挖矿解谜的三大核心特征。基于SHA-256算法的“不完全哈希函数原像解谜”显然满足了这三大要求。有些人可能会说其他一些特征也很重要,我们在后面讨论其他潜在功能的时候会提及。
[1] 意思是来得早,不如来得巧,但这个巧后面的学问就大了。——译者注
[2] 旅客进入机场的时间间隔也是一个指数分布,后面进来一个人的时间间隔与前面进来人的时间间隔无关。——译者注