正文

什么是安全散列算法SHA256？

巴比特区块链教程2013-09-30 17:31:00

安全散列算法SHA（Secure Hash Algorithm）是美国国家安全局（NSA）设计，美国国家标准与技术研究院（NIST）发布的一系列密码散列函数，包括 SHA-1、SHA-224、SHA-256、SHA-384 和 SHA-512 等变体。主要适用于数字签名标准（ DigitalSignature Standard DSS ）里面定义的数字签名算法（ Digital Signature Algorithm DSA ）。下面以 SHA-1为例，介绍该算法计算消息摘要的原理。

对于长度小于 2^64 位的消息， SHA1 会产生一个 160 位的消息摘要。当接收到消息的时候，这个消息摘要可以用来验证数据的完整性。在传输的过程中，数据很可能会发生变化，那么这时候就会产生不同的消息摘要。

SHA1 有如下特性：不可以从消息摘要中复原信息；两个不同的消息不会产生同样的消息摘要。

一、术语和概念

（一）位 (Bit) ，字节（ Byte ）和字（ Word ）

SHA1 始终把消息当成一个位（ bit ）字符串来处理。本文中，一个 “ 字 ” （ Word ）是 32 位，而一个 “ 字节 ” （ Byte ）是 8 位。比如，字符串 “abc” 可以被转换成一个位字符串： 01100001 01100010 01100011 。它也可以被表示成 16 进制字符串 :0x616263.

（二）运算符和符号

下面的逻辑运算符都被运用于 “ 字 ” （ Word ）

X^Y = X ， Y 逻辑与

X \/ Y = X ， Y 逻辑或

X XOR Y= X ， Y 逻辑异或

~X = X 逻辑取反

X+Y 定义如下：

字 X 和 Y 代表两个整数 x 和 y, 其中 0 <= x < 2^32 且 0 <= y < 2^32. 令整数 z= (x + y) mod 2^32. 这时候 0 <= z < 2^32. 将 z 转换成字 Z, 那么就是 Z = X + Y.

循环左移位操作符 Sn(X) 。 X 是一个字， n 是一个整数， 0<=n<=32 。 Sn(X)= (X< >32-n)

X< 定义如下：抛弃最左边的 n 位数字，将各个位依次向左移动 n 位，然后用 0 填补右边的 n 位（最后结果还是 32 位）。 X>>n 是抛弃右边的 n 位，将各个位依次向右移动 n 位，然后在左边的 n 位填 0 。因此可以叫 Sn(X) 位循环移位运算

二、SHA1 算法描述

在 SHA1 算法中，我们必须把原始消息（字符串，文件等）转换成位字符串。 SHA1 算法只接受位作为输入。假设我们对字符串 “abc” 产生消息摘要。首先，我们将它转换成位字符串如下：

01100001 0110001001100011

―――――――――――――

‘a’=97 ‘b’=98‘c’=99

这个位字符串的长度为 24 。下面我们需要 5 个步骤来计算 MD5 。

（一）补位

消息必须进行补位，以使其长度在对 512 取模以后的余数是 448 。也就是说，（补位后的消息长度） %512 = 448 。即使长度已经满足对 512 取模后余数是 448 ，补位也必须要进行。

补位是这样进行的：先补一个 1 ，然后再补 0 ，直到长度满足对 512 取模后余数是 448 。总而言之，补位是至少补一位，最多补 512 位。还是以前面的 “abc” 为例显示补位的过程。

原始信息： 01100001 01100010 01100011

补位第一步： 0110000101100010 01100011 1

首先补一个 “1”

补位第二步： 0110000101100010 01100011 10…..0

然后补 423 个 “0”

我们可以把最后补位完成后的数据用 16 进制写成下面的样子

61626380 0000000000000000 00000000

00000000 0000000000000000 00000000

00000000 00000000

现在，数据的长度是 448 了，我们可以进行下一步操作。

（二）补长度

所谓的补长度是将原始数据的长度补到已经进行了补位操作的消息后面。通常用一个 64 位的数据来表示原始消息的长度。如果消息长度不大于 2^64 ，那么第一个字就是 0 。在进行了补长度的操作以后，整个消息就变成下面这样了（ 16 进制格式）

61626380 0000000000000000 00000000

00000000 0000000000000000 00000000

00000000 0000000000000000 00000018

如果原始的消息长度超过了 512 ，我们需要将它补成 512 的倍数。然后我们把整个消息分成一个一个 512 位的数据块，分别处理每一个数据块，从而得到消息摘要。

（三）使用的常量

一系列的常量字 K(0),K(1), ... , K(79) ，如果以 16 进制给出。它们如下：

Kt = 0x5A827999 (0<= t <= 19)

Kt = 0x6ED9EBA1 (20<= t <= 39)

Kt = 0x8F1BBCDC (40<= t <= 59)

Kt = 0xCA62C1D6 (60<= t <= 79).

（四）需要使用的函数

在 SHA1 中我们需要一系列的函数。每个函数 ft (0 <= t <= 79) 都操作 32 位字 B ， C ， D 并且产生 32 位字作为输出。 ft(B,C,D) 可以如下定义

ft(B,C,D) = (B ANDC) or ((NOT B) AND D) ( 0 <= t <= 19)

ft(B,C,D) = B XOR CXOR D (20 <= t <= 39)

ft(B,C,D) = (B ANDC) or (B AND D) or (C AND D) (40 <= t <= 59)

ft(B,C,D) = B XOR CXOR D (60 <= t <= 79).

（五）计算消息摘要

必须使用进行了补位和补长度后的消息来计算消息摘要。计算需要两个缓冲区，每个都由 5 个 32 位的字组成，还需要一个 80 个 32 位字的缓冲区。第一个 5 个字的缓冲区被标识为 A ， B ， C ， D ， E 。第二个 5 个字的缓冲区被标识为 H0,H1, H2, H3, H4 。 80 个字的缓冲区被标识为 W0,W1,..., W79