[学习笔记] 哈希函数和 SHA256

哈希函数(Hash),也称为散列函数或散列算法,是一种从任何一种数据中创建小的数字“指纹”的方法。散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值(hashes)的指纹。散列值通常用一个短的随机字母和数字组成的字符串来代表。好的散列函数在输入域中很少出现散列冲突。

原始数据  --- 输入 -->  哈希函数  --- 输出 -->  数据指纹

一般的,

  • 哈希函数是一种数据转换函数,将输入(原数据)映射成输出(索引)
  • 设计良好的哈希函数,对不同的输入,会得到不同的输出
  • 哈希函数能压缩输入数据,生成固定长度的输出
  • 计算过程不可逆,是输入到输出的单向函数

哈希函数的概念非常宽泛,是一类算法的统称,常见的哈希函数有 MD5、SHA 等。

SHA(Secure Hash Algorithm,安全散列算法)是一个密码散列函数家族,由美国国家安全局(NSA)设计,并由美国国家标准与技术研究院(NIST)发布,是美国的政府标准。SHA 家族包括 SHA-0、SHA-1、SHA-2 和 SHA-3 四个函数系列。SHA256 是 SHA-2 系列的函数。

对于 SHA256,

  • 无论输入多长,都输出 64 个字符,共 32 字节(byte),256 位(bit)
  • 输出只包含数字 0 ~ 9 和字母 A ~ F,大小写不敏感

参考