Android | 一种相似图片搜索算法的实现
本文介绍一种相似图片搜索算法:感知哈希算法。这种算法是对每一张图片生成一个指纹,然后对比指纹,越接近就表示越相似。
预览
算法
缩小尺寸。
将图片缩小到 8x8 的尺寸,总共 64 个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。
简化色彩。
将缩小后的图片,转为 64 级灰度。也就是说,所有像素点总共只有 64 种颜色。
计算平均值。
计算所有 64 个像素的灰度平均值。
比较像素的灰度。
将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为 1;小于平均值,记为 0。
计算哈希值。
将上一步的比较结果,组合在一起,就构成了一个 64 位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。
对比指纹
看看 64 位中有多少位是不一样的。在理论上,这等同于计算”汉明距离”(Hamming distance)。如果不相同的数据位不超过 5,就说明两张图片很相似;如果大于 10,就说明这是两张不同的图片。
实现关键点
计算灰阶
1 | private static double calculateGrayValue(int pixel) { |
汉明距离
最终指纹其实是 0101 的二进制数字,举例
111000
111111
那么这两个数字的汉明距离,其实就是 ^ 运算后 1 的个数。
1 | private static int hamDist(long finger1, long finger2) { |
源码
https://github.com/gavinliu/SimilarPhoto
参考资料
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 Gavin Liu - 代码人生与科技生活
评论