相似度度量

发布时间:2026/7/1 2:33:55
相似度度量 闵可夫斯基距离由德国数学家赫尔曼·闵可夫斯基提出通过阶数 pp≥1把多种距离度量纳入一个公式Dp(A,B)(∑i1n∣ai−bi∣p)1/pD_p(A,B)\left(\sum_{i1}^{n}\lvert a_i-b_i\rvert^p\right)^{1/p}Dp​(A,B)(i1∑n​∣ai​−bi​∣p)1/pp1 → 曼哈顿距离p2 → 欧氏距离p→∞ → 切比雪夫距离一、曼哈顿距离L1 范数D1(A,B)∑i1n∣ai−bi∣D_1(A,B)\sum_{i1}^{n}\lvert a_i-b_i\rvertD1​(A,B)i1∑n​∣ai​−bi​∣几何意义在横平竖直的城市街区如纽约曼哈顿从一点到另一点只能沿坐标轴方向移动所经过的实际路径长度。在二维平面上从 (1,1) 到 (4,5) 的曼哈顿距离是 |3||4|7。二、欧氏距离L2 范数D2(A,B)∑i1n(ai−bi)2D_2(A,B)\sqrt{\sum_{i1}^{n}(a_i-b_i)^2}D2​(A,B)i1∑n​(ai​−bi​)2​几何意义n 维空间中两点间的直线距离最符合人类直觉的距离概念。在二维平面上即勾股定理。三、切比雪夫距离L∞ 范数D∞(A,B)max⁡i1n∣ai−bi∣D_\infty(A,B)\max_{i1}^{n}\lvert a_i-b_i\rvertD∞​(A,B)i1maxn​∣ai​−bi​∣几何意义取各维度差值中的最大值。在国际象棋中国王可横、纵、斜走一格从一个格子到另一个格子的最少步数即为切比雪夫距离故又称棋盘距离。以二维 (0,0) 到 (3,4) 为例欧氏距离5曼哈顿距离7切比雪夫距离max(3,4)4。余弦相似度cos⁡θA⋅B∥A∥ ∥B∥∑i1naibi∑i1nai2 ∑i1nbi2\cos\theta\frac{A\cdot B}{\lVert A\rVert\,\lVert B\rVert}\frac{\sum_{i1}^{n}a_i b_i}{\sqrt{\sum_{i1}^{n}a_i^2}\,\sqrt{\sum_{i1}^{n}b_i^2}}cosθ∥A∥∥B∥A⋅B​∑i1n​ai2​​∑i1n​bi2​​∑i1n​ai​bi​​几何意义衡量两个向量夹角的余弦值只关注方向一致性忽略向量模长。来源于点积定义A⋅B∥A∥∥B∥cos⁡θA\cdot B\lVert A\rVert\lVert B\rVert\cos\thetaA⋅B∥A∥∥B∥cosθ。夹角 0° → cos1方向完全相同夹角 90° → cos0完全不相关夹角 180° → cos-1方向完全相反。