题目的主要信息:

  • 编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。
  • 编辑操作有:将一个字符替换成另一个字符,插入一个字符,删除一个字符。

要求:给定任意两个字符串,写出一个算法计算它们的编辑距离。

方法一:动态规划

用动态规划,dp[i][j] 表示str1的前i个字符和str2的前y个字符的距离。首先初始化动态数组,dp[0][j]表示将一个空串转换成b的j个字符需要操作数,我们知道应该是j个插入操作;dp[i][0]表示将a的前i个字符转换为空串的操作数,我们知道应该是i个删除操作。

接着用两层for循环遍历两个字符串str1、str2。比较每一个字符str1[i-1]和str2[j-1],

  • 若两个字符相等,即str1[i-1] == str2[j-1],则在这一个位置的编辑距离和上一个字符相同,因此对应的数组dp[i][j]=dp[i-1][j-1];
  • 若两个字符不相等,可删除str1[i-1]这个字符,则dp[i][j] = 1 + dp[i-1][j];删除str2[j-1]这个字符,则dp[i][j] = 1 + dp[i][j-1];修改str1[i-1]使它与str2[i-1]相等,则dp[i][j] = 1 + dp[i-1][j-1]。 alt 具体做法:
#include<iostream>
#include<string>
#include<vector>
#include<algorithm>

using namespace std;

int main() {
    string str1, str2;
    while (cin >> str1 >> str2) {
        vector<vector<int>> dp(str1.size() + 1, vector<int>(str2.size() + 1, 0));
        for (int i = 1; i <= str2.size(); i++) dp[0][i] = i;//str1从0个字符变成str2的i个字符需要i个插入操作
        for (int i = 1; i <= str1.size(); i++) dp[i][0] = i;//str1从i个字符变成str2的0个字符也需要i个删除操作
        for(int i=1;i<=str1.size();i++){
            for (int j = 1; j <= str2.size(); j++) {
                int op1 = dp[i-1][j] + 1;//删除字符str1[i-1]
                int op2 = dp[i][j-1] + 1;//删除字符str2[j-1]
                int op3 = dp[i-1][j-1];//替换操作
                if(str1[i-1] != str2[j-1]){
                    op3++;
                }
                dp[i][j] = min(min(op1, op2), op3);//替换操作和删除操作取最小
            }
        }
        cout << dp[str1.size()][str2.size()] << endl;
    }
}

复杂度分析:

  • 时间复杂度:O(n2)O(n^2),两层for循环。
  • 空间复杂度:O(n2)O(n^2),dp的大小为n2n^2

方法二:滚动数组+动态规划

由方法一的表格可以发现,dp[i][j]只和dp[i-1][j],dp[i][j-1],dp[i-1][j-1]三个量有关,即二维数组中,当前元素的左边,上边,左上角三个元素。因此我们可以压缩数组的大小,用一维数组,表示原来二维数组中的一行,然后我们反复滚动数组,覆盖里面的值。dp[i][j-1]就是当前左边的元素,dp[i][j]是没覆盖前的值,用一个变量l记录对角元素dp[i-1][j-1]。

具体做法:

#include<iostream>
#include<string>
#include<vector>
#include<algorithm>

using namespace std;

int main() {
    string str1, str2;
    while (cin >> str1 >> str2) {
        vector<int> dp(str2.size() + 1, 0);
        for(int i = 0; i <= str2.size(); i++)//初始化第一行
            dp[i] = i;
        for(int i = 1; i <= str1.size(); i++){
            dp[0] = i;//初始化dp[0],i->0需要i个删除操作
            int l = dp[0] - 1;
            for (int j = 1; j <= str2.size(); j++) {
                int curr = dp[j];//保留当前的值,作为dp[j+1]的左上角值
                dp[j] = min(min(dp[j] + 1, dp[j-1] + 1), ((str1[i-1] == str2[j-1])?0:1) + l);
                l = curr;//更新左上角值
            }
        }
        cout << dp[str2.size()]<< endl;
    }
}

复杂度分析:

  • 时间复杂度:O(n2)O(n^2),需要两层for循环。
  • 空间复杂度:O(n)O(n),只需要一维数组。