题目的主要信息:
- 编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。
- 编辑操作有:将一个字符替换成另一个字符,插入一个字符,删除一个字符。
要求:给定任意两个字符串,写出一个算法计算它们的编辑距离。
方法一:动态规划
用动态规划,dp[i][j] 表示str1的前i个字符和str2的前y个字符的距离。首先初始化动态数组,dp[0][j]表示将一个空串转换成b的j个字符需要操作数,我们知道应该是j个插入操作;dp[i][0]表示将a的前i个字符转换为空串的操作数,我们知道应该是i个删除操作。
接着用两层for循环遍历两个字符串str1、str2。比较每一个字符str1[i-1]和str2[j-1],
- 若两个字符相等,即str1[i-1] == str2[j-1],则在这一个位置的编辑距离和上一个字符相同,因此对应的数组dp[i][j]=dp[i-1][j-1];
- 若两个字符不相等,可删除str1[i-1]这个字符,则dp[i][j] = 1 + dp[i-1][j];删除str2[j-1]这个字符,则dp[i][j] = 1 + dp[i][j-1];修改str1[i-1]使它与str2[i-1]相等,则dp[i][j] = 1 + dp[i-1][j-1]。 具体做法:
#include<iostream>
#include<string>
#include<vector>
#include<algorithm>
using namespace std;
int main() {
string str1, str2;
while (cin >> str1 >> str2) {
vector<vector<int>> dp(str1.size() + 1, vector<int>(str2.size() + 1, 0));
for (int i = 1; i <= str2.size(); i++) dp[0][i] = i;//str1从0个字符变成str2的i个字符需要i个插入操作
for (int i = 1; i <= str1.size(); i++) dp[i][0] = i;//str1从i个字符变成str2的0个字符也需要i个删除操作
for(int i=1;i<=str1.size();i++){
for (int j = 1; j <= str2.size(); j++) {
int op1 = dp[i-1][j] + 1;//删除字符str1[i-1]
int op2 = dp[i][j-1] + 1;//删除字符str2[j-1]
int op3 = dp[i-1][j-1];//替换操作
if(str1[i-1] != str2[j-1]){
op3++;
}
dp[i][j] = min(min(op1, op2), op3);//替换操作和删除操作取最小
}
}
cout << dp[str1.size()][str2.size()] << endl;
}
}
复杂度分析:
- 时间复杂度:,两层for循环。
- 空间复杂度:,dp的大小为。
方法二:滚动数组+动态规划
由方法一的表格可以发现,dp[i][j]只和dp[i-1][j],dp[i][j-1],dp[i-1][j-1]三个量有关,即二维数组中,当前元素的左边,上边,左上角三个元素。因此我们可以压缩数组的大小,用一维数组,表示原来二维数组中的一行,然后我们反复滚动数组,覆盖里面的值。dp[i][j-1]就是当前左边的元素,dp[i][j]是没覆盖前的值,用一个变量l记录对角元素dp[i-1][j-1]。
具体做法:
#include<iostream>
#include<string>
#include<vector>
#include<algorithm>
using namespace std;
int main() {
string str1, str2;
while (cin >> str1 >> str2) {
vector<int> dp(str2.size() + 1, 0);
for(int i = 0; i <= str2.size(); i++)//初始化第一行
dp[i] = i;
for(int i = 1; i <= str1.size(); i++){
dp[0] = i;//初始化dp[0],i->0需要i个删除操作
int l = dp[0] - 1;
for (int j = 1; j <= str2.size(); j++) {
int curr = dp[j];//保留当前的值,作为dp[j+1]的左上角值
dp[j] = min(min(dp[j] + 1, dp[j-1] + 1), ((str1[i-1] == str2[j-1])?0:1) + l);
l = curr;//更新左上角值
}
}
cout << dp[str2.size()]<< endl;
}
}
复杂度分析:
- 时间复杂度:,需要两层for循环。
- 空间复杂度:,只需要一维数组。