描述

题目描述

给定两个字符串str1和str2,输出两个字符串的最长公共子序列。如果最长公共子序列为空,则返回"-1"。目前给出的数据,仅仅会存在一个最长的公共子序列

要求:空间复杂度 O(n^2) ,时间复杂度 O(n^2)

示例

输入:
"1A2C3D4B56","B1D23A456A"
返回值:
"123456"

知识点:动态规划、数组

难度:⭐⭐⭐⭐


题解

图解

image-20211016133726853

方法一:动态规划

算法流程:

  • 首先对于动态规划,需要明确状态: 当前处理到的 s1 和 s2 分别的第 i 和第 j 个字符
  • 定义状态数组:dp[i][j]表示从左到右,当处理到s1的第i个元素和s2的第j个元素时的公共子序列
  • 状态初始化,即当i==0或j==0的情况,dp[i][j]为"",因为空字符串没有公共子序列
  • 状态转移
    • 当前字符相等,则添加结果,i 和 j 指针右移,状态转移方程为:dp[i][j] = dp[i-1][j-1] + s1.charAt(i-1);
    • 当前字符不相等,则还需要分两种情况,取长度较长的情况,状态转移方程为: dp[i][j] = dp[i-1][j].length() > dp[i][j-1].length() ? dp[i-1][j] : dp[i][j-1]

Java 版本代码如下:

import java.util.*;

public class Solution {
    /**
     * longest common subsequence
     * @param s1 string字符串 the string
     * @param s2 string字符串 the string
     * @return string字符串
     */
    public String LCS (String s1, String s2) {
        int len1 = s1.length(), len2 = s2.length();
        // 明确状态: 当前需要处理的s1和s2分别前i和前j个元素
        // dp[i][j]表示从左到右,当处理到s1的第i个元素和s2的第j个元素时的公共子序列
        String[][] dp = new String[len1 + 1][len2 + 1];
        // base case:当i==0或j==0的情况,dp[i][j]为"",因为空字符串没有公共子序列
        for(int i = 0; i <= len1; i++) {
            // j == 0
            dp[i][0] = "";
        }
        for(int j = 0; j <= len2; j++) {
            // i == 0
            dp[0][j] = "";
        }
        // 状态转移
        for(int i = 1; i <= len1; i++) {
            for(int j = 1; j <= len2; j++) {
                // 当前字符相等,则添加结果
                if(s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    dp[i][j] = dp[i-1][j-1] + s1.charAt(i-1);
                } else {
                    // 当前字符不相等,则还需要分两种情况,取长度较长的情况
                    dp[i][j] = dp[i-1][j].length() > dp[i][j-1].length() ? dp[i-1][j] : dp[i][j-1];
                }
            }
        }
        return dp[len1][len2] == "" ? "-1" : dp[len1][len2];
    }
}

复杂度分析

时间复杂度 O(NM)O(NM):需要遍历两个子序列,N和M分别为两个序列的长度

空间复杂度 O(NM)O(NM):维护了一个二维数组

方法二:动态规划(分步+双指针)

算法流程:

  • 动态规划求出最长公共子序列长度:
    • 定义状态数组: dp[i][j]表示从左到右,当处理到s1的第i个元素和s2的第j个元素时的公共子序列长度
    • 默认初始化为0,因此base case的 i == 0 和 j == 0 的情况不需要手动初始化
    • 状态转移时有两种情况,字符相等,则通过前一个状态+1获得当前状态
    • 字符不相等,则通过两个前面的情况的最大值获得当前最大公共子序列长度
  • 双指针,获取结果
    • 通过双指针,从右往左遍历s1和s2字符串
    • 相等则添加结果,两个指针左移
    • 不相等,则根据dp保存的状态,选择s1或s2对应的指针进行指针左移

Java 版本代码如下:

import java.util.*;

public class Solution {
    /**
     * longest common subsequence
     * @param s1 string字符串 the string
     * @param s2 string字符串 the string
     * @return string字符串
     */
    public static String LCS(String s1, String s2) {
        int row = s1.length();
        int column = s2.length();
        // `dp[i][j]`表示从左到右,当处理到s1的第i个元素和s2的第j个元素时的公共子序列长度
        // 默认初始化为0,因此base case的 i == 0 和 j == 0 的情况不需要手动初始化
        int[][] dp = new int[row + 1][column + 1];
        // 状态转移
        for (int i = 1; i < row + 1; i++) {
            for (int j = 1; j < column + 1; j++) {
            	// 字符相等,则通过前一个状态+1获得当前状态
                if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                } else {
                	// 字符不相等,则通过两个前面的情况的最大值获得当前最大公共子序列长度
                    dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
                }
            }
        }
        //目前dp记录了s1和s2的最长子序列的长度
        if(dp[row][column]==0) return "-1";
        // lcs用来储存结果数组
        char[] lcs = new char[dp[row][column]];
        // 因为要对dp倒着查看,所以lcs也倒着插入,cur表示当前插入的位置
        int cur = lcs.length - 1;
        // 通过双指针,遍历s1和s2字符串
        while (true) {
        	// 相等则添加结果,两个指针左移
            if (s1.charAt(row - 1) == s2.charAt(column - 1)) {
                //记录字符
                lcs[cur--] = s1.charAt(row - 1);
                if (cur < 0) return new String(lcs);
                row--;
                column--;
            } else {
            	// 不相等,则根据dp保存的状态,进行指针移动
                if (dp[row - 1][column] > dp[row][column - 1]) {
                    // 忽略掉s1[row-1]
                    row--;
                } else {
                    // 忽略掉s2[column-1]
                    column--;
                }
            }
        }
    }
}

复杂度分析

时间复杂度O(NM)O(NM),需要遍历两个子序列,N和M分别为两个序列的长度

空间复杂度O(NM)O(NM),维护了一个二维数组