判断子序列

给定字符串 s 和 t ,判断 s 是否为 t 的子序列。

你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。

字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。

示例 1:

s = "abc", t = "ahbgdc"

返回 true.

示例 2:

s = "axc", t = "ahbgdc"

返回 false.

后续挑战 :

如果有大量输入的 S,称作S1, S2, ... , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?

public boolean isSubsequence(String s, String t) {
        int m = s.length();
        int n = t.length();
        if(m==0){
            return true;
        }
        int i =0;
        for(int j =0;j<n;j++){
            if(i<m){
                if(s.charAt(i) ==t.charAt(j)){
                    i++;
                }
                if(i ==m){
                    return true;
                }
            }
        }
        return false;
    }

 

public static boolean isSubsequence(String s, String t) {
    if(s.length() == 0){
        return true;
    }
    // if(s.length() == 0 && t.length() == 0){
    //     return true;
    // }
    // if(s.length() == 0 && t.length() != 0){
    //     return true;
    // }
    int m = 0;
    for (int i = 0; i <t.length()-1 ; i++) {
        if (t.charAt(i) == s.charAt(m)) {
            ++m;
            if (m == s.length()-1) {
                return true;
            }
            continue;
        }
    }
    return false;

}
public static boolean isSubsequence(String s, String t) {
    if (s == null || t == null) {
        return false;
    }
    int i = 0, j = 0;
    int count = 0;
    while (i < s.length() && j < t.length()) {
        if (s.charAt(i) == t.charAt(j)) {
            i++;
            j++;
            count++;
        } else {
            j++;
        }
    }
    if (count == s.length()) {
        return true;
    } else {
        return false;
    }

}

动态规划

状态:dp[i][j]为s的从头开始到i的子字符串是否为t从头开始到j的子字符串的子序列

状态转移公式:

1 当char[i]==char[j]时,则字符i一定是j的子序列,如果0~i-1子字符串是0~j-1子字符串的子序列,则dp[i][j]=true,所以dp[i][j] = dp[i-1][j-1];
2 当char[i]!=char[i]时,即判断当前0~i子字符串是否是0~j-1的子字符串的子序列,即dp[i][j] = dp[i][j - 1]。如ab,eabc,虽然s的最后一个字符和t中最后一个字符不相等,但是因为ab是eab的子序列,所以ab也是eabc的子序列。

初始化:空字符串一定是t的子字符串的子序列,所以dp[0][j]=true

结果:返回dp[sLen][tLen]

class Solution {
    public boolean isSubsequence(String s, String t) {
        int sLen = s.length(), tLen = t.length();
        if (sLen > tLen) return false;
        if (sLen == 0) return true;
        boolean[][] dp = new boolean[sLen + 1][tLen + 1];
        //初始化
        for (int j = 0; j < tLen; j++) {
            dp[0][j] = true;
        }
        //dp
        for (int i = 1; i <= sLen; i++) {
            for (int j = 1; j <= tLen; j++) {
                if (s.charAt(i - 1) == t.charAt(j - 1)) {
                    dp[i][j] = dp[i - 1][j - 1];
                } else {
                    dp[i][j] = dp[i][j - 1];
                }
            }
        }
        return dp[sLen][tLen];
    }
}

 

后续挑战 :

如果有大量输入的 S,称作S1, S2, ... , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?

 

dp[0]代表了存储了a出现在t的所有的位置,逐个字符判断s的字符顺序是否在t内,直接返回结果。
时间复杂度O(t.size()+2000):分别为创建数组需要O(t.size()),
索引是递增的使用二分查找s的单个字符20次之内就可找到需要O(100*20)。
适用大量的输入判断子序列。

 

public static void main(String[] args) {
        System.out.println(isSubsequence("abc","ahbgdc"));
    }
    public static boolean isSubsequence(String s,String t) {
        Map<Integer,List<Integer>> map =new HashMap<>();
        for(int i=0;i<26;++i){
            map.put(i, new ArrayList<>());
        }
        int tag = -1;
        for(int i=0;i<t.length();i++) {
            int k = t.charAt(i)-'a';
            map.get(k).add(i);
        }
        for(int i=0;i<s.length();i++){
            int now=s.charAt(i)-'a';
            int left=0,right=map.get(now).size()-1;
            while(left<right){
                int mid=(left+right)/2;
                if(map.get(now).get(mid)>tag){
                    right=mid;
                }else{
                    left=mid+1;
                }
            }
            if(right<left || map.get(now).get(left)<tag){
                return false;
            }
            tag=map.get(now).get(left);
        }
        return true;
    }