题目的主要信息:

  • 输入的字符串中只有ACGT四种字符
  • 限定长度为nn的子串,求其中CG比例最高的第一个子串
  • 解读: 长度限定的情况下,要找比例越高即找出现次数越多

方法一:暴力解法

具体做法:

我们可以遍历字符串每个位置作为起始,然后遍历以这个字符作为起始的长为nn的子串,分别统计子串中CG的数量,与之前记录的最大值比较,然后更新记录下最大值及最大CG含量子串的起始位置。

最后根据最终的起始位置和长度nn利用substr函数输出,这样由左到右地找出来的就一定是第一个。

#include<iostream>
#include<string>
using namespace std;

int main(){
    string s;
    int n;
    while(cin >> s >> n){
        int len = s.length();
        int resindex = 0, max = 0;
        for(int i = 0; i + n < len; i++){ //遍历字符串每一位,从该位开始
            int count = 0;
            for(int j = 0; j < n; j++){ //从i位起长为n的字符串
                if(s[i + j] == 'G' || s[i + j] == 'C') //统计CG出现次数
                    count++; 
            }
            if(count > max){ //取次数更多的
                resindex = i; //得到序列起始下标
                max = count;
            }
        }
        cout << s.substr(resindex, n) << endl; //根据下标和n输出
    }
    return 0;
}

复杂度分析:

  • 时间复杂度:O(mn)O(mn),其中mm为字符串的长度,nn为限定的子串长度,需要遍历字符串每个位置为起点的子串
  • 空间复杂度:O(1)O(1),无额外空间

方法二:滑动窗口

具体做法:

我们可以用滑动窗口的思想,首先用一个长度为nn的窗口覆盖字符串前nn部分子串,统计这里的CG数量,并暂时作为最大值。然后窗口右移,如果左边出去的是CG那么窗口内的CG数量减少一个,如果右边进来的是CG那么窗口内的CG数量增加一个,每次滑动都统计窗口内的CG数量,与临时最大值比较,记录下最大窗口的起始下标。

窗口右端抵达字符串末尾时结束,根据下标用substr函数输出字符串含CG最高的子串。

alt

#include<iostream>
#include<string>
using namespace std;

int main(){
    string s;
    int n;
    while(cin >> s >> n){
        int len = s.length();
        int resindex = 0, max = 0;
        int count = 0;
        for(int i = 0; i < n; i++) //录入最前面的窗口
            if(s[i] == 'C' || s[i] == 'G')
                count++;
        max = count; //录下第一个窗口的CG数量作为最大
        int left = 1, right = n; //从录入窗口的左右点右移一位开始
        while(right < len){ //直到右窗口结束
            if(s[left - 1] == 'C' || s[left - 1] == 'G') //窗口左边出去的是CG
                count--;
            if(s[right] == 'C' || s[right] == 'G') //窗口右边进来的是CG
                count++;
            if(count > max){ //更新,取最大值
                max = count;
                resindex = left;
            }
            left++;
            right++;
        }
        cout << s.substr(resindex, n) << endl; //根据下标和n输出
    }
    return 0;
}

复杂度分析:

  • 时间复杂度:O(m)O(m),其中mm为字符串的长度,窗口滑动相当于遍历字符串
  • 空间复杂度:O(1)O(1),无额外空间