详解 "\\s+"

正则表达式中\s匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]

  • \f -> 匹配一个换页
  • \n -> 匹配一个换行符
  • \r -> 匹配一个回车符
  • \t -> 匹配一个制表符
  • \v -> 匹配一个垂直制表符

而“\s+”则表示匹配任意多个上面的字符。另因为反斜杠在Java里是转义字符,所以在Java里,我们要这么用“\\s+”.

那么问题来了,“\\s+”有啥使用场景呢?

注:

[\s]表示,只要出现空白就匹配
[\S]表示,非空白就匹配

API测试中,替换测试模板中的数据

在API自动化测试中,我们经常要用xml,或者json文件,来保存API payload。 比如下面这个模板:

  
  1. <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
  2. <userInvite>
  3. <toEmail>xxxx@gmail.com </toEmail>
  4. <toUserId>%s </toUserId>
  5. <fromUserId>%s </fromUserId>
  6. <groupId>123 </groupId>
  7. <inviteMetadataId>1 </inviteMetadataId>
  8. <status>created </status>
  9. <clilentId>xxxx </clilentId>
  10. <inviteProperties>
  11. <inviteProperty>
  12. <key>key </key>
  13. <value>value </value>
  14. </inviteProperty>
  15. <inviteProperty>
  16. <key>subject </key>
  17. <value>is inviting you </value>
  18. </inviteProperty>
  19. </inviteProperties>
  20. </userInvite>

而在测试的时候,我们就经常要替换模板中的数据,去测试API的逻辑。比如我要去掉key为subject的inviteProperty, 然后再Call这个API,怎么办呢?
OK,答案很明显,我们只要替换他们就可以了,而这时候\\s+就可以派上用场了。
比如我们可以直接将其替换成空格:

payload.replaceFirst("<inviteProperty>\\s+<key>subject</key>\\s+<value>is inviting you</value>\\s+</inviteProperty>", "");
  

这里的\\s+可以替换掉关键字之间的所有空白字符。

\\s+在经典算法题:单词反转中的使用

有这么一个经典算法题:

  
  1. 输入一串字符,然后按着单词倒叙输出
  2. 比如:
  3. 输入 "the sky is blue",
  4. 输出 "blue is sky the".

这题如果使用String的Split方法就非常方便,我们可以根据空格把字符串分成单词数组,这样就可以倒着输出单词就可以了。

但是如果单纯的使用空格就会有很多缺陷,比如:

s.trim().split(" ");
  

如果输入为这样就会有问题 “a b”,用上面的代码,我们就会分拆出下面的结果:

最后分解出了四个元素!

很明显跟我们的预期不一样,我们希望是只剩两个单词,所以如果使用\\s+,一切就完美多了!

最后给出完整算法解决方案:

  
  1. public static String reverseWords( String s)
  2. {
  3. String[] wordsArray = s. trim(). split( "\\s+");
  4. StringBuilder result = new StringBuilder();
  5. for( int i = wordsArray.length - 1; i >= 0 ; i--)
  6. {
  7. if(i == 0)
  8. {
  9. result.append(wordsArray[i]);
  10. }
  11. else
  12. {
  13. result.append(wordsArray[i] + " ");
  14. }
  15. }
  16. return result.toString();
  17. }