正则表达式学习记录(1)

有一次在面试的过程中,被问到了正则表达式,这一下触碰到了我的知识盲区了,虽然我目前还没怎么用到过正则,不过还是先学习一番吧。

package day1105;

import java.io.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexExp1 {
    /**
     * 匹配QQ号
     * 长度为5~10位,纯数字,第一位不能为0
     */
    public static boolean isQQ(String qq) {
        //[1-9] 第一位是1~9的数字
        //[0-9]{4,9} 第二位是0~9的数字,还需要4到9位,加上第1位,满足5~10位的要求
        String regex = "[1-9][0-9]{4,9}";
        return qq.matches(regex);
    }

    /**
     * 匹配手机号
     * 长度为11位,第一位只能是1,第二位可以是3,7,8,纯数字
     */
    public static boolean isPhone(String phone) {
        //1 第一位只能是1,由于只有一个数字,就不用写[]了
        //378   第二位只能是3或7或8
        //[0-9]{9} 第三位是0~9的数字,这样的数字需要9个,加上前面的2个,满足一共1位的要求
        String regex = "1[378][0-9]{9}";
        String regex2 = "1[378]\\d{9}";
        return phone.matches(regex2);
    }

    /**
     * 使用.来切割字符串
     */
    public static String[] removeDot(String str) {
        //注意转义,而非直接使用.,否则.会匹配任何字符
        String regex = "\\.";
        return str.split(regex);
    }

    /**
     * 去掉 你你你好好啊啊啊啊 中的叠词,形成 你好啊
     */
    public static String solveRepeat(String str) {
        //  ()来表示组
        //  (.)来表示任意字符,而\\1是对组(.)中的字符进行复用,合起来就是:两个相同的字符
        //  而叠词不止是两个字的叠词,也有三个字、四个字,因此用(.)\\1+表示叠词
        //  使用$1来复用组中第1组的值(即叠词的字符),将叠词替换成叠词中第一个字符
        String regex = "(.)\\1+";
        return str.replaceAll(regex, "$1");

    }

    /**
     * 获取一个文件内所有的邮箱号
     */
    public static void getEmail() {
        BufferedReader br = null;
        try {
            br = new BufferedReader(new FileReader(new File("g:\\test.html")));
            String regex = "[1-9]{5,10}@qq.com";
            Pattern p = Pattern.compile(regex);
            String line = "";
            while ((line = br.readLine()) != null) {
                Matcher m = p.matcher(line);
                while (m.find()) {
                    System.out.println(m.group());
                }
            }
            br.close();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }

    public static void main(String[] args) {
        System.out.println(isQQ("767638734"));
        System.out.println(isPhone("18806210604"));
        String temp = "qw.we.rt.ty.yu";
        String[] strArr = removeDot(temp);
        for (String s : strArr) {
            System.out.println(s);
        }
        System.out.println(solveRepeat("你你你好好啊啊啊啊"));
        getEmail();

    }
}