PAF
PAF(Pairwise mApping Format)是一种用于存储序列比对结果的文件格式,文本文件,每一行代表一条记录。一行必需12个字段,由\t分割,分别为:

Query sequence name;
Query sequence length;
Query Start,匹配上query的起始位置;
Query End,匹配上query的结束位置;
正负链,"+" or “-”;
Target sequence name,参考序列的名称;
Target sequence length,参考序列长度;
Target Start,匹配上参考序列的起始位置;
Target End,匹配上参考序列的结束位置;
Number of residue matches,真正比对上的碱基数量;
Alignment block length,碱基总数,包括match, mismatch, insertion和deletion;
Mapping quality,序列质量,0-255,越大表示越好,但255表示没有匹配上;
若没有比对上,往往也有记录,只是第3-11个字段的匹配信息均为*。这12个字段之后有可能还有类似SAM的自定义tag字段,如ch:i:12。具体如:3fbcc430-7501-4f61-84d5-d2242801f6c7 95 39 95 + Escherichia-coli-MG1655.fasta 4641652 234646 234707 40 62 255 ch:i:12。

参考资料:

https://github.com/lh3/miniasm/blob/master/PAF.md