#CalRedBuildingDreamV1.py
import jieba
txt = open("RedBuildingDream.txt", "r", encoding = "utf-8").read()
words = jieba.lcut(txt)
counts = {
}
for word in words:
if len(word) ==1:
continue
else:
counts[word] = counts.get(word,0) +1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(15):
word, count = items[i]
print("{0:<10}{1:>5}".format(word,count))
结果显示
宝玉 3748
什么 1613
一个 1451
贾母 1228
我们 1220
那里 1174
凤姐 1100
王夫人 1011
你们 1009
如今 999
说道 973
知道 967
老太太 966
起来 949
姑娘 941
说明贾宝玉,贾母和凤姐是《红楼梦》里最多被提到的人。