首页旅游资讯线路攻略景点大全国内游境外游美食特产

如何用python和jieba分词,统计词频?

发布网友发布时间：2022-04-24 02:35

共2个回答

热心网友时间：2022-04-18 04:11

#! python3
# -*- coding: utf-8 -*-
import os, codecs
import jieba
from collections import Counter

def get_words(txt):
    seg_list = jieba.cut(txt)
    c = Counter()
    for x in seg_list:
        if len(x)>1 and x != '\r\n':
            c[x] += 1
    print('常用词频度统计结果')
    for (k,v) in c.most_common(100):
        print('%s%s %s  %d' % ('  '*(5-len(k)), k, '*'*int(v/3), v))

if __name__ == '__main__':
    with codecs.open('19d.txt', 'r', 'utf8') as f:
        txt = f.read()
    get_words(txt)

热心网友时间：2022-04-18 05:29

https://github.com/williezh/

追问？

声明：本网页内容为用户发布，旨在传播知识，不代表本网认同其观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。E-MAIL:11247931@qq.com

全部栏目

如何用python和jieba分词,统计词频?