博客
关于我
[整理] python统计词频
阅读量:434 次
发布时间:2019-03-06

本文共 765 字,大约阅读时间需要 2 分钟。

简单的数据词频统计

import stringtext = "http requset highclient springboot requset"data = text.lower().split()words = {}for word in data:    if word not in words:        words[word] = 1    else:        words[word] = words[word] + 1result = sorted(words.items(), reverse=True)print(result)输出[('springboot', 1), ('requset', 2), ('http', 1), ('highclient', 1)]

英文书词频统计(瓦登尔湖)

import stringpath = 'D:/python3/Walden.txt'with open(path,'r',encoding= 'utf-8') as text:    words = [raw_word.strip(string.punctuation).lower() for raw_word in text.read().split()]words_index = set(words)counts_dict = {index:words.count(index) for index in words_index}for word in sorted(counts_dict,key=lambda x: counts_dict[x],reverse=True):    print('{} -- {} times'.format(word,counts_dict[word]))

转载地址:http://phcuz.baihongyu.com/

你可能感兴趣的文章
mysql generic安装_MySQL 5.6 Generic Binary安装与配置_MySQL
查看>>
Mysql group by
查看>>
MySQL I 有福啦,窗口函数大大提高了取数的效率!
查看>>
mysql id自动增长 初始值 Mysql重置auto_increment初始值
查看>>
MySQL in 太多过慢的 3 种解决方案
查看>>
Mysql Innodb 锁机制
查看>>
MySQL InnoDB中意向锁的作用及原理探
查看>>
MySQL InnoDB事务隔离级别与锁机制深入解析
查看>>
Mysql InnoDB存储引擎 —— 数据页
查看>>
Mysql InnoDB存储引擎中的checkpoint技术
查看>>
Mysql InnoDB存储引擎中缓冲池Buffer Pool、Redo Log、Bin Log、Undo Log、Channge Buffer
查看>>
MySQL InnoDB引擎的锁机制详解
查看>>
Mysql INNODB引擎行锁的3种算法 Record Lock Next-Key Lock Grap Lock
查看>>
mysql InnoDB数据存储引擎 的B+树索引原理
查看>>
mysql interval显示条件值_MySQL INTERVAL关键字可以使用哪些不同的单位值?
查看>>
mysql problems
查看>>
MySQL replace函数替换字符串语句的用法(mysql字符串替换)
查看>>
mysql workbench6.3.5_MySQL Workbench
查看>>
MySQL Workbench安装教程以及菜单汉化
查看>>
MySQL Xtrabackup 安装、备份、恢复
查看>>