分享好友 最新资讯首页 最新资讯分类 切换频道
Python实现词云图两例
2024-11-17 21:33

以下两个实战使用python3.7实现,编译软件为Jupyter Notebook,相关的数据可以自行搜索并免费下载。资源链接

Python实现词云图两例

评论爬取

App Store 已经给出一个软件评论接口

 

我们再统计一下标题和内容中出现最多的一些关键词。可以用pandas里面的方法

 

结果Python实现词云图两例

词云分析

 

结果Python实现词云图两例

1.前期准备

  主要用途是将文本数据中出现频率较高关键词以可视化的形式展现出来,使人一眼就可以领略文本数据的主要表达意思。词云图中,词的大小代表了其词频,越大的字代表其出现频率更高。

  那生成一张词云图的主要步骤有哪些?过程中又需要用到哪些Python库呢

  1.首先需要一份待分析的文本数据,由于文本数据都是一段一段的,所以第一步要将这些句子或者段落划分成词,这个过程称之为分词,需要用到Python中的分词库jieba。

  2.分词之后,就需要根据分词结果生成词云,这个过程需要用到wordcloud库

  3.最后需要将生成的词云展现出来,用到大家比较熟悉的matplotlib

  理清了词云图绘制的主要脉络之后,下面就用代码操作起来。

2.牛刀小试

明天就过年了,所以我也特地去找了几首新年歌,将它们的歌词汇总起来作为本次展示用的文本数据,大家可以看看新年歌中哪些词的出现频率比较高。我们先绘制一个比较简单的词云图

 

结果Python实现词云图两例 一张简单的词云图就成功生成啦,但看起来好像并没有特别好看,怎么生成带特定形状的词云呢

3.登堂入室

想生成带特定形状的词云,首先得准备一张该形状的图片,且除了目标形状外,其他地方都是空白的。准备好后就上代码。

 

结果Python实现词云图两例

代码部分和普通的图基本一致,区别在于要导入相应形状的图片,并在wordcloud设置了mask参数。

最新文章
简历Bot
简历Bot是一种利用人工智能技术帮助用户制作和优化简历的工具。它通过分析用户的个人信息、工作经验、技能等,结合岗位要求,自
经常看到哪里潜水又淹死人的新闻,好恐怖,为什么要玩这个?
Matrix 首页推荐Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix
崩坏·星穹铁道,体力恢复机制详解
1、明确资讯类型确定可靠的信息来源,主要包括《崩坏·星穹铁道》的官方游戏论坛、社交媒体平台(如微博、微信公众号)、游戏攻
引流获客推广公众号有哪些_开通公众号引流获客
郑在反诈|做任务即可获佣金?小心圈套!购物促销返利等都是骗子惯用的引流手段,请广大市民擦亮双眼,莫进刷单返利的圈套!近日,
市场热评,揭秘SEO排名软件,盘点最受欢迎的几款工具
深度评测,盘点市场上最受欢迎的SEO排名软件,为您揭示哪家表现卓越,助您优化网站排名,提升在线影响力。随着互联网的快速发展
欧洲大陆影院如何发挥创意来吸引观众?
普遍共识是,新冠肺炎疫情给欧洲电影放映商带来了近年来面临的最大挑战。观众重返影院的速度缓慢。票价上涨可能会在短期内增加收
安装Docker WEBGUI管理工具Portainer
您是否一直在寻找开源的Docker UI管理工具?在这里,我将向您介绍Portainer,它是一个用于Docker容器,
金舟windows优化大师电脑版5.11.881
金舟Windows优化大师电脑版是一款轻量而强大的系统优化工具,软件提供了多种实用的优化功能,包括清理系统垃圾、加速开机速度、
百度珠宝报白流程步骤有哪些方法大全,竟然在这里
在数字化时代,如何快速有效地进行珠宝行业的推广,成为众多珠宝商家关注的重点。尤其是在抖音平台,各种营销手段层出不穷,而百