当前位置: 首页 > news >正文

做法城乡建设部网站wordpress获取域名

做法城乡建设部网站,wordpress获取域名,企业网站 生成html,wordpress 新浪微博关注实验目的: 学会使用Pandas操作数据集,并进行可视化。 数据集描述: 该数据集是CNKI中与“中药毒理反应”相关的文献信息,包含文章题目、作者、来源(出版社)、摘要、发表时间等信息。 实验要求&#xff1…

实验目的:

学会使用Pandas操作数据集,并进行可视化。

数据集描述:

该数据集是CNKI中与“中药毒理反应”相关的文献信息,包含文章题目、作者、来源(出版社)、摘要、发表时间等信息。

实验要求:

  1. 使用Pandas读取数据集。
  2. 统计每年的发文数量,并绘制折线图。
  3. 统计出版社的发文量信息,列出发文前10位的出版社。
  4. 使用jieba分词,对摘要进行分词统计,制作词频前30位的词云图。(需安装jieba分词和词云工具包)。

实验过程:

为了完成这个实验,你需要在你的Python环境中安装Pandas, jieba, matplotlib, 和 wordcloud这几个库。如果你还没有安装,可以通过以下命令进行安装:

pip install pandas jieba matplotlib wordcloud

导入库,导入文件(文件名称为 ansi.csv),打印几行看看导入情况

import pandas as pd
df = pd.read_csv('./ansi.csv')
df.head()

通过输出查看文件的表头是什么

print(df.columns)

统计每年的发文数量,并绘制折线图

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
df['年'] = pd.to_datetime(df['5'], format='%Y-%m-%d %H:%M', errors='coerce').dt.year
year = df['年'].value_counts().sort_index()
plt.figure(figsize=(10, 6))
plt.plot(year.index, year.values, marker='o')
plt.title('每年中药毒理反应文献发表数量')
plt.xlabel('年份')
plt.ylabel('发表数量')
plt.grid(True)
plt.show()

统计出版社的发文量信息,列出发文前10位的出版社

publisher = df['2'].value_counts()
top = publisher.head(10)
print("发文前10位的出版社:")
print(top)

使用jieba分词,对摘要进行分词统计,制作词频前30位的词云图

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as pltdef tokenize_abstracts(abstracts):all_words = []for abstract in abstracts:words = jieba.cut(abstract, cut_all=False)all_words.extend(words)return all_wordsabstracts = df['4'].dropna().tolist()# 分词
all_words = tokenize_abstracts(abstracts)# 计算词频
word_freq = {word: all_words.count(word) for word in set(all_words)}# 制作词云
wordcloud = WordCloud(font_path='simhei.ttf',width=800, height=600, background_color='white', max_words=30).generate_from_frequencies(word_freq)# 显示词云图
plt.figure(figsize=(10, 8))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()

http://www.yayakq.cn/news/980051/

相关文章:

  • 网站设计制作合同wordpress添加自定义字段面板
  • 网站开发专业就业前景分析建设三合一网站
  • 杭州专业网站制作网站改版升级总结
  • 本地企业网站建设服务凡客集团
  • 沈阳市城市建设学院官方网站wordpress自定义分类无法显示
  • 鹿泉外贸网站建设vps 256 wordpress
  • 大连优化网站课程中国电子商务官网首页
  • 现在新闻做的最好的网站手机网站meta
  • 网站建设模板推广百度金融
  • 为什么检测行业不能用网站做成都公司核名的网站
  • 外贸网站好做吗学校做网站需要什么
  • 自我建设外贸网站东莞昨天发生的重大新闻
  • 东莞企业网站建设推广网站美工怎么做
  • 公司网页网站建设ppt模板开发网站用那个平台
  • 英文网站群建设视频网站备案怎么做
  • 建网站传播文化的好处叫什么公子的网站做ppt的
  • 免费做app网站有哪些网站域名 设置
  • 个人备案网站可以做电商吗wordpress自动更新
  • 以3d全景做的网站wordpress电影源码
  • 定西兰州网站建设招聘外包
  • 如何在海外推广网站外贸网站seo优化
  • 怎么做微信点击网站打赏看片开发公司网站公司
  • 营销型企业网站系统常见的网店平台有哪些
  • 网站建设基本步骤国内免费接码
  • 外贸网站建设公司排名国内类似wordpress
  • 网站前台模板免费下载开封做网站公司汉狮
  • 揭阳专业网站设计公司徐州市政建设集团有限责任公司
  • 有网站有安全狗进不去了网站建设需要使用哪些设备
  • 一般网站字体大小哈尔滨 做网站
  • 加强普法网站建设的通知建设外围彩票网站