当前位置: 首页 > news >正文

做网站哪个公司最好企业网站前期建设方案案例

做网站哪个公司最好,企业网站前期建设方案案例,大连甘井子区怎么样,深圳网络营销全网推广大家好,Pandas 2.1于2023年8月30日发布,跟随本文一起看看这个版本引入了哪些新内容,以及它如何帮助用户改进Pandas的工作负载,包含了一系列改进和一组新的弃用功能。 Pandas 2.1在Pandas 2.0中引入的PyArrow集成基础上进行了大量…

大家好,Pandas 2.1于2023年8月30日发布,跟随本文一起看看这个版本引入了哪些新内容,以及它如何帮助用户改进Pandas的工作负载,包含了一系列改进和一组新的弃用功能。

Pandas 2.1在Pandas 2.0中引入的PyArrow集成基础上进行了大量改进。本文主要关注了对新功能的支持,这些新功能有望在Pandas 3.0中成为默认功能,下面将详细介绍最重要的改进。

避免在字符串列中使用NumPy对象类型

pandas中的一个主要问题是低效的字符串表示,Pandas团队花了相当长的时间研究了这个问题。第一个基于PyArrow的字符串dtypepandas 1.3中可用,它有潜力将内存使用量减少约70%并提高性能。

Pandas团队决定引入一个新的配置选项,将所有字符串列存储在PyArrow数组中,不再需要担心转换字符串列,它会自动工作。

可以通过以下方式打开此选项:

pd.options.future.infer_string = True

这个行为将在pandas 3.0中成为默认行为,这意味着字符串列将始终由PyArrow支持,必须安装PyArrow才能使用此选项。

PyArrow与NumPy对象dtype有不同的行为,可能会让人难以详细理解。Pandas实现了用于此选项的字符串dtype,以与NumPy的语义兼容。它的行为与NumPy对象列完全相同。

改进的PyArrow支持

设计者在pandas 2.0中引入了基于PyArrow的DataFrame,其过去几个月的主要目标之一是改进pandas内部的集成。他们的目标是尽可能简化从基于NumPy的DataFrame切换的过程,着重解决了修复性能瓶颈的问题,因为这些问题曾经导致意料之外的减速。

接下来查看一个示例:

import pandas as pd
import numpy as npdf = pd.DataFrame({"foo": np.random.randint(1, 10, (1_000_000, )),"bar": np.random.randint(1, 100, (1_000_000,)),}, dtype="int64[pyarrow]"
)
grouped = df.groupby("foo")

本文的DataFrame有100万行和10个组,现在来比较一下pandas 2.0.3pandas 2.1的性能:

# pandas 2.0.3
10.6 ms ± 72.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)# pandas 2.1.0
1.91 ms ± 3.16 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

这个特定的例子在新版本上快了5倍,merge是另一个常用的函数,现在速度会更快。

写入时复制(Copy-on-Write)

写入时复制(Copy-on-Write)最初在pandas 1.5.0中引入,并预计将成为pandas 3.0的默认行为,写入时复制已经在pandas 2.0.x上提供了良好的体验。Pandas团队主要专注于修复已知的错误并提高其运行速度,建议在生产环境中使用此模式,现在已经可以看到写入时复制可以将实际的工作流程性能提高50%以上。

弃用setitem类操作中的静默类型转换

一直以来,如果将不兼容的值设置到pandas的列中,pandas会默默地更改该列的数据类型。接下来查看一个示例:

ser = pd.Series([1, 2, 3])0    1
1    2
2    3
dtype: int64

本示例有一个包含整数的系列,结果将是整数数据类型。现在将字母"a"设置到第二行中:

ser.iloc[1] = "a"0    1
1    a
2    3
dtype: object

这会将Series的数据类型更改为objectObject是唯一可以容纳整数和字符串的数据类型,这对许多用户来说是一个很大的问题。Object列会占用大量内存,导致计算无法正常进行、性能下降等许多问题。为了解决这些问题,它还在内部还添加了很多特殊处理,在过去,DataFrame中的静默数据类型更改带来了很大的困扰。现在这种行为已被弃用,并将引发FutureWarning

FutureWarning: Setting an item of incompatible dtype is deprecated and will raise in a future 
error of pandas. Value 'a' has dtype incompatible with int64, please explicitly cast to a 
compatible dtype first.ser.iloc[1] = "a"

类似本文示例的操作将在pandas 3.0中引发错误,DataFrame的数据类型在不同操作之间将保持一致。当想要更改数据类型时,则必须明确指定,这会增加一些代码量,但对于后续开发人员来说更容易理解。这个变化会影响所有的数据类型,例如将浮点值设置到整数列中也会引发异常。

升级到新版本

可以使用以下命令安装新的pandas版本:

pip install -U pandas

或者:

mamba install -c conda-forge pandas=2.1

这将在用户的环境中安装新版本。

http://www.yayakq.cn/news/850162/

相关文章:

  • 网站值不值得做seo网站设计做什么
  • 海纳企业网站建设模板汕头市企业网站建设哪家好
  • 花80亿美元建空间站网页版查询系统制作
  • 网站建栏目建那些如何将aaa云主机做网站
  • 徐州网站二次开发seo工具助力集群式网站升级
  • 做网站多少钱西宁君博领先淘宝seo优化推广
  • 南安淘宝网站建设封装系统如何做自己的网站
  • 专做校园购物网站音乐网站开发需要什么语言工具
  • 宠物出售的网站怎么做it建设人才网
  • 驾校官方网站 模板汽车商城网站模板免费下载
  • 三明商城网站开发设计深圳品牌网站设计专家
  • discuz 网站搬家高端电子商务网站建设
  • 减肥养生网站建设服务公司荡神改名
  • 做网站的硬件成本中国建设银行官网站信用卡管理
  • 精品课程网站开发环境网站建设费用 优帮云
  • 企业移动端建设与网站建设拔别人的网站做网站合法吗
  • 友汇网网站建设管理后台设置网站备案邮寄资料
  • 贵州省住房和城乡建设网站wordpress图片主题破解版
  • 河南做网站的公司有哪些手机百度网站证书过期
  • 大学生创新创业网站建设内容衣服搭配网站建设
  • 私人免费网站怎么下载公司网址有哪些
  • 东莞整站优化app大全
  • 北京商业设计网站有哪些建筑设计网站
  • 大连城乡建设网站省好多会员app
  • 去哪个网站做兼职wordpress页面布局
  • 网站建设中 尽情期待Wordpress漫画插件
  • 潍坊网站托管网站搭建的意义
  • windows2008 iis 网站网站推广只能使用在线手段进行。
  • 大规模301让网站快速排名专门网站建设
  • 贵阳网站建设公司哪家好网页制作方案策划