设为首页收藏本站
天天打卡

 找回密码
 立即注册
搜索
查看: 120|回复: 11

Pandas 处理DataFrame中的inf值实现

[复制链接]

1

主题

55

回帖

128

积分

注册会员

积分
128
发表于 2024-4-19 20:19:14 | 显示全部楼层 |阅读模式
Inf 表示正无穷大或负无穷大,通常是在数学计算中产生的结果。
例如,
  1. import numpy as np

  2. # 创建一个包含 Infinity 的数组
  3. arr = np.array([3.0, 4.0, np.inf, -np.inf])
  4. print(arr)
复制代码
1)通过where方法和isinf方法查找Inf行和列
  1. import pandas as pd
  2. import numpy as np

  3. df = pd.DataFrame(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz'))
  4. print('*'*36)
  5. # 将df的第一列变成Inf
  6. df.u = np.inf
  7. print(df)
  8. print('*'*36)
  9. #输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。
  10. print(np.where(np.isinf(df)))
复制代码
2)数据处理
  1. import pandas as pd
  2. import numpy as np

  3. df = pd.DataFrame(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz'))
  4. print('*'*36)
  5. # 将df的第一列变成NaN
  6. df.u = np.inf
  7. print(df)
  8. print('*'*36)
  9. #输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。
  10. print(np.where(np.isinf(df)))
  11. print('*'*36)
  12. # 使用 replace 替换整个 DataFrame 中的 Inf 值为特定值
  13. print(df.replace(np.inf, 1, inplace=False))
  14. print('*'*36)
  15. #使用np.isinf()
  16. df[np.isinf(df)]=11.0
  17. print(df)
  18. print('*'*36)
  19. # 创建一个包含 Inf 的数组
  20. arr = np.array([3.0, 4.0, np.inf, 6.0])
  21. # 将Inf值为5
  22. arr[np.isinf(arr)]=5
  23. print(arr)
复制代码
3)删除有Inf的行
  1. import pandas as pd
  2. import numpy as np

  3. x=np.arange(0,30).reshape(5,6)
  4. x=np.array(x,dtype=float)
  5. x[2,3]=np.inf
  6. x[0,4]=np.inf
  7. print(x)
  8. print('*'*36)
  9. #删除包含Inf的行
  10. x1=np.delete(x,np.where(np.isinf(x))[0],axis=0)
  11. print(x1)
复制代码
注意:np.inf和np.nan的处理方法基本相同,注意调用处理时方法名。None是Python中用于标识空缺数据,Nan是nunpy和pandas中用于标识空缺数据,None是一个Python特殊的数据类型, 但是NaN却是用一个特殊的float。
在用DataFrame计算变化率时,例如(今天-昨天) / 昨天恰好为(2-0) / 0时,这些结果数据会变为inf。
为了方便后续处理,可以利用numpy,将这些inf值进行替换。
1. 将某1列(series格式)中的 inf 替换为数值。
  1. import numpy as np

  2. df['Col'][np.isinf(df['Col'])] = -1
复制代码
2. 将某1列(series格式)中的 inf 替换为NA值。
  1. import numpy as np

  2. df['Col'][np.isinf(df['Col'])] = np.nan
复制代码
3. 将整个DataFrame中的 inf 替换为数值(空值同理)。#感谢评论区的补充
  1. import numpy as np

  2. df.replace(np.inf, -1) #替换正inf为-1

  3. #替换正负inf为NA,加inplace参数
  4. df.replace([np.inf, -np.inf], np.nan, inplace=True)
复制代码

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

0

主题

55

回帖

111

积分

注册会员

积分
111
发表于 2024-4-24 22:32:48 | 显示全部楼层
非常感谢你的观点,让我受益良多!

1

主题

8

回帖

53

积分

等待验证会员

积分
53

热心会员付费会员

发表于 2024-4-25 18:13:19 | 显示全部楼层
我不太确定,可能需要再确认一下。

0

主题

69

回帖

139

积分

注册会员

积分
139
发表于 2024-4-27 17:07:52 | 显示全部楼层
我完全同意你的观点

0

主题

62

回帖

123

积分

注册会员

积分
123
发表于 2024-6-16 07:09:25 | 显示全部楼层
已测试,非常不错

0

主题

51

回帖

103

积分

注册会员

积分
103
发表于 2024-6-19 12:35:51 | 显示全部楼层
非常感谢你的观点,让我受益良多!
  • 打卡等级:无名新人
  • 打卡总天数:1
  • 打卡月天数:0
  • 打卡总奖励:24
  • 最近打卡:2024-04-19 14:51:58

4

主题

56

回帖

207

积分

中级会员

积分
207
发表于 2024-7-5 00:54:00 | 显示全部楼层
我们一起努力,共同解决问题吧。

0

主题

56

回帖

111

积分

注册会员

积分
111
发表于 2024-7-29 16:46:43 | 显示全部楼层
我不太确定,可能需要再确认一下。

0

主题

52

回帖

103

积分

注册会员

积分
103
发表于 2024-8-12 12:18:44 | 显示全部楼层
我不太确定,可能需要再确认一下。
  • 打卡等级:无名新人
  • 打卡总天数:1
  • 打卡月天数:0
  • 打卡总奖励:14
  • 最近打卡:2024-06-14 18:01:59

3

主题

49

回帖

179

积分

注册会员

积分
179
发表于 2024-8-28 20:08:43 | 显示全部楼层
嘎嘎嘎嘎嘎嘎嘎
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|爱云论坛 - d.taiji888.cn - 技术学习 免费资源分享 ( 蜀ICP备2022010826号 )|天天打卡

GMT+8, 2024-11-24 08:41 , Processed in 0.111667 second(s), 27 queries .

Powered by i云网络 Licensed

© 2023-2028 正版授权

快速回复 返回顶部 返回列表