博客
关于我
数据应用apply练习
阅读量:743 次
发布时间:2019-03-22

本文共 941 字,大约阅读时间需要 3 分钟。

数据应用相对练习

以下是基于Numpy和Pandas的数据操作演练步骤:

1. 创建包含3行5列的DataFrame对象,数值范围在1-8之间

首先,我们在环境中导入必要的库:

import numpy as np  import pandas as pd

接下来,创建一个3行5列的随机整数数据并生成DataFrame:

df1 = pd.DataFrame(np.random.randint(1, 8, (3,5)))

这将生成如下数据表:

0 1 2 3 4
2 1 5 2 5
2 6 4 2 5
2 7 1 5 6

2. 按照列表'a','b','a'进行行分组

根据指定的列表进行分组:

df1_1 = df1.groupby(['a', 'b', 'a'])

执行后,结果将被划分为以下分组:

('a', 0, 1, 2, 3, 4)

('a', 1, 2, 3, 4)
('a', 2, 1, 2, 3, 4)

3. 为每个元素加1

对数据框中的每个元素执行加1操作:

df1_1 = df1_1.apply(lambda x: x + 1)

此次操作后的结果如下:

0 1 2 3 4
3 2 6 3 6
3 7 5 3 7
3 8 2 4 8

4. 将每个元素加上其所在列的和

首先计算 DataFrame 的总和:

sum_columns = df1.sum()   # 列的总和

结果:

0: 61
1:142
2:103
3:94
4:16

然后对每个元素加上对应列的和:

df1_1 = df1_1.apply(lambda x: x + df1.sum())

最终表格为:

0 1 2 3 4
8 (2+62) 15 (2+13) 15 (2+13) 8 (+previous sum) 21 (+previous sum)
8 (2+62) 20 (3+17) 14 (3+11) 8 (+previous sum) 21 (+previous sum)
8 (2+62) 21 (4+17) 11 (4+7 8 (+previous sum) 22 (+previous sum)

请注意,这些数值用于展示操作过程,具体应用时请根据实际数据调整。

转载地址:http://nutwk.baihongyu.com/

你可能感兴趣的文章
Plotly:如何在桑基图中设置节点位置?
查看>>
Plotly:如何处理重叠的颜色条和图例?
查看>>
Plotly:如何手动设置 plotly express 散点图中点的颜色?
查看>>
Plotly:如何结合 make_subplots() 和 ff.create_distplot()?
查看>>
Plotly:如何绘制累积的“步骤“;直方图?
查看>>
Quartz进一步学习与使用
查看>>
Plotly条形图-根据正/负值更改颜色-python
查看>>
PLSQL developer12安装图解
查看>>
PLSQL Developer调试 存储过程和触发器
查看>>
PLSQL window操作
查看>>
plsql 存储过程 测试
查看>>
plsql 安装后database下拉没有东西
查看>>
PLSQL_Oracle PLSQL内置函数大全(概念)
查看>>
PLSQL_案例优化系列_体验逻辑结构如何影响SQL优化(案例3)
查看>>
PLSQL中INDEX BY TABLE的 DELETE操作
查看>>
plsql学习笔记---plsql相关概念,以及基础结构
查看>>
plsql数据库异常---plsql 登录后,提示数据库字符集(AL32UTF8)和客户端字符集(ZHS16GBK)不一致
查看>>
plsql查询乱码问题解决
查看>>
PLSQL的DBMS_GETLINE
查看>>
quartz简单demo,教你最快使用quartz
查看>>