博客
关于我
数据应用apply练习
阅读量:743 次
发布时间:2019-03-22

本文共 941 字,大约阅读时间需要 3 分钟。

数据应用相对练习

以下是基于Numpy和Pandas的数据操作演练步骤:

1. 创建包含3行5列的DataFrame对象,数值范围在1-8之间

首先,我们在环境中导入必要的库:

import numpy as np  import pandas as pd

接下来,创建一个3行5列的随机整数数据并生成DataFrame:

df1 = pd.DataFrame(np.random.randint(1, 8, (3,5)))

这将生成如下数据表:

0 1 2 3 4
2 1 5 2 5
2 6 4 2 5
2 7 1 5 6

2. 按照列表'a','b','a'进行行分组

根据指定的列表进行分组:

df1_1 = df1.groupby(['a', 'b', 'a'])

执行后,结果将被划分为以下分组:

('a', 0, 1, 2, 3, 4)

('a', 1, 2, 3, 4)
('a', 2, 1, 2, 3, 4)

3. 为每个元素加1

对数据框中的每个元素执行加1操作:

df1_1 = df1_1.apply(lambda x: x + 1)

此次操作后的结果如下:

0 1 2 3 4
3 2 6 3 6
3 7 5 3 7
3 8 2 4 8

4. 将每个元素加上其所在列的和

首先计算 DataFrame 的总和:

sum_columns = df1.sum()   # 列的总和

结果:

0: 61
1:142
2:103
3:94
4:16

然后对每个元素加上对应列的和:

df1_1 = df1_1.apply(lambda x: x + df1.sum())

最终表格为:

0 1 2 3 4
8 (2+62) 15 (2+13) 15 (2+13) 8 (+previous sum) 21 (+previous sum)
8 (2+62) 20 (3+17) 14 (3+11) 8 (+previous sum) 21 (+previous sum)
8 (2+62) 21 (4+17) 11 (4+7 8 (+previous sum) 22 (+previous sum)

请注意,这些数值用于展示操作过程,具体应用时请根据实际数据调整。

转载地址:http://nutwk.baihongyu.com/

你可能感兴趣的文章
Nginx:NginxConfig可视化配置工具安装
查看>>
ngModelController
查看>>
ngrok | 内网穿透,支持 HTTPS、国内访问、静态域名
查看>>
ngrok内网穿透可以实现资源共享吗?快解析更加简洁
查看>>
NHibernate学习[1]
查看>>
NHibernate异常:No persister for的解决办法
查看>>
NIFI1.21.0_java.net.SocketException:_Too many open files 打开的文件太多_实际操作---大数据之Nifi工作笔记0051
查看>>
NIFI1.21.0_Mysql到Mysql增量CDC同步中_日期类型_以及null数据同步处理补充---大数据之Nifi工作笔记0057
查看>>
NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_更新时如果目标表中不存在记录就改为插入数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0059
查看>>
NIFI1.21.0_NIFI和hadoop蹦了_200G集群磁盘又满了_Jps看不到进程了_Unable to write in /tmp. Aborting----大数据之Nifi工作笔记0052
查看>>
NIFI1.21.0_Postgresql和Mysql同时指定库_指定多表_全量同步到Mysql数据库以及Hbase数据库中---大数据之Nifi工作笔记0060
查看>>
NIFI1.21.0最新版本安装_连接phoenix_单机版_Https登录_什么都没改换了最新版本的NIFI可以连接了_气人_实现插入数据到Hbase_实际操作---大数据之Nifi工作笔记0050
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增加修改实时同步_使用JsonPath及自定义Python脚本_03---大数据之Nifi工作笔记0055
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_插入修改删除增量数据实时同步_通过分页解决变更记录过大问题_01----大数据之Nifi工作笔记0053
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表或全表增量同步_实现指定整库同步_或指定数据表同步配置_04---大数据之Nifi工作笔记0056
查看>>
NIFI1.23.2_最新版_性能优化通用_技巧积累_使用NIFI表达式过滤表_随时更新---大数据之Nifi工作笔记0063
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现数据实时delete同步_实际操作04---大数据之Nifi工作笔记0043
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
查看>>