数据应用apply练习-白红宇

数据应用apply练习

阅读量：743 次

发布时间：2019-03-22

本文共 941 字，大约阅读时间需要 3 分钟。

数据应用相对练习

以下是基于Numpy和Pandas的数据操作演练步骤：

1. 创建包含3行5列的DataFrame对象，数值范围在1-8之间

首先，我们在环境中导入必要的库：

import numpy as np  import pandas as pd

接下来，创建一个3行5列的随机整数数据并生成DataFrame：

df1 = pd.DataFrame(np.random.randint(1, 8, (3,5)))

这将生成如下数据表：

0	1	2	3	4
2	1	5	2	5
2	6	4	2	5
2	7	1	5	6

2. 按照列表'a','b','a'进行行分组

根据指定的列表进行分组：

df1_1 = df1.groupby(['a', 'b', 'a'])

执行后，结果将被划分为以下分组：

（'a', 0, 1, 2, 3, 4）

（'a', 1, 2, 3, 4）

（'a', 2, 1, 2, 3, 4）

3. 为每个元素加1

对数据框中的每个元素执行加1操作：

df1_1 = df1_1.apply(lambda x: x + 1)

此次操作后的结果如下：

0	1	2	3	4
3	2	6	3	6
3	7	5	3	7
3	8	2	4	8

4. 将每个元素加上其所在列的和

首先计算 DataFrame 的总和：

sum_columns = df1.sum()   # 列的总和

结果：

0: 61

1:142

2:103

3:94

4:16

然后对每个元素加上对应列的和：

df1_1 = df1_1.apply(lambda x: x + df1.sum())

最终表格为：

0	1	2	3	4
8 (2+62)	15 (2+13)	15 (2+13)	8 (+previous sum)	21 (+previous sum)
8 (2+62)	20 (3+17)	14 (3+11)	8 (+previous sum)	21 (+previous sum)
8 (2+62)	21 (4+17)	11 (4+7	8 (+previous sum)	22 (+previous sum)

请注意，这些数值用于展示操作过程，具体应用时请根据实际数据调整。

转载地址：http://nutwk.baihongyu.com/

你可能感兴趣的文章

Mysql 常见ALTER TABLE操作

MYSQL 幻读（Phantom Problem）不可重复读

查看>>

mysql 往字段后面加字符串

查看>>

mysql 快速自增假数据，新增假数据，mysql自增假数据

查看>>

Mysql 批量修改四种方式效率对比（一）

查看>>

Mysql 报错 Field 'id' doesn't have a default value

查看>>

MySQL 报错：Duplicate entry 'xxx' for key 'UNIQ_XXXX'

查看>>

Mysql 拼接多个字段作为查询条件查询方法

查看>>

mysql 排序id_mysql如何按特定id排序

查看>>

Mysql 提示：Communication link failure

查看>>

mysql 插入是否成功_PDO mysql：如何知道插入是否成功

查看>>

Mysql 数据库InnoDB存储引擎中主要组件的刷新清理条件：脏页、RedoLog重做日志、Insert Buffer或ChangeBuffer、Undo Log

查看>>