博客
关于我
数据应用apply练习
阅读量:743 次
发布时间:2019-03-22

本文共 941 字,大约阅读时间需要 3 分钟。

数据应用相对练习

以下是基于Numpy和Pandas的数据操作演练步骤:

1. 创建包含3行5列的DataFrame对象,数值范围在1-8之间

首先,我们在环境中导入必要的库:

import numpy as np  import pandas as pd

接下来,创建一个3行5列的随机整数数据并生成DataFrame:

df1 = pd.DataFrame(np.random.randint(1, 8, (3,5)))

这将生成如下数据表:

0 1 2 3 4
2 1 5 2 5
2 6 4 2 5
2 7 1 5 6

2. 按照列表'a','b','a'进行行分组

根据指定的列表进行分组:

df1_1 = df1.groupby(['a', 'b', 'a'])

执行后,结果将被划分为以下分组:

('a', 0, 1, 2, 3, 4)

('a', 1, 2, 3, 4)
('a', 2, 1, 2, 3, 4)

3. 为每个元素加1

对数据框中的每个元素执行加1操作:

df1_1 = df1_1.apply(lambda x: x + 1)

此次操作后的结果如下:

0 1 2 3 4
3 2 6 3 6
3 7 5 3 7
3 8 2 4 8

4. 将每个元素加上其所在列的和

首先计算 DataFrame 的总和:

sum_columns = df1.sum()   # 列的总和

结果:

0: 61
1:142
2:103
3:94
4:16

然后对每个元素加上对应列的和:

df1_1 = df1_1.apply(lambda x: x + df1.sum())

最终表格为:

0 1 2 3 4
8 (2+62) 15 (2+13) 15 (2+13) 8 (+previous sum) 21 (+previous sum)
8 (2+62) 20 (3+17) 14 (3+11) 8 (+previous sum) 21 (+previous sum)
8 (2+62) 21 (4+17) 11 (4+7 8 (+previous sum) 22 (+previous sum)

请注意,这些数值用于展示操作过程,具体应用时请根据实际数据调整。

转载地址:http://nutwk.baihongyu.com/

你可能感兴趣的文章
pip 下载慢
查看>>
pip 升级报错AttributeError: ‘NoneType’ object has no attribute ‘bytes’
查看>>
pip 安装opencv-python卡死
查看>>
pip 安装出现异常
查看>>
Pip 安装失败:需要 SSL
查看>>
Pip 安装挂起
查看>>
pip 或 pip3 为 Python 3 安装包?
查看>>
pip 文件损坏导致 pip无法使用 报错 ImportError: cannot import name 'main' from 'pip._int
查看>>
pip 无法从 requirements.txt 安装软件包
查看>>
pip/pip3更换国内源
查看>>
pip3 install PyQt5 --user 失败
查看>>
pip3命令全解析:Python3包管理工具的详细使用指南
查看>>
pip3安装命令重复创建文件‘/tmp/pip-install-xxxxx/package‘失败
查看>>
PIPE 接口信号列表
查看>>
pipeline配置与管理Job企业级实战
查看>>
pipeline项目配置实战
查看>>
Pipenv 与 Conda?
查看>>
QVGA/HVGA/WVGA/FWVGA分辨率屏含义及大小//Android虚拟机分辨率
查看>>
pipreqs : 无法将“pipreqs”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径 正确,然后再试一次。
查看>>
pipy国内镜像的网址
查看>>