返回介绍

15.4. 序列

发布于 2024-02-10 15:26:30 字数 1971 浏览 0 评论 0 收藏 0

15.4. 序列

Series:是一种类似于一维数组的对象,是由一组数据和一组与之相关的数据标签(即索引)组成。

Series 创建方式有两种:

  • 通过以为数组方式创建
  • 通过以为列表方式创建
  • 通过字典的方式创建(此时key变成索引,value变成了值)

Series 参数:

  • Series (Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。
  • data 数据
  • index 索引 索引值必须是唯一的和散列的,与数据的长度相同。 默认np.arange(n)如果没有索引被传递。
  • dtype 输出的数据类型 如果没有,将推断数据类型
  • copy 复制数据 默认为false

15.4.1. 创建 Series 对象

import pandas as pd

print('-' * 20, '通过数组创建 Series', '-' * 20)
ser = pd.Series(['a', 'b', 'c', 'd', 'e'])
print(ser)

print('-' * 20, '通过列表创建 Series', '-' * 20)
ser = pd.Series(list(range(5)), index=['a', 'b', 'c', 'd', 'e'])
print(ser)

print('-' * 20, '通过字典创建 Series', '-' * 20)
d = {'a': 1, 'b': 2, 'c': 3}
ser = pd.Series(data=d, index=['a', 'b', 'c'])
print(ser)

print('-' * 20, '指定常量创建 Series', '-' * 20)
ser = pd.Series(5, index=[1, 2, 3, 4, 5])
print(ser)

15.4.2. Series 运算

import pandas as pd

s1 = pd.Series(data=[1, 2, 3, 4, 5], index=["a", "b", "c", "d", "e"])
s2 = pd.Series(data=[1, 2, 3, 4, 5], index=["a", "b", "c", "e", "f"])
ser = s1 + s2
print(ser)		
a    2.0
b    4.0
c    6.0
d    NaN
e    9.0
f    NaN
dtype: float64		

15.4.3. Series 常用方法

15.4.3.1. head() /tail()

import pandas as pd
import string
data = [chr(x) for x in range(ord('a'), ord('z') + 1)]
res = pd.Series(data, index=list(string.ascii_lowercase))
# 原始数据
print(res)
# 查看前三个
print(res.head(3))
# 查看后两个
print(res.tail(2))			

15.4.3.2. isnull() / notnull()

print('-' * 20, '筛选出非空的正常数据', '-' * 20)
print(ser[ser.notnull()])
print('-' * 20, '筛选出空的数据', '-' * 20)
print(ser[ser.isnull()])

15.4.3.3. 去重复数据

import pandas as pd
s = pd.Series(data=[1, 1, 3, 2, 3, 4, 5, 6, 5, 6, 7, 6, 9, 7, 8, 10])
print(s.unique())			

输出结果

[ 1  3  2  4  5  6  7  9  8 10]			

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文