- 部分 I. Python 入门
- 第 1 章 Python 入门
- 第 2 章 Python Package Index (PyPI)
- 第 3 章 Python 模块
- 第 4 章 数据类型
- 第 5 章 数据结构
- 第 6 章 Class
- 第 7 章 Input/Output
- 第 8 章 Pipe
- 第 9 章 Library
- 9.2. 随机数
- 9.3. Python 多线程
- 9.13. syslog
- 9.5. Socket
- 9.6. subprocess
- 9.7. YAML
- 9.8. Daemon
- 9.9. python-memcached
- 9.10. Pyro - Pyro is short for PYthon Remote Objects
- 9.11. Python Imaging Library
- 9.12. getopt – Command line option parsing
- 9.14. python-subversion
- 9.15. SimpleHTTPServer
- 9.16. fuse-python.x86_64 : Python bindings for FUSE - filesystem in userspace
- 9.17. Network
- 9.18. Python-spdylay - Spdylay Python Extension Module
- 9.19. mechanize
- 9.20. Dominate
- 第 10 章 Frameworks
- 第 12 章 终端环境开发
- 部分 II. Python 数据分析
- 第 13 章 Crawler
- 第 14 章 Scrapy - Python web scraping and crawling framework
- 第 15 章 Pandas - Python Data Analysis Library
- 第 16 章 股票
- 第 17 章 数据可视化
- 部分 III. 人工智能 AI
- 第 18 章 OCR
- 第 19 章 语音处理
- 第 20 章 视频
- 第 21 章 人脸识别
- 第 22 章 自然语言处理
- 第 23 章 自动化运维
- 第 24 章 办公自动化
- 第 25 章 OpenCV
- 第 26 章 图形开发
- 第 27 章 3rdparty toolkit
- 第 29 章 实用代码
- 第 30 章 FAQ
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
15.4. 序列
15.4. 序列
Series:是一种类似于一维数组的对象,是由一组数据和一组与之相关的数据标签(即索引)组成。
Series 创建方式有两种:
- 通过以为数组方式创建
- 通过以为列表方式创建
- 通过字典的方式创建(此时key变成索引,value变成了值)
Series 参数:
- Series (Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。
- data 数据
- index 索引 索引值必须是唯一的和散列的,与数据的长度相同。 默认np.arange(n)如果没有索引被传递。
- dtype 输出的数据类型 如果没有,将推断数据类型
- copy 复制数据 默认为false
15.4.1. 创建 Series 对象
import pandas as pd print('-' * 20, '通过数组创建 Series', '-' * 20) ser = pd.Series(['a', 'b', 'c', 'd', 'e']) print(ser) print('-' * 20, '通过列表创建 Series', '-' * 20) ser = pd.Series(list(range(5)), index=['a', 'b', 'c', 'd', 'e']) print(ser) print('-' * 20, '通过字典创建 Series', '-' * 20) d = {'a': 1, 'b': 2, 'c': 3} ser = pd.Series(data=d, index=['a', 'b', 'c']) print(ser) print('-' * 20, '指定常量创建 Series', '-' * 20) ser = pd.Series(5, index=[1, 2, 3, 4, 5]) print(ser)
15.4.2. Series 运算
import pandas as pd s1 = pd.Series(data=[1, 2, 3, 4, 5], index=["a", "b", "c", "d", "e"]) s2 = pd.Series(data=[1, 2, 3, 4, 5], index=["a", "b", "c", "e", "f"]) ser = s1 + s2 print(ser)
a 2.0 b 4.0 c 6.0 d NaN e 9.0 f NaN dtype: float64
15.4.3. Series 常用方法
15.4.3.1. head() /tail()
import pandas as pd import string data = [chr(x) for x in range(ord('a'), ord('z') + 1)] res = pd.Series(data, index=list(string.ascii_lowercase)) # 原始数据 print(res) # 查看前三个 print(res.head(3)) # 查看后两个 print(res.tail(2))
15.4.3.2. isnull() / notnull()
print('-' * 20, '筛选出非空的正常数据', '-' * 20) print(ser[ser.notnull()]) print('-' * 20, '筛选出空的数据', '-' * 20) print(ser[ser.isnull()])
15.4.3.3. 去重复数据
import pandas as pd s = pd.Series(data=[1, 1, 3, 2, 3, 4, 5, 6, 5, 6, 7, 6, 9, 7, 8, 10]) print(s.unique())
输出结果
[ 1 3 2 4 5 6 7 9 8 10]
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论