#output:yearnamelocal student02012国科图北四环西路甲12013国科图北四环西路乙22014文献情报中心北四环西路丙32015文献情报中心北四环西路丁#更改index的默认设置data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print(centerDF)#output:yearnamelocal studenta2012国科图北四环西路甲b2013国科图北四环西路乙c2014文献情报中心北四环西路丙d2015文献情报中心北四环西路丁既然DataFrame 是行列格式的数据,那么理所当然可以通过行、列的方式进行数据获取,按列进行数据据获取,具体如下:
data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF["name"])print (centerDF["student"])#output:a国科图b国科图c文献情报中心d文献情报中心Name: name, dtype: objecta甲b乙c丙d丁Name: student, dtype: object另外,可以看出按列进行获取时他们的index标识是相同的,且每一列是一个Series 对象
按行进行数据获取,其实是通过index进行操作,具体如下:
data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF.loc["a"])#在使用进行DataFrame.ix进行表中的数据块选择的时候,会抛出’DataFrame’ object has no attribute ‘ix’,这个是由于在不同的pandas的版本中,DataFrame的相关属性已过期,已不推荐使用导致的 。#参考代码先锋网
文章插图
#output:year2012name国科图local北四环西路student甲Name: a, dtype: object另外,同样可以看出每一行是一个Series 对象,此时该Series的index其实就是DataFrame 的列名称,综上来看,对于一个DataFrame 来说,它是纵横双向进行索引,只是每个Series(纵横)都共用一个索引而已
【1 python-数据描述与分析】1.3 利用Pandas加载、保存数据在进行数据处理时我们首要工作是把数据加载到内存中,这一度成为程序编辑的软肋,但是Pandas包所提供的功能几乎涵盖了大多数的数据处理的加载问题,如read_csv、read_ExcelFile
(1)加载csv格式的数据
import pandas as pddata_csv = pd.read_csv("D:/python_cailiao/test.csv")#它的默认属性有sep=","data_csv#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_csv = pd.read_csv("D:/python_cailiao/test.csv",sep="#")#更改默认属性sep="#"data_csv#output:school,institute,grades,name0中国科学院大学,文献情报中心,15级,田鹏伟1中国科学院大学,文献情报中心,15级,李四2中国科学院大学,文献情报中心,15级,王五3中国科学院大学,文献情报中心,15级,张三data_csv = pd.read_csv("D:/python_cailiao/test.csv",header=None,skiprows=[0])#不要表头Headerdata_csv#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三
经验总结扩展阅读
- 企业运维 | MySQL关系型数据库在Docker与Kubernetes容器环境中快速搭建部署主从实践
- 描述用心就会成功的古文
- 2010总决赛科比数据
- C#.NET ORM 如何访问 Access 数据库 [FreeSql]
- windows下mysql的数据主主同步
- 有趣实验 .NET下数据库的负载均衡
- Python-函数-字符串函数
- SQL的事务
- 下 MySQL数据库-数据表
- 原生Redis跨数据中心双向同步优化实践