Pandas数据操作（一） - 云南第一深情

数据读取

- csv的读取与保存

import pandas as pd
data = pd.read_csv(r'文件读取路径') 
data.to_csv('文件保存路径')

Excel的读取与保存

pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
            arse_cols=None,date_parser=None,na_values=None,thousands=None, 
            convert_float=True,has_index_names=None,converters=None,dtype=None,
            true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

pd.read_excel常用参数说明

io:文件读取路径
sheetname：表名。默认=0，表示显示第一个表返回多表使用 sheetname=[0,1]，若是返回全表使用 sheetname=None，也可以返回特定的表。

#返回名字为“sheet2”的表
sheet = pd.read_excel('example.xls',sheetname= 'Sheet2')

#通过表位置返回数据：
#第一张表
sheet = pd.read_excel('example.xls',sheetname= 1)

header：指定作为列名的行，默认 = 0，即取第一行，数据为列名行以下的数据；设定 header = None，数据不含列名；

#数据不含作为列名的行
sheet = pd.read_excel('example.xls',sheetname= 1,header = None)

#默认第一行数据作为列名
sheet = pd.read_excel('example.xls',sheetname= 1,header =0)

skiprows：省略指定行数的数据

#略去1行的数据，自上而下的开始略去数据的行
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skiprows= 1)

skip_footer：省略从尾部数的行数据

#从尾部开始略去行的数据
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1)

index_col ：指定列为索引列，也可以使用 u’ string’

#指定第二列的数据作为行索引
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1)

names：指定列的名字，传入一个list数据

sheet = pd.read_excel('example.xls',sheetname= 1,
                      header = None,skip_footer= 1,index_col=1,names=['a','b','c'])

表格数据的保存

import pandas as pd
data.to_excel('文件保存路径')

txt文件的读取

利用numpy将txt文件读取为数组形式，然后进一步转化成dataframe格式

import numpy as np
import pandas as pd
data = np.loadtxt(r"路径") 
data  #查看数据类型
data.shape #查看数据类型
data = np.reshape(data,(299,10))  #更改数据维度，比如我的数据是一维，改为299 x 10维度
df = pd.DataFrame(data) #转换成 dataframe类型
df #查看数据

数据读取

发表新评论

分类

最新文章

邻居