Pandas数据操作(一)

数据读取

- csv的读取与保存

import pandas as pd
data = pd.read_csv(r'文件读取路径') 
data.to_csv('文件保存路径')

Excel的读取与保存

pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
            arse_cols=None,date_parser=None,na_values=None,thousands=None, 
            convert_float=True,has_index_names=None,converters=None,dtype=None,
            true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

pd.read_excel常用参数说明

  • io:文件读取路径
  • sheetname:表名。默认=0,表示显示第一个表返回多表使用 sheetname=[0,1],若是返回全表使用 sheetname=None,也可以返回特定的表。
#返回名字为“sheet2”的表
sheet = pd.read_excel('example.xls',sheetname= 'Sheet2')

#通过表位置返回数据:
#第一张表
sheet = pd.read_excel('example.xls',sheetname= 1)
  • header:指定作为列名的行,默认 = 0,即取第一行,数据为列名行以下的数据;设定 header = None,数据不含列名;
#数据不含作为列名的行
sheet = pd.read_excel('example.xls',sheetname= 1,header = None)

#默认第一行数据作为列名
sheet = pd.read_excel('example.xls',sheetname= 1,header =0)
  • skiprows:省略指定行数的数据
#略去1行的数据,自上而下的开始略去数据的行
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skiprows= 1)
  • skip_footer:省略从尾部数的行数据
#从尾部开始略去行的数据
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1)
  • index_col :指定列为索引列,也可以使用 u’ string’
#指定第二列的数据作为行索引
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1)
  • names:指定列的名字,传入一个list数据
sheet = pd.read_excel('example.xls',sheetname= 1,
                      header = None,skip_footer= 1,index_col=1,names=['a','b','c'])
  • 表格数据的保存
import pandas as pd
data.to_excel('文件保存路径')

txt文件的读取

  • 利用numpy将txt文件读取为数组形式,然后进一步转化成dataframe格式
import numpy as np
import pandas as pd
data = np.loadtxt(r"路径") 
data  #查看数据类型
data.shape #查看数据类型
data = np.reshape(data,(299,10))  #更改数据维度,比如我的数据是一维,改为299 x 10维度
df = pd.DataFrame(data) #转换成 dataframe类型
df #查看数据

TAG:none

发表新评论