数据读取
- csv的读取与保存
import pandas as pd
data = pd.read_csv(r'文件读取路径')
data.to_csv('文件保存路径')
Excel的读取与保存
pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
arse_cols=None,date_parser=None,na_values=None,thousands=None,
convert_float=True,has_index_names=None,converters=None,dtype=None,
true_values=None,false_values=None,engine=None,squeeze=False,**kwds)
pd.read_excel常用参数说明
- io:文件读取路径
- sheetname:表名。默认=0,表示显示第一个表返回多表使用 sheetname=[0,1],若是返回全表使用 sheetname=None,也可以返回特定的表。
#返回名字为“sheet2”的表
sheet = pd.read_excel('example.xls',sheetname= 'Sheet2')
#通过表位置返回数据:
#第一张表
sheet = pd.read_excel('example.xls',sheetname= 1)
- header:指定作为列名的行,默认 = 0,即取第一行,数据为列名行以下的数据;设定 header = None,数据不含列名;
#数据不含作为列名的行
sheet = pd.read_excel('example.xls',sheetname= 1,header = None)
#默认第一行数据作为列名
sheet = pd.read_excel('example.xls',sheetname= 1,header =0)
- skiprows:省略指定行数的数据
#略去1行的数据,自上而下的开始略去数据的行
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skiprows= 1)
- skip_footer:省略从尾部数的行数据
#从尾部开始略去行的数据
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1)
- index_col :指定列为索引列,也可以使用 u’ string’
#指定第二列的数据作为行索引
sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1)
- names:指定列的名字,传入一个list数据
sheet = pd.read_excel('example.xls',sheetname= 1,
header = None,skip_footer= 1,index_col=1,names=['a','b','c'])
- 表格数据的保存
import pandas as pd
data.to_excel('文件保存路径')
txt文件的读取
- 利用numpy将txt文件读取为数组形式,然后进一步转化成dataframe格式
import numpy as np
import pandas as pd
data = np.loadtxt(r"路径")
data #查看数据类型
data.shape #查看数据类型
data = np.reshape(data,(299,10)) #更改数据维度,比如我的数据是一维,改为299 x 10维度
df = pd.DataFrame(data) #转换成 dataframe类型
df #查看数据