自学内容网 自学内容网

pandas导入数据知识总结

Pandas 常用数据导入导出

文件格式Pandas 读取函数Pandas 输出函数
CSV ,textread_csvto_csv
Excelread_excelto_excel
SQLread_sql, read_sql_queryto_sql

简单示例

import pandas as pd
data_csv2 = pd.read_csv('example.csv')
data_xlsx = pd.read_excel('example.xlsx')
data_json = pd.read_json('example.json')
print(data_csv2)
print(data_xlsx)
print(data_json)

实战

下面统计了样本的身份信息,包括生日(年月日),性别,职位,薪水等信息,现在要求:
1、把年月日合并成生日,并将该字段格式调整为日期类型
2、新增年龄字段,计算逻辑当前的年份-生日的年份
3、薪水字段规范,并格式进行调整

import pandas as pd 
from datetime import datetime
df = pd.read_csv(r'data_test01.txt',names=['id','year','month','day','gender','profess','salary'])
print(df)
df['birthday'] = df.apply(lambda row: '{}/{}/{}'.format(row['year'], row['month'], row['day']), axis=1)
df['salary'] = df['salary'].str.replace('&','').str[:-1].astype(float)
df1=df.loc[:,['birthday','gender','profess','salary']]
df1['birthday']=pd.to_datetime(df1['birthday'])
today = datetime.now()
df1['age'] = today.year - df1['birthday'].dt.year 
print(df1)

   id  year  month  day gender profess   salary
0   1  1990      3    7      男    销售经理   6&0001   2  1989      8   10      女     化妆师   8&5002   3  1991     10   10      男    后端开发  13&5003   4  1992     10    7      女    前端设计   6&5004   5  1985      6   15      男   数据分析师  18&000元
    birthday gender profess   salary  age
0 1990-03-07      男    销售经理   6000.0   34
1 1989-08-10      女     化妆师   8500.0   35
2 1991-10-10      男    后端开发  13500.0   33
3 1992-10-07      女    前端设计   6500.0   32
4 1985-06-15      男   数据分析师  18000.0   39

原文地址:https://blog.csdn.net/weixin_43597208/article/details/143023322

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!