pandas导入数据知识总结
Pandas 常用数据导入导出
文件格式 | Pandas 读取函数 | Pandas 输出函数 |
---|---|---|
CSV ,text | read_csv | to_csv |
Excel | read_excel | to_excel |
SQL | read_sql, read_sql_query | to_sql |
简单示例
import pandas as pd
data_csv2 = pd.read_csv('example.csv')
data_xlsx = pd.read_excel('example.xlsx')
data_json = pd.read_json('example.json')
print(data_csv2)
print(data_xlsx)
print(data_json)
实战
下面统计了样本的身份信息,包括生日(年月日),性别,职位,薪水等信息,现在要求:
1、把年月日合并成生日,并将该字段格式调整为日期类型
2、新增年龄字段,计算逻辑当前的年份-生日的年份
3、薪水字段规范,并格式进行调整
import pandas as pd
from datetime import datetime
df = pd.read_csv(r'data_test01.txt',names=['id','year','month','day','gender','profess','salary'])
print(df)
df['birthday'] = df.apply(lambda row: '{}/{}/{}'.format(row['year'], row['month'], row['day']), axis=1)
df['salary'] = df['salary'].str.replace('&','').str[:-1].astype(float)
df1=df.loc[:,['birthday','gender','profess','salary']]
df1['birthday']=pd.to_datetime(df1['birthday'])
today = datetime.now()
df1['age'] = today.year - df1['birthday'].dt.year
print(df1)
id year month day gender profess salary
0 1 1990 3 7 男 销售经理 6&000元
1 2 1989 8 10 女 化妆师 8&500元
2 3 1991 10 10 男 后端开发 13&500元
3 4 1992 10 7 女 前端设计 6&500元
4 5 1985 6 15 男 数据分析师 18&000元
birthday gender profess salary age
0 1990-03-07 男 销售经理 6000.0 34
1 1989-08-10 女 化妆师 8500.0 35
2 1991-10-10 男 后端开发 13500.0 33
3 1992-10-07 女 前端设计 6500.0 32
4 1985-06-15 男 数据分析师 18000.0 39
原文地址:https://blog.csdn.net/weixin_43597208/article/details/143023322
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!