[每日一练]用apply函数遍历判断数组类型数据
#该题目来源于力扣:
1294. 不同国家的天气类型 - 力扣(LeetCode)
题目要求:
表:Countries
+---------------+---------+
| Column Name | Type |
+---------------+---------+
| country_id | int |
| country_name | varchar |
+---------------+---------+
country_id 是这张表的主键(具有唯一值的列)。
该表的每行有 country_id 和 country_name 两列。
表:Weather
+---------------+---------+
| Column Name | Type |
+---------------+---------+
| country_id | int |
| weather_state | varchar |
| day | date |
+---------------+---------+
(country_id, day) 是该表的复合主键(具有唯一值的列)。
该表的每一行记录了某个国家某一天的天气情况。
编写解决方案找到表中每个国家在 2019 年 11 月的天气类型。
天气类型的定义如下:
当 weather_state 的平均值小于或等于 15 返回 Cold,
当 weather_state 的平均值大于或等于 25 返回 Hot,
否则返回 Warm。
以 任意顺序 返回你的查询结果。
返回结果格式如下所示:
示例 1:
输入:
Countries table:
+------------+--------------+
| country_id | country_name |
+------------+--------------+
| 2 | USA |
| 3 | Australia |
| 7 | Peru |
| 5 | China |
| 8 | Morocco |
| 9 | Spain |
+------------+--------------+
Weather table:
+------------+---------------+------------+
| country_id | weather_state | day |
+------------+---------------+------------+
| 2 | 15 | 2019-11-01 |
| 2 | 12 | 2019-10-28 |
| 2 | 12 | 2019-10-27 |
| 3 | -2 | 2019-11-10 |
| 3 | 0 | 2019-11-11 |
| 3 | 3 | 2019-11-12 |
| 5 | 16 | 2019-11-07 |
| 5 | 18 | 2019-11-09 |
| 5 | 21 | 2019-11-23 |
| 7 | 25 | 2019-11-28 |
| 7 | 22 | 2019-12-01 |
| 7 | 20 | 2019-12-02 |
| 8 | 25 | 2019-11-05 |
| 8 | 27 | 2019-11-15 |
| 8 | 31 | 2019-11-25 |
| 9 | 7 | 2019-10-23 |
| 9 | 3 | 2019-12-23 |
+------------+---------------+------------+
输出:
+--------------+--------------+
| country_name | weather_type |
+--------------+--------------+
| USA | Cold |
| Austraila | Cold |
| Peru | Hot |
| China | Warm |
| Morocco | Hot |
+--------------+--------------+
解释:
USA 11 月的平均 weather_state 为 (15) / 1 = 15 所以天气类型为 Cold。
Australia 11 月的平均 weather_state 为 (-2 + 0 + 3) / 3 = 0.333 所以天气类型为 Cold。
Peru 11 月的平均 weather_state 为 (25) / 1 = 25 所以天气类型为 Hot。
China 11 月的平均 weather_state 为 (16 + 18 + 21) / 3 = 18.333 所以天气类型为 Warm。
Morocco 11 月的平均 weather_state 为 (25 + 27 + 31) / 3 = 27.667 所以天气类型为 Hot。
我们并不知道 Spain 在 11 月的 weather_state 情况所以无需将他包含在结果中。
思路步骤:
对两张表进行连接,查找相应的年份,然后视线平均值的分组聚合,这些步骤并不难。
import pandas as pd
def weather_type(countries: pd.DataFrame, weather: pd.DataFrame) -> pd.DataFrame:
data=countries.merge(weather,how='right',on='country_id')
data=data.query('day.dt.month == 11')
data=data.groupby('country_name').agg({'weather_state':'mean'}).reset_index()
难点在于如何对聚合后的weather_state列进行判断。由于该列为Series类型数组,所以不可以和其他普通变量一样直接进行判断。这时我们可以利用apply函数,来为数组遍历传递自定义的函数。判断函数相对复杂,我们可以在外部自定义一个判断函数,然后将这个函数作为参数传递给apply函数即可:
import pandas as pd
def weather_type(countries: pd.DataFrame, weather: pd.DataFrame) -> pd.DataFrame:
data=countries.merge(weather,how='right',on='country_id')
data=data.query('day.dt.month == 11')
data=data.groupby('country_name').agg({'weather_state':'mean'}).reset_index()
def data_df(x):
if x<=15:
return 'Cold'
if x>=25:
return 'Hot'
else:
return 'Warm'
data['weather_type']=data['weather_state'].apply(data_df)
return data[['country_name','weather_type']]
由此可见,新建的判断列weather_type创建成功
原文地址:https://blog.csdn.net/2302_77975940/article/details/143771777
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!