自学内容网 自学内容网

[每日一练]用apply函数遍历判断数组类型数据

#该题目来源于力扣:

1294. 不同国家的天气类型 - 力扣(LeetCode)

题目要求:

表:Countries

+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| country_id    | int     |
| country_name  | varchar |
+---------------+---------+
country_id 是这张表的主键(具有唯一值的列)。
该表的每行有 country_id 和 country_name 两列。
 

表:Weather

+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| country_id    | int     |
| weather_state | varchar |
| day           | date    |
+---------------+---------+
(country_id, day) 是该表的复合主键(具有唯一值的列)。
该表的每一行记录了某个国家某一天的天气情况。
 

编写解决方案找到表中每个国家在 2019 年 11 月的天气类型。

天气类型的定义如下:

当 weather_state 的平均值小于或等于 15 返回 Cold,
当 weather_state 的平均值大于或等于 25 返回 Hot,
否则返回 Warm。
以 任意顺序 返回你的查询结果。

返回结果格式如下所示:

 

示例 1:

输入:
Countries table:
+------------+--------------+
| country_id | country_name |
+------------+--------------+
| 2          | USA          |
| 3          | Australia    |
| 7          | Peru         |
| 5          | China        |
| 8          | Morocco      |
| 9          | Spain        |
+------------+--------------+
Weather table:
+------------+---------------+------------+
| country_id | weather_state | day        |
+------------+---------------+------------+
| 2          | 15            | 2019-11-01 |
| 2          | 12            | 2019-10-28 |
| 2          | 12            | 2019-10-27 |
| 3          | -2            | 2019-11-10 |
| 3          | 0             | 2019-11-11 |
| 3          | 3             | 2019-11-12 |
| 5          | 16            | 2019-11-07 |
| 5          | 18            | 2019-11-09 |
| 5          | 21            | 2019-11-23 |
| 7          | 25            | 2019-11-28 |
| 7          | 22            | 2019-12-01 |
| 7          | 20            | 2019-12-02 |
| 8          | 25            | 2019-11-05 |
| 8          | 27            | 2019-11-15 |
| 8          | 31            | 2019-11-25 |
| 9          | 7             | 2019-10-23 |
| 9          | 3             | 2019-12-23 |
+------------+---------------+------------+
输出:
+--------------+--------------+
| country_name | weather_type |
+--------------+--------------+
| USA          | Cold         |
| Austraila    | Cold         |
| Peru         | Hot          |
| China        | Warm         |
| Morocco      | Hot          |
+--------------+--------------+
解释:
USA 11 月的平均 weather_state 为 (15) / 1 = 15 所以天气类型为 Cold。
Australia 11 月的平均 weather_state 为 (-2 + 0 + 3) / 3 = 0.333 所以天气类型为 Cold。
Peru 11 月的平均 weather_state 为 (25) / 1 = 25 所以天气类型为 Hot。
China 11 月的平均 weather_state 为 (16 + 18 + 21) / 3 = 18.333 所以天气类型为 Warm。
Morocco 11 月的平均 weather_state 为 (25 + 27 + 31) / 3 = 27.667 所以天气类型为 Hot。
我们并不知道 Spain 在 11 月的 weather_state 情况所以无需将他包含在结果中。

思路步骤:

对两张表进行连接,查找相应的年份,然后视线平均值的分组聚合,这些步骤并不难。

import pandas as pd

def weather_type(countries: pd.DataFrame, weather: pd.DataFrame) -> pd.DataFrame:
    data=countries.merge(weather,how='right',on='country_id')
    data=data.query('day.dt.month == 11')
    data=data.groupby('country_name').agg({'weather_state':'mean'}).reset_index()

难点在于如何对聚合后的weather_state列进行判断。由于该列为Series类型数组,所以不可以和其他普通变量一样直接进行判断。这时我们可以利用apply函数,来为数组遍历传递自定义的函数。判断函数相对复杂,我们可以在外部自定义一个判断函数,然后将这个函数作为参数传递给apply函数即可:

import pandas as pd

def weather_type(countries: pd.DataFrame, weather: pd.DataFrame) -> pd.DataFrame:
    data=countries.merge(weather,how='right',on='country_id')
    data=data.query('day.dt.month == 11')
    data=data.groupby('country_name').agg({'weather_state':'mean'}).reset_index()
    def data_df(x):
        if x<=15:
            return 'Cold'
        if x>=25:
            return 'Hot'
        else:
            return 'Warm'
    data['weather_type']=data['weather_state'].apply(data_df)
    return data[['country_name','weather_type']]

由此可见,新建的判断列weather_type创建成功


原文地址:https://blog.csdn.net/2302_77975940/article/details/143771777

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!