SQL,将相近发生的事件分为一组后编号
Big query 数据库的表记录了用户的多次事件,比如某用户按时间排序后如下:
date | user |
2024-04-08 | bob |
2024-04-11 | bob |
2024-04-12 | bob |
2024-04-17 | bob |
2024-04-18 | bob |
2024-04-25 | bob |
现在要新增计算列 session_id:以第一次事件为标志,session_id 为 1;如果新事件距离标志在 7 天内,则 session_id 不变;如果新事件距离标志大于 7 天,则 session_id 递增,重置标志为该事件。
date | user | session_id |
2024-04-08 | bob | 1 |
2024-04-11 | bob | 1 |
2024-04-12 | bob | 1 |
2024-04-17 | bob | 2 |
2024-04-18 | bob | 2 |
2024-04-25 | bob | 3 |
编写SPL代码
A | |
1 | =BigQryJDBC.query("select * from tb order by date where user=?","Bob") |
2 | >d=A1.date,s=1 |
3 | =A1.derive(s+=if(date-d>7,(d=date,1)):session_id) |
A1:通过JDBC查询某用户的事件记录。
A2:设置变量,d是标志日期,初值为第一次事件的日期;s是session_id 的变量,初值为 1。
A3:按规则新增计算列session_id。当当前记录的日期和标志日期差距大于7天时,将标志日期重置为当前记录的日期,并将s加1。
SPL已开源免费,欢迎前往乾学院社区了解更多!
原文地址:https://blog.csdn.net/smilejingwei/article/details/144266328
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!