自学内容网 自学内容网

SQL,将相近发生的事件分为一组后编号

Big query 数据库的表记录了用户的多次事件,比如某用户按时间排序后如下:

dateuser
2024-04-08bob
2024-04-11bob
2024-04-12bob
2024-04-17bob
2024-04-18bob
2024-04-25bob

现在要新增计算列 session_id:以第一次事件为标志,session_id 为 1;如果新事件距离标志在 7 天内,则 session_id 不变;如果新事件距离标志大于 7 天,则 session_id 递增,重置标志为该事件。

dateusersession_id
2024-04-08bob1
2024-04-11bob1
2024-04-12bob1
2024-04-17bob2
2024-04-18bob2
2024-04-25bob3

编写SPL代码

 A
1=BigQryJDBC.query("select * from tb order by date where user=?","Bob")
2>d=A1.date,s=1
3=A1.derive(s+=if(date-d>7,(d=date,1)):session_id)

A1:通过JDBC查询某用户的事件记录。

A2:设置变量,d是标志日期,初值为第一次事件的日期;s是session_id 的变量,初值为 1。

A3:按规则新增计算列session_id。当当前记录的日期和标志日期差距大于7天时,将标志日期重置为当前记录的日期,并将s加1。

SPL已开源免费,欢迎前往乾学院社区了解更多!

免费下载


原文地址:https://blog.csdn.net/smilejingwei/article/details/144266328

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!