当前位置: 首页 > news >正文

个人动漫网站怎么做页面成都百度推广的关键词

个人动漫网站怎么做页面,成都百度推广的关键词,建筑素材网站,怎么优化网络用户域登录各窗口汇总表 主要任务:从kafka页面日志主题读取数据,统计 七日回流用户:之前活跃的用户,有一段时间不活跃了,之后又开始活跃,称为回流用户当日独立用户数:同一个用户当天重复登录&a…

用户域登录各窗口汇总表

  • 主要任务:从kafka页面日志主题读取数据,统计
    • 七日回流用户:之前活跃的用户,有一段时间不活跃了,之后又开始活跃,称为回流用户
    • 当日独立用户数:同一个用户当天重复登录,只算作一个独立用户。

思路分析

  1. 读取kafka页面主题数据
  2. 转换数据结构:String -> JSONObject
  3. 过滤数据,uid不为null
    • 登录的两种情况
      • 用户打开应用后自动登录
      • 用户打印应用后没有登录,浏览后跳转到登录页面
    • 过滤条件:
      • uid不为null且last_page_id is null
      • last_page_id = login
  4. 设置水位线
  5. 按照uid分组
  6. 统计回流用户数和独立用户数
  7. 开窗聚合
  8. 写入doris

具体实现

  1. 设置端口、并行度、消费者组、kafka主题
  2. 读取dwd页面主题数据
    - stream.print()
  3. 对数据进行清洗过滤:uid不为空
    • stream.flatMap()使用flatMap过滤
    • new FlatMapFunction<>(){}在该方法内部转换为JSONObject, 并且获取uid和lastPageId, try-catch这段代码
    • 判断是否满足思路分析中的条件,如果中途发生异常,直接catch后打印到控制台清理掉即可。
  4. 先注册水位线
    • jsonObjStream.assignTimestampAndWatermark
    • new SerializableTimestampAssigner<>, 提取数据中的ts
  5. 按照uid分组
    • stream.keyby()按照uid进行分组
  6. 判断独立用户和回流用户
    • 创建UserLoginBean, 使用状态保存用户的登录信息
    • 在open方法中,getRuntimeContext().getState(new ValueStateDescriptor<>("last_login_dt",String.class))创建状态记录用户上一次的登录时间
    • processElement方法中比较当前登录的日期和状态存储的日期
      • 如果lastLoginDt==null是新用户
      • 如果不为空,判断上次登录时间和当前时间的差值是否大于7天;如果大于7天,说明是回流用户。
      • 如果小于7天,还需要判断上次登录时间是否是今天,如果不是今天,则说明该用户本次是独立用户。
  7. 开窗聚合
    • 使用滚动窗口开窗聚合
    • reduce算子中写聚合逻辑
    • process算子中获取窗口信息
  8. 写入doris
    • 创建doris sink,写出到doris

核心代码

public static void main(String[] args) {new DwsUserUserLoginWindow().start(10024,4,"dws_user_user_login_window", Constant.TOPIC_DWD_TRAFFIC_PAGE);}@Overridepublic void handle(StreamExecutionEnvironment env, DataStreamSource<String> stream) {//1.读取dwd页面数据//stream.print();//2. 对数据进行清洗过滤SingleOutputStreamOperator<JSONObject> jsonObjStream = etl(stream);//3. 注册水位线SingleOutputStreamOperator<JSONObject> withWatermarkStream = addWatermark(jsonObjStream);//4. 按照uid分组KeyedStream<JSONObject, String> keyedStream = getKeyedStream(withWatermarkStream);//5. 判断独立用户和回流用户SingleOutputStreamOperator<UserLoginBean> processedStream = getUserLoginBeanStream(keyedStream);//processedStream.print();//开窗聚合SingleOutputStreamOperator<UserLoginBean> reducedStream = getReducedStream(processedStream);//reducedStream.print();//写入DorisreducedStream.map(new DorisMapFunction<>()).sinkTo(FlinkSinkUtil.getDorisSink(Constant.DWS_USER_USER_LOGIN_WINDOW));}

[gitee仓库地址:(https://gitee.com/langpaian/gmall2023-realtime)

http://www.yayakq.cn/news/782025/

相关文章:

  • 站外seo推广丁香花在线电影小说观看
  • 网站手机页面如何做微信代运营合作方案
  • 正规网站建设空间哪个好网站title重复的后果
  • 辽icp备鞍山公司中企动力提供网站建设找私人做网站
  • 数据库在网站建设中的作用iis默认网站 建设中
  • 滨江网站建设用jsp做一网站的流程图
  • cad dwt模板做网站模版温州网站设计网站建设网站
  • 深圳营销型网站seo中国最厉害的网站建设公司
  • 陕西省住房建设厅网站检察 网站建设
  • 深圳做网站哪家公司比较好而且不贵公司微网站建设方案
  • 南京做网站南京乐识赞推广怎么推
  • asp+sql server典型网站建设案例 光盘做瞹瞹网站
  • phpcms 恢复网站百度收录入口在哪里查询
  • 简单的工作室网站模板apple网站设计
  • 住房建设城乡网站藁城住房和城乡建设局网站
  • 电脑在哪网站接做扇子单怎样建立网页
  • 苏州市网站建设培训班产品网站建设建议
  • 网站建设数据收集方法大连建行网点
  • app网站软件免费浏览网站推广
  • 哈尔滨市做网站优化成都公司网页制作公司
  • 东光网站制作宁波应用多的建站行业
  • 网站地址栏图标怎么做网站设计布局的重要性
  • 网站规划说明书范文天津市网站制作建设推广公司
  • 网站建设数据库实训体会php 禁止电脑访问网站
  • 网站建设中图片是什么意思玉溪网站建设制作
  • 做推广网站的去哪能买到有效资料优秀网页设计作品分析ppt
  • 公司汇报网站建设方案百度站长收录提交入口
  • 沈阳企业网站开发定制安装 wordpress
  • 大型网站建设与维护过程软文推广300字
  • 重庆建设网站首页最有吸引力的营销模式