当前位置: 首页 > news >正文

番禺制作网站设计电商运营的基本流程

番禺制作网站设计,电商运营的基本流程,wordpress文章填写关键词描述标题,电子商务的门户网站HIVE作为数据仓库处理常用工具,如同RDBMS关系型数据库中标准SQL语法一样,Hive SQL也内置了不少系统函数,满足于用户在不同场景下的数据分析需求,以提高开发SQL数据分析的效率。 我们可以使用show functions查看当下版本支持的函数…

HIVE作为数据仓库处理常用工具,如同RDBMS关系型数据库中标准SQL语法一样,Hive SQL也内置了不少系统函数,满足于用户在不同场景下的数据分析需求,以提高开发SQL数据分析的效率。
我们可以使用show functions查看当下版本支持的函数,并且可以通过describe function extended funcname来查看函数对应的使用方式和方法,下面我们将描述HIVE SQL中常用函数的高阶使用场景。

1、行转列(explode)

如下活动列表:tb_activities

活动ID活动名称列表
1双111,国庆,元旦
2黄金周,国庆,元旦

希望转换为列类型活动表:tb_activitity

活动ID活动名称
1双11
1国庆
1元旦
2黄金周
2国庆
2元旦

使用到Hive内置一个非常著名的UDTF函数,名字叫做explode函数,中文戏称为“爆炸函数”,可以炸开数据转换为多行。

insert into table tb_activitity select id,activity from tb_activities 
lateral view explode(split(activities,','))enum_tmp as activity;

2、列转行

如上1所示,希望从tb_activity转换为tb_activities,通过collect_set()方法和group by id 将列转换为行,实现如下:

 select id, concat_ws(',',collect_set(activity)) as activities from tb_activity group by id;

3、排名(rank())

可以通过rank() 方法的使用,实现对指定列进行排名,输出排名结果。例如商品总数表:t_item_sum,需要实现排名功能:

item_iditem_sum
100120
100212
100362
100415

期望得到:

item_iditem_sumrank
1003621
1001202
1004153
1002124

代码实现如下:

select item_id,item_sum,rank()over(order by item_sum desc) as rank from t_item_sum;

4、分组去重

在查询数据时如果有重复,我们可以使用用distinct 去除重复值,但使用 distinct 只能去除所有查询列都相同的记录,如果某个字段不同,distinct 就无法去重。这时我们可以用 row_number()over(partitioon by column1 order by column2) 先进行分组。
例如:有活动表数据列“活动id,用户id,活动名称,客户群组,过期时间”,希望按照”活动id,活动名称,客户群组”去重,取最新一条数据。

iduser_idactivitycust_groupexpired_at
BCP0151001春节活动A高价值2023-10-05
BCP0151001春节活动A高价值2023-10-15
BCP0151001春节活动A高价值2023-10-28
BCP0251002春节活动B中价值2023-10-05
BCP0251002春节活动B中价值2023-10-25
BCP0301003春节活动C中价值2023-10-25

期望得到:

iduser_idactivitycust_groupexpired_at
BCP0151001春节活动A高价值2023-10-28
BCP0251002春节活动B中价值2023-10-25
BCP0301003春节活动C中价值2023-10-25

使用row_number()over(partitioon by) 分组去重。

  select tt1.* from(select id, user_id, activity,cust_group,row_number() over(partition by concat(id,activity,cust_group)order by expired_at desc)as row_num from tb_acitivity_full)tt1 where tt1.row_num=1;

5、指标统计

GROUPING SETS,GROUPING__ID,CUBE,ROLLUP,这几个hive分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻( roll up )和下钻( drill down )的指标统计,比如,分小时、天、月的UV数。上钻是沿着维度的层次向上聚集汇总数据,下钻是在分析时加深维度,对数据进行层层深入的查看。通过逐层下钻,数据更加一目了然,更能充分挖掘数据背后的价值,及时做出更加正确的决策。

OLAP函数使用说明
GROUPING SETS根据不同的维度组合进行聚合,等价于将不同维度的GROUP BY结果集进行UNION ALL
GROUPING__ID表示结果属于哪一个分组集合,属于虚字段
CUBE可根据GROUP BY的维度的所有组合进行聚合
ROLLUP作为CUBE的子集,以最左侧的维度为主,从该维度进行层级聚合

如4所示,希望对指标值进行统计,期望结果:

indicatorenum_valuecount
idBCP0153
idBCP0252
idBCP0301
activity春节活动A3
activity春节活动B2
activity春节活动C1
cust_group高价值3
cust_group中价值3

通过grouping__id 内层SQL处理结果,表2:

groupIdidactivitycust_groupuv
1728id_BCP015NULLNULL3
1724id_BCP025NULLNULL2
1723id_BCP030NULLNULL1
2728NULLactivity_春节活动ANULL 3
2724NULLactivity_春节活动BNULL 2
2723NULLactivity_春节活动CNULL 1
3723NULLNULLcust_group_高价值3
3724NULLNULLcust_group_中价值3
select split(coalesce(id,activity,cust_group),'\\_')[0] as indicator,coalesce(split(id, '\\_')[1],split(activity, '\\_')[1],split(cust_group, '\\_')[1],) as enum_valuesum(uv) as countfrom (-- 内层SQL处理结果,对应上表2select grouping__id as groupId,concat('id|',id) as id,concat('activity|', activity) as activity,concat('cust_group|',cust_group) as cust_group,count(*) as uvfrom tb_acitivity_fullgroup by concat('id|',id),concat('activity|', activity),concat('cust_group|',cust_group)grouping sets(concat('id|',id),concat('activity|', activity),concat('cust_group|',cust_group))as tt1group by split(coalesce(id,activity,cust_group),'\\_')[0],coalesce(split(id, '\\_')[1],split(activity, '\\_')[1],split(cust_group, '\\_')[1],);

6、JSON数据处理

JSON数据作为数据存储和数据处理中最常见的结构化数据格式之一,许多场景下都会将数据以JSON格式存储在文件系统(HDFS/MINIO等)中,当构建数据仓库时,对JSON格式的数据进行处理和分析,就需要在Hive中使用对应函数对JSON格式的数据进行解析读取。
例如,JSON格式的数据如下:

商品ID商品名称额外信息
1001IP15“fixedIntegral”:200, “source”:“wechat”,“stages”:12}

获取商品可使用的固定积分:

select get_json_object(extra_json, '$fixedIntegral) as integral
from t_items;

7、替换

7.1 translate 函数用法
select translate('abcdef', 'adc', '19') tb_translate_exe
输出:
1b9ef
  • translate(input,from,to)
  • input:输入字符串
  • from:需要匹配的字符
  • to :用哪些字符来替换被匹配到的字符
    注意点:这里from的字符与to字符在位置上存在一 一对应关系,也就是from中每个位置上的字符用to中对应位置的字符替换。
7.1 regexp_replace 函数

正则替换

SELECT  aa,REGEXP_REPLACE(aa, '[a-z]', '')    -- 替换所有字母,REGEXP_REPLACE(aa, '[abc]', '')    -- 替换指定字母,REGEXP_REPLACE(aa, '[^abc]', '')    -- 替换所有非字母,REGEXP_REPLACE(aa, '[0-9]', '')    -- 替换所有数字,REGEXP_REPLACE(aa, '[\\s\\S]', '')    -- 替换空白符、换行,\\s:是匹配所有空白符,包括换行,\\S:非空白符,不包括换行。,REGEXP_REPLACE(aa, '\\w', '')    -- 替换所有字母、数字、下划线。等价于 [A-Za-z0-9_],REGEXP_REPLACE(aa, '[-8+]', '')    -- 只替换-8这个字符,REGEXP_REPLACE(aa, '[-8*]', '')    -- 替换-8、-、8这几个字符
FROM    (SELECT  '5e40b2b8-0916-42c0-899a-eaf4b2df 5268' AS aaUNION ALLSELECT  'c81b5906-38d7-482c-8b66-be5d3359cbf6' AS aaUNION ALLSELECT  '8856fd0a-2337-4605-963f-0d0d059b1937' AS aa) t
;
http://www.yayakq.cn/news/482771/

相关文章:

  • 湖北做网站价格淘宝客自己做网站
  • 福建大舟建设集团有限公司 网站中国企业信用信息查询网官网
  • 用c 可以做网站吗专为网站做点击量
  • 学校网站建设主要成绩热点事件舆情分析
  • 哪些网站做推广比较有效果手机百度2022年新版本下载
  • 网站建设过程规划和准备阶段宁波网站建设最好的是哪家
  • 绑定网站域名怎么做软件开发工具教材
  • 网站开发的规格描述深圳网站关键词推广
  • 国外访问国内网站速度深圳公司举报网站
  • 腾讯建设网站视频视频全国建设部官方网站
  • 手机版网站推荐想做一个网站
  • 如何写好网站建设方案详情页设计收费
  • 汽车保险网站wordpress放视频播放器
  • 营销型网站建设答辩免费企业查询网站
  • 网站用户 微信商城承德网站开发区地税
  • 为女人网上量体做衣网站wordpress 怎么学
  • 谷歌网站地图广东网页制作与网站建设
  • 网站备案 四川公司网站建设合同书
  • 南昌定制网站开发多少钱广东东莞直播基地
  • 网站设计联系做网站ps图片都是多大
  • 百度优化只做移动网站没有pc站叶县红色家园网站建设
  • 广州天河区网站建设哪些社交网站做外贸比较好
  • ftp 网站 怎么上传文件局域网视频网站建设
  • 长春高档网站建设常德网站制作公司
  • 简约大气的网站郑州专业网站制作
  • 编写网站策划书wordpress 文章链接
  • 网站百度排名查询网站增值服务
  • 企业手机网站建设联系方式广州网站设计公司兴田德润电话多少
  • 建网站多少钱php企业网站源码蓝色
  • 移动端网站开发技术asp.net企业网站模板