当前位置: 首页 > news >正文

赣州市网站建设公司华为网络工程师培训费用

赣州市网站建设公司,华为网络工程师培训费用,济南网站建设的公司,wordpress 附件插件SparkSQL和Hive语法差异 1、仅支持Hive SparkSQL关联条件on不支持函数rand()创建零时表时,Spark不支持直接赋值nullSpark无法读取字段类型为void的表SparkSQL中如果表达式没有指定别名,SparkSQL会将整个表达式作为别名,如果表达式中包含特殊…

SparkSQL和Hive语法差异

1、仅支持Hive

  1. SparkSQL关联条件on不支持函数rand()
  2. 创建零时表时,Spark不支持直接赋值null
  3. Spark无法读取字段类型为void的表
  4. SparkSQL中如果表达式没有指定别名,SparkSQL会将整个表达式作为别名,如果表达式中包含特殊字符(如逗号)。则CTAS建表会失败

2、仅支持SparkSQL

SparkSQL允许在join on条件中使用or等不等式值关联语句,Hive中不允许,只能用等值关联

3、相同函数差异

  1. Spark运行时用到的hash函数,与hive的哈希算法不同,如果使用hash(),结果和hive的hash()会有差异
  2. Hive和sparkSQL使用grouping sets生成的grouping_id不一致
  3. regexp_extract未匹配上的话,hive里回的是null,但是在spark里返回的是空字符
  4. sparkSQL中的row_number的over中不能省略sort by 或order by
  5. grouping_id()函数生成的数据不同
  6. reflect()函数中,如果入参有非法数据或者null,hive会返回null,而spark会抛出异常

创建DataFrame

Row 类型 表示一行数据

  • datafram就算是多行构成
# Row行数据操作
# 导入行类
from pyspark.sql import Row定义每行数据 有两种获取方法=重点
r1 = Row(id=1,name='张三')
r2 = Row(id=2,name='李四')
# 操作每行数据
# 获取对应字段数据
print(r1.id)
print(r1.name)
print(r2['id'])
print(r2['name'])定义行数据不指定字段 = 只有一种获取方法
r3 = Row(3,'王五')
print(r3[1])df.printSchema()

schema表信息(这种指定表信息的更不常用

  • 定义dataframe中的表的字段名和字段类型
# 导入数据类型
from pyspark.sql.types import *
# 定义schema信息
# 使用StructType类进行定义
# add()方法是指定字段信息
# 第一参数,字段名
# 第二个参数,字段信息
# 第三个参数是否允许为空值  默认是True,允许为空
schema_type = StructType().\add('id',IntegerType()).\add('name',StringType()).\add('age',IntegerType(),False)df.printSchema()
# 导入行类Row
from pyspark.sql import SparkSession, Row
from pyspark.sql.types import *# 创建行数据
r1 = Row(id=1, name='张三', age=20)
r2 = Row(id=2, name='李四', age=22)
# 创建元数据
schema = StructType(). \add('id', IntegerType()). \add('name', StringType()). \add('age', IntegerType())# 创建dataframe
# 生成sparksession对象  按照固定写法创建
ss = SparkSession.builder.getOrCreate()
# 使用sparksession对象方法创建df
# createDataFrame 第一参数是一个列表数据,将每行数据放入列表
# 第二个参数指定表元数据信息
# df是一个dataframe类型的对象
df = ss.createDataFrame([r1, r2], schema=schema)# dataframe数据的操作
# 查看df数据
df.show()  # 查看所有数据,超过20行时,默认只显示20行
# 查看元信息
df.printSchema()
http://www.yayakq.cn/news/120605/

相关文章:

  • 如何设计公司官网站易语言怎么用网站做背景音乐
  • 长沙网站建设 599在线免费开网站
  • 网站建设好了怎么发布平台搭建与拆除
  • 网站运营做网页设计wordpress heroku
  • 事业单位网站建设算固定资产吗企业门户网站网站怎么获得
  • 网站欣赏网站欣赏网页设计主题描述
  • 网站后台管理系统 静态页面青铜峡建设局网站
  • 服装时尚网站沈阳人流
  • 免费网站建设开发中国建筑装饰网下载
  • qq空间网站根目录搜索引擎原理
  • 做视频点播网站要多少带宽简单响应式网站设计代码
  • 极简建站开发网站开票名称是什么原因
  • 毕业设计做一个网站怎么做wordpress 文章密码
  • 网站 成功因素商务网站教程
  • 四川大学官方网站规划建设处柳州网站seo网站s
  • 原创设计师品牌网站网站如何制作多少钱
  • 开设网站需要什么旅游网站前端模板
  • 教做湘菜的视频网站网站让图片充满屏幕怎么做
  • 莱芜市住房和城乡建设厅网站正邦设计招聘
  • 公司网站建设费用入账用vultr做网站
  • vs做网站通过e浏览器代理行业门户网站
  • 做竞价网站 要注意什么域名ip
  • 永乐网站建设卢氏住房和城乡建设厅网站
  • 网站分为wordpress换主题了
  • asp网站源代码vs做网站通过e浏览器
  • 长沙企业网站建设优度个人备案用作资讯网站
  • 企业网站建站费用金蝶软件收费价目表
  • 石铜路网站建设自助建网站代理
  • 公司宣传网站dede网站安全设置
  • 常州网站建设网站无极兼职网