当前位置: 首页 > news >正文

免费软件制作网站模板临沂百度网站推广

免费软件制作网站模板,临沂百度网站推广,wordpress 固定链接 分类,seo博客网站一、RDD对象 PySpark支持多种数据的输入,在输入完成后,都会得到一个:RDD类的对象 RDD全称为:弹性分布式数据集(Resilient Distributed Datasets) PySpark针对数据的处理,都是以RDD对象作为载…

一、RDD对象

PySpark支持多种数据的输入,在输入完成后,都会得到一个:RDD类的对象

RDD全称为:弹性分布式数据集(Resilient Distributed Datasets)

PySpark针对数据的处理,都是以RDD对象作为载体,即:

  • 数据存储在RDD内
  • 各类数据的计算方法,也都是RDD的成员方法
  • RDD的数据计算方法,返回值依旧是RDD对象

40cb420610664ebc8eed66760c45c62b.png

        PySpark的编程模型可以归纳为:准备数据到RDD -> RDD迭代计算 -> RDD导出为list、文本文件等,即:源数据 -> RDD -> 结果数据

二、Python数据容器转RDD对象

        PySpark支持通过SparkContext对象的parallelize成员方法,将:list、tuple、set、dict、str转换为PySpark的RDD对象

3679f65e4a844246bd4cdae1dcba74cf.png

         PySpark也支持通过SparkContext入口对象,来读取文件,来构建出RDD对象。

fc7f66772cdf441a8a7cf77a8bcdcc0b.png

代码案例:

"""
#通过PySpark代码加载数据,即数据输入
"""
from pyspark import SparkConf,SparkContext
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")
sc = SparkContext(conf = conf)# 通过parallelize方法将Python对象加载到Spark内,成为RDD对象
rdd1 = sc.parallelize([1, 2, 3, 4, 5])
rdd2 = sc.parallelize((1, 2, 3, 4, 5))
rdd3 = sc.parallelize("abcdefg")
rdd4 = sc.parallelize({1, 2, 3, 4, 5})
rdd5 = sc.parallelize({"key1": "value1", "key2": "value2"})# 如果要查看RDD里面有什么内容,需要用collect()方法
print(rdd1.collect())
print(rdd2.collect())
print(rdd3.collect())
print(rdd4.collect())
print(rdd5.collect())

打印结果:

8acffe7a3ba04323a5d04dac1d4d86e0.png

pyspark安装方法 :

第一种方法时命令行安装:pip install pyspark;

第二种方式是直接在Pycharm进行安装,如下图所示;

a231807459f74d538bd57dcef43b4058.png

33537244fa3f43548a6c773a47d30627.png

        安装完成后,运行代码出现缺少Java环境依赖,需要配置java运行环境才可以运行Pyspark导入报对象,配置环境的过程可以参考博客教程:

java 环境配置(详细教程)_java环境配置_多加点辣也没关系的博客-CSDN博客

JDK 8.0 的安装包已上传资源包,希望可以帮助到大家!

f0c9da8980984f24bac46648ed89e3e4.gif

 

http://www.yayakq.cn/news/957835/

相关文章:

  • 网站建设硬件预算wordpress 评论可见
  • 在上海哪个网站比较好上海网络推广竞价公司
  • 建设网站用动态ip还是静态ip单页网站对攻击的好处
  • 大连网站建设方案维护广州网站建设方案维护
  • 做系统和做网站哪个简单一些wordpress使用不同的全局样式
  • 北京网页设计公司网站企业官方网站怎么写
  • 网站注册账号有风险吗做网站运营的职业生涯规划
  • python怎么做抢课网站WordPress链接公众号插件
  • 如何做高网站的浏览量忠县网站建设
  • 集团做网站需要多大的带宽wap网站建设教程
  • 在线视频网站怎么做seo中山有哪些网站建立公司
  • 用sql网站建设基本流程巩义网站建设定制
  • 海关年检要去哪个网站上做竞价托管外包服务
  • 佳木斯市城乡建设局网站优化seo是什么意思
  • 会展行业门户网站建设个人风采网站制作
  • 开发一套网站价格广西住房城乡建设厅网站首页
  • 电子商务网站的设计要求包括宁波建站服务
  • 手表交易网站广州企业搜索引擎优化服务
  • 龙华做网站天无涯网络广州网站优化公司
  • wordpress 导航站阿里巴巴网站建设要多少钱
  • 做网站工作室北京最新防疫信息
  • 哪个网站能接施工图来做网络营销与直播电商专业
  • 著名网站建设公司wordpress 分类 如何修改
  • 网站制作留钱seo方法培训
  • 网站做推广需要什么条件泾川门户网
  • 怀化高速网站企业官方网站建设教程
  • 网站管理系统是什么网站开发科技公司
  • 电商平台网站制作费用教育平台网站开发
  • 网站开发专业简历打开一个网站搜索页面跳转js
  • 北京上云科技网站建设有深度的公司名字