当前位置: 首页 > news >正文

珠海免费网站建设票务网站开发

珠海免费网站建设,票务网站开发,深圳公明做网站,软件开发工作流程文章目录 一、RDD#flatMap 方法1、RDD#flatMap 方法引入2、解除嵌套3、RDD#flatMap 语法说明 二、代码示例 - RDD#flatMap 方法 一、RDD#flatMap 方法 1、RDD#flatMap 方法引入 RDD#map 方法 可以 将 RDD 中的数据元素 逐个进行处理 , 处理的逻辑 需要用外部 通过 参数传入 map…

文章目录

  • 一、RDD#flatMap 方法
    • 1、RDD#flatMap 方法引入
    • 2、解除嵌套
    • 3、RDD#flatMap 语法说明
  • 二、代码示例 - RDD#flatMap 方法





一、RDD#flatMap 方法




1、RDD#flatMap 方法引入


RDD#map 方法 可以 将 RDD 中的数据元素 逐个进行处理 , 处理的逻辑 需要用外部 通过 参数传入 map 函数 ;

RDD#flatMap 方法在 RDD#map 方法 的基础上 , 增加了 " 解除嵌套 " 的作用 ;

RDD#flatMap 方法 也是 接收一个 函数 作为参数 , 该函数被应用于 RDD 中的每个元素及元素嵌套的子元素 , 并返回一个 新的 RDD 对象 ;


2、解除嵌套


解除嵌套 含义 : 下面的的 列表 中 , 每个元素 都是一个列表 ;

lst = [[1, 2], [3, 4, 5], [6, 7, 8]]

如果将上述 列表 解除嵌套 , 则新的 列表 如下 :

lst = [1, 2, 3, 4, 5, 6, 7, 8]

RDD#flatMap 方法 先对 RDD 中的 每个元素 进行处理 , 然后再 将 计算结果展平放到一个新的 RDD 对象中 , 也就是 解除嵌套 ;

这样 原始 RDD 对象 中的 每个元素 , 都对应 新 RDD 对象中的若干元素 ;


3、RDD#flatMap 语法说明


RDD#flatMap 语法说明 :

newRDD = oldRDD.flatMap(lambda x: [element1, element2, ...])

旧的 RDD 对象 oldRDD 中 , 每个元素应用一个 lambda 函数 , 该函数返回多个元素 , 返回的多个元素就会被展平放入新的 RDD 对象 newRDD 中 ;


代码示例 :

# 将 字符串列表 转为 RDD 对象
rdd = sparkContext.parallelize(["Tom 18", "Jerry 12", "Jack 21"])# 应用 map 操作,将每个元素 按照空格 拆分
rdd2 = rdd.flatMap(lambda element: element.split(" "))




二、代码示例 - RDD#flatMap 方法



代码示例 :

"""
PySpark 数据处理
"""# 导入 PySpark 相关包
from pyspark import SparkConf, SparkContext
# 为 PySpark 配置 Python 解释器
import os
os.environ['PYSPARK_PYTHON'] = "Y:/002_WorkSpace/PycharmProjects/pythonProject/venv/Scripts/python.exe"# 创建 SparkConf 实例对象 , 该对象用于配置 Spark 任务
# setMaster("local[*]") 表示在单机模式下 本机运行
# setAppName("hello_spark") 是给 Spark 程序起一个名字
sparkConf = SparkConf() \.setMaster("local[*]") \.setAppName("hello_spark")# 创建 PySpark 执行环境 入口对象
sparkContext = SparkContext(conf=sparkConf)# 打印 PySpark 版本号
print("PySpark 版本号 : ", sparkContext.version)# 将 字符串列表 转为 RDD 对象
rdd = sparkContext.parallelize(["Tom 18", "Jerry 12", "Jack 21"])# 应用 map 操作,将每个元素 按照空格 拆分
rdd2 = rdd.flatMap(lambda element: element.split(" "))# 打印新的 RDD 中的内容
print(rdd2.collect())# 停止 PySpark 程序
sparkContext.stop()

执行结果 :

Y:\002_WorkSpace\PycharmProjects\pythonProject\venv\Scripts\python.exe Y:/002_WorkSpace/PycharmProjects/HelloPython/hello.py
23/07/31 23:02:58 WARN Shell: Did not find winutils.exe: java.io.FileNotFoundException: java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are unset. -see https://wiki.apache.org/hadoop/WindowsProblems
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
23/07/31 23:02:59 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
PySpark 版本号 :  3.4.1
['Tom', '18', 'Jerry', '12', 'Jack', '21']Process finished with exit code 0

在这里插入图片描述

http://www.yayakq.cn/news/965451/

相关文章:

  • 个人的网站建设目标深圳网站制作公司在那
  • 十大纯净系统网站互联网公司简介ppt范本
  • 在百度搜不到网站南山网站-建设深圳信科
  • 网站集约化建设较好的城市永康网站建设服务
  • 何如做外贸网站推网怎么用源码做网站视频
  • 怎么网站建设WordPress访问ip记录
  • 建网站怎么选择服务器淮南查查网
  • 做国际贸易都用什么网站专业网站建设最权威
  • 网站维护是什么意思wordpress主题 missoften
  • 网站为何不显示百度商桥对话框网络推广的方法有哪几种
  • 随州网站建设外包公司wordpress文章图片点击放大浏览
  • o2o网站建设代理商网络营销工具的使用
  • 哪些网站不能备案注册公司网上申请
  • 博罗做网站公司网站建设与管理考题
  • 柒零叁网站建设湖南长沙网络维护是什么意思
  • 买外贸服装去哪个网站网站开发需要掌握的哪些开发软件
  • 语文建设编辑部官方网站建设部门电工证查询网站
  • 做标志的好网站seo如何网站正常更新
  • 湖州医院网站建设方案wordpress页眉登录
  • 江苏有什么网站找工程建设人员西安企业网站建设
  • 汕头网站设计有限公司邢台网站建设公司
  • 番禺网站建设培训班那里可以做app网站
  • 谁给个网站啊急急急2021php是世界上最好的语言
  • 春季高考网站建设济南网站建设新风向
  • 成品网站建设无锡公司网站建设服务
  • 深圳网站建设怎么办长沙推广优化公司
  • 建站公司哪家做出来的网站好wordpress 作者 英文
  • 红河个旧网站建设邮局网站建设的目的
  • 建设网站以后怎么让百度收录呢电脑网页怎么下载视频
  • 专门做金融的招聘网站网站制作租用空间