SparkStreaming

概述 什么是Spark Streaming Spark Streaming 用于流式数据的处理,是对Spark Core的拓展。 Spark Streaming 使用离散化流(discretized stream)作为抽象表示,叫作 DStream。 DStream 是随时间推移而收到的数据的序列。

Kaze Published on 2023-11-14

SparkSQL

概述 什么是SparkSQL Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块。 Hive and SparkSQL Hive 和 SparkSQL都是通过SQL进行操作,Hive主要用于操作MapReduce,SparkSQL主要用于操作

Kaze Published on 2023-11-09

SparkCore

概述 什么是Spark Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 Spark and Hadoop Spark 出现的时间相对较晚,并且主要功能是用于数据计算, 所以 Spark 一直被认为是 Hadoop MapReduce 的升级版。 Spark和Hadoop的根本差

Kaze Published on 2023-11-07