18-模板方法模式

模板方法模式 题目链接 模板方法模式-咖啡馆 基本概念 模板方法模式(Template Method Pattern)是一种行为型设计模式, 它定义了一个算法的骨架,将一些步骤的实现延迟到子类。模板方法模式使得子类可以在不改变算法结构的情况下,重新定义算法中的某些步骤。【引用自大话设计第10章】 举

Kaze Published on 2024-12-01

21-责任链模式

责任链模式 题目链接 责任链模式-请假审批 基本概念 责任链模式是一种行为型设计模式,它允许你构建一个对象链,让请求从链的一端进入,然后沿着链上的对象依次处理,直到链上的某个对象能够处理该请求为止。 职责链上的处理者就是一个对象,可以对请求进行处理或者将请求转发给下一个节点,这个场景在生活中很常见,

Kaze Published on 2024-12-01

23-访问者模式

访问者模式 题目链接 访问者模式-图形的面积 基本概念 访问者模式(Visitor Pattern)是一种行为型设计模式,可以在不改变对象结构的前提下,对对象中的元素进行新的操作。 举个例子,假设有一个动物园,里面有不同种类的动物,比如狮子、大象、猴子等。每个动物都会被医生检查身体,被管理员投喂,被

Kaze Published on 2024-12-01

22-解释器模式

解释器模式 题目链接 解释器模式-数学表达式 基本概念 解释器模式(Interpreter Pattern)是一种行为型设计模式,它定义了一个语言的文法,并且建立一个【解释器】来解释该语言中的句子。 比如说SQL语法、正则表达式,这些内容比较简短,但是表达的内容可不仅仅是字面上的那些符号,计算机想要

Kaze Published on 2024-12-01

Hive

Hive入门 什么是Hive Hive是由Facebook开源,基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 Hive的本质是一个Hadoop客户端,用于将HQL(Hive SQL)转化成MapReduce程序。 Hive中每张表的数据存储在HDF

Kaze Published on 2023-11-22

SparkStreaming

概述 什么是Spark Streaming Spark Streaming 用于流式数据的处理,是对Spark Core的拓展。 Spark Streaming 使用离散化流(discretized stream)作为抽象表示,叫作 DStream。 DStream 是随时间推移而收到的数据的序列。

Kaze Published on 2023-11-14

SparkSQL

概述 什么是SparkSQL Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块。 Hive and SparkSQL Hive 和 SparkSQL都是通过SQL进行操作,Hive主要用于操作MapReduce,SparkSQL主要用于操作

Kaze Published on 2023-11-09

SparkCore

概述 什么是Spark Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 Spark and Hadoop Spark 出现的时间相对较晚,并且主要功能是用于数据计算, 所以 Spark 一直被认为是 Hadoop MapReduce 的升级版。 Spark和Hadoop的根本差

Kaze Published on 2023-11-07

Hadoop-HDFS

概念 HDFS(Hadoop Distributed File System),Hadoop分布式文件系统 HDFS的使用场景: 适合一次写入,多次读出的场景。 HDFS的优点: 高容错性 适合处理大数据 可构建在廉价机器上,通过多副本机制,提高可靠性 HDFS的缺点: 不适合低延时数据访问 无法高

Kaze Published on 2023-10-20

Hadoop-MapReduce

MapReduce概述 定义 MapReduce是一个分布式运算程序的编程框架 优缺点 优点: 易于编程 良好的拓展性 高容错性 适合PB级以上海量数据的离线处理 缺点: 不擅长实时计算 不擅长流式计算 不擅长DAG(有向无环图)计算 MapReduce进程 一个完整的MapReduce程序在分布式

Kaze Published on 2023-10-20
Previous Next