Hopeful Nick


  • 首页

  • 标签

  • 归档

  • 关于

Spark SQL 3.0 Join Hints

发表于 2021-01-16 | 分类于 Spark |

Broadcast Hash Join

要求其中一侧数据量小,没有Shuffle,没有Sort

阅读全文 »

Spark 3.0 自适应查询执行

发表于 2020-12-31 | 分类于 Spark |

1 背景

  • 深入研究的数据库文献
  • Spark1.6概念引入
  • Intel原型和实验的New AQE
  • Databricks和Intel协作的Spark 3.0中的New AQE
阅读全文 »

Spark SQL 3.0 性能提升概览

发表于 2020-12-27 | 分类于 Spark |

归纳为4类:开发交互、动态优化、Catalyst提升和框架更新

阅读全文 »

Spark SQL查询解析

发表于 2020-12-16 | 分类于 Spark |

1 文本到执行计划

两个阶段:

  • 词法分析:从SQL字符串到标识集合,使用词法分析器Lexer
  • 语法分析:从标识集合到抽象语法树,使用语法分析器Parser
阅读全文 »

Spark SQL语法解析

发表于 2020-12-07 | 分类于 Spark |

1 从文本到执行计划

主要由两步组成:

  • 词法分析:将文本解析解析为标识。
  • 语法分析:将标识解析为抽象语法树。
阅读全文 »

查询性能优化

发表于 2020-10-25 | 分类于 高性能MySQL |

查询优化、索引优化和库表结构优化需要齐头并进。

阅读全文 »

数据库锁

发表于 2020-10-21 | 分类于 数据库 |

1 分类

阅读全文 »

拉链表

发表于 2020-10-17 | 分类于 数据仓库 |

1 定义

使用生效时间和失效时间两个字段来标记数据的历史状态,从而在节省存储空间的效果下保留数据的历史状态。

阅读全文 »

AbstractQueuedSynchronizer(AQS)

发表于 2020-10-10 | 分类于 Java |

1 定义

提供一种原子式管理同步状态、阻塞和唤醒线程功能,以及队列模型的简单框架。

Java中大部分同步类(Lock、Semaphoer、ReentrantLock等)都是基于AQS实现的。

阅读全文 »

Spark 3.0

发表于 2020-09-29 | 分类于 Spark |

1 特性

阅读全文 »
1…678…17
Hopeful Nick

Hopeful Nick

To Explore

161 日志
35 分类
42 标签
GitHub E-Mail
© 2022 Hopeful Nick
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4