这是我第一篇博客 测试项目标识 1 2 3
用于OLAP(在线分析处理)的开源列式【数据库管理系统】 重点 列式存储 — 只需几列字段时,可以从对应列文件读取,大大减少I/O 字段压缩 — 相同列数据类型相同,所以可以压缩,极大减少数据存储空间,减少磁盘I/O 表引擎不同引擎决定了数据怎么存储、查询 MergeTree Replac...
Spark中间结果保存在内存,延迟小 task以线程方式,任务启动快 核心概念RDD弹性分布式数据集(只封装计算逻辑,不保存数据) 不可变 可分区 并行计算 spark最基本的数据抽象 这个抽象的数据模型,让使用者可以不必关心底层数据是分布式的只需关心如何把应用逻辑转化为一系列转换函数,进而实现管道化,...
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in trouble...
Page 1 / 1