共有14个分类
大数据 (44)
- 2024/02/25 Iceberg 简单总结
- 2024/02/19 Data Ingestion: Tool Selection Strategy
- 2024/01/15 Data Ingestion: Architectural Patterns
- 2024/01/14 Hive MetaStore的实现和优化
- 2024/01/10 Analyzing and Comparing Lakehouse Storage Systems
- 2024/01/05 Doris Advanced
- 2024/01/05 Doris Basic
- 2023/12/01 Impala Tuning Summary
- 2023/11/19 The History of Big data
- 2023/11/09 TPCx-HS优化总结
- 2023/09/24 Gluten源码结构
- 2023/09/02 Ambari架构
- 2023/08/27 Gluten和相关依赖
- 2023/07/23 大数据采集
- 2023/07/12 Presto在各大公司的应用
- 2023/06/30 Spark性能调优
- 2023/05/14 资源隔离修改配置动态加载
- 2023/05/13 资源隔离设计
- 2023/05/12 镜像合并&配置文件同步
- 2023/01/02 Photon A Fast Query Engine for Lakehouse Systems
- 2022/11/18 MillWheel
- 2022/11/10 FlumeJava: Easy, Efficient Data-Parallel Pipelines
- 2022/11/05 Apache Flink™: Stream and Batch Processing in a Single Engine
- 2022/09/18 高可用设计
- 2022/08/01 Kyuubi设计调研
- 2022/07/02 Snowflake论文
- 2022/07/01 Spark SQL论文
- 2022/06/24 Delta Lake论文
- 2022/06/05 自定义HiveServer设计
- 2022/04/20 BigTable论文
- 2022/04/20 MapReduce论文
- 2022/04/13 GFS论文
- 2022/03/26 MapRedue是一个巨大的退步
- 2022/03/20 Hive论文
- 2022/03/06 Spark逻辑计划的解析
- 2022/03/04 Spark的注入规则
- 2022/02/20 Kudu论文翻译
- 2022/02/13 Kudu的模型设计
- 2022/01/25 几种开源数据库对元数据的管理
- 2021/12/27 统一查询项目整合Calcite
- 2021/12/26 统一查询项目介绍
- 2021/12/26 QuickSQL执行过程
- 2021/11/22 Alluxio论文
- 2021/11/06 Spark论文
数据库 (38)
- 2023/06/01 BitWeaving: Fast Scans for Main Memory Data Processing
- 2023/05/28 Cache Conscious Indexing for Decision-Support in Main Memory
- 2023/05/26 Column Imprints: A Secondary Index Structure
- 2023/05/24 SQL Server Column Store Indexes
- 2023/05/22 Bitmap Index Design and Evaluation
- 2023/05/17 Column Sketches: A Scan Accelerator for Rapid and Robust Predicate Evaluation
- 2023/05/13 Optimal Column Layout for Hybrid Workloads
- 2023/05/07 Column-Stores vs. Row-Stores: How Different Are They Really?
- 2023/05/06 Lakehouse A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
- 2023/05/04 Building An Elastic Query Engine on Disaggregated Storage
- 2023/05/03 What Goes Around Comes Around
- 2023/03/20 bustub数据库
- 2023/02/08 CPU and Cache Efficient Management of Memory-Resident Databases
- 2023/02/05 Efficiently Compiling Efficient Query Plans for Modern Hardware
- 2023/02/04 Generating code for holistic query evaluation
- 2023/02/01 Implementing Database Operations Using SIMD Instructions
- 2023/01/27 Rethinking SIMD Vectorization for In-Memory Databases
- 2023/01/19 SIMD-Scan: Ultra Fast in-Memory Table Scan using onChip Vector Processing Units
- 2023/01/17 Make the most out of your SIMD investments: counter control flow divergence in compiled query pipelines
- 2023/01/13 Accelerating Analytics with Dynamic In-Memory Expressions
- 2023/01/07 Materialization Strategies in the Vertica Analytic Database: Lessons Learned
- 2023/01/05 MonetDB/X100: Hyper-Pipelining Query Execution
- 2023/01/03 Access Path Selection in Main-Memory Optimized Data Systems Should I Scan or Should I Probe
- 2022/11/20 调试MySQL
- 2022/09/03 Architecture of a Database System论文翻译
- 2022/08/11 确定要在DBMS中用mmap吗
- 2022/08/08 为何Uber要将PostgreSQL迁到MySQL
- 2022/07/30 容灾部署调研
- 2022/07/03 What's Really New with NewSQL论文
- 2021/12/30 数据迁移工具DB-bridge
- 2021/12/29 HANA调研
- 2021/12/28 Teradata调研
- 2021/11/26 HANA和TeraData数据库迁移调研
- 2021/11/26 TPC-DS
- 2021/11/26 A Critique of ANSI SQL Isolation Levels论文
- 2021/10/11 TD-SQL-PG版总结
- 2021/10/09 TD-SQL总结-MySQL版
- 2021/09/22 TD-SQL调研
原理分析 (13)
- 2023/04/14 LevelDB 多版本和压缩
- 2023/04/11 LevelDB 辅助工具类
- 2023/04/09 LevelDB SSTable模块
- 2023/04/06 LevelDB MemTable模块
- 2023/04/03 LevelDB Log模块
- 2023/03/30 LevelDB 公开的接口
- 2023/03/27 LevelDB 基本概念
- 2023/01/01 MySQL的并发
- 2022/12/22 MySQL的恢复
- 2022/12/19 MySQL的缓存
- 2022/12/15 MySQL查询分析
- 2022/12/13 用工具分析MySQL存储文件
- 2022/12/02 MySQL文件存储结构
旅行 (12)
- 2023/10/07 热带城市-西双版纳
- 2021/10/10 多彩的黔东南
- 2021/10/04 朝鲜之行
- 2021/10/03 日本之行
- 2021/10/02 丽江之行
- 2021/10/01 海边的亚庇
- 2021/09/30 多瑙河畔的布达佩斯
- 2021/09/29 城中国梵蒂冈
- 2021/09/28 永恒之城罗马
- 2021/09/27 水上的威尼斯(下)
- 2021/09/27 水上的威尼斯(上)
- 2021/09/23 越南海边城市岘港
读书笔记 (12)
- 2023/05/21 Advanced Database Systems: History of Databases
- 2023/01/22 Advanced Database Systems: Query Execution & Processing
- 2022/11/13 CMU数据库总结
- 2022/07/22 卡内基梅隆的数据库课程-1
- 2022/07/04 卡内基梅隆的数据库课程-2
- 2022/07/04 卡内基梅隆的数据库课程-3
- 2022/07/04 卡内基梅隆的数据库课程-4
- 2022/07/04 卡内基梅隆的数据库课程-5
- 2022/07/02 PingCAP提供的数据库学习资料
- 2021/12/19 分布式数据库课程中的论文
- 2021/12/02 数据密集型应用设计读书笔记
- 2021/12/01 UNIX环境高级编程读书笔记
算法 (8)
- 2022/10/15 B+树执行过程
- 2022/01/23 LR算法
- 2022/01/08 用DFA验证字符串中的数字
- 2021/11/03 LFU缓存
- 2021/10/21 N皇后
- 2021/10/20 两个有序数组的中位数
- 2021/10/16 马拉车算法
- 2021/10/05 莫里斯遍历
系统 (7)
- 2024/01/07 系统调优
- 2023/09/09 xsimd
- 2022/11/17 How to Read a Paper
- 2022/10/16 容器网络
- 2022/09/18 k8s POD使用总结
- 2022/02/26 用javacc实现四则运算
- 2021/10/10 从汇编角度看程序的执行
分布式 (6)
- 2022/06/16 Chubby论文
- 2022/06/05 Raft A Consensus Algorithm for Replicated Logs记录
- 2022/05/16 Raft论文
- 2022/05/15 Multi Paxos总结
- 2022/05/14 Basic Paxos总结
- 2022/05/01 Paxos Made Simple论文
编程语言 (5)
- 2023/10/29 C++模版的一些记录
- 2023/09/17 左值右值
- 2023/07/22 JVM GC 介绍
- 2022/05/02 Java的APM工具原理
- 2022/02/24 scala的一些特性
商业 (3)
文学和艺术 (3)
- 2023/12/31 难忘的时刻(2023年)
- 2022/12/11 一本书、一部电影(2022年)
- 2021/10/16 推荐一些不错的韩国电影
行业观察 (3)
- 2024/02/02 Data engineering at Meta
- 2023/12/09 网易对Impala的一些使用
- 2023/03/26 OceanBase开发者大会分享
随便写写 (3)
架构 (2)
- 2022/11/18 关于云环境中多租户问题的论文
- 2021/09/27 微服务的设计的IDEALS