Uber 如何在 Apache Parquet 中使用 ZSTD 压缩减少大量存储空间实践
生成 TPCH 数据并导入到 Hive
Hive SQL迁移 Spark SQL 在网易传媒的实践
如何彻底解决 Hive 小文件问题
Hive SQL 迁移 Spark SQL 在滴滴的实践
Flink 1.11 与 Hive 批流一体数仓实践
从行存储到 RCFile,Facebook 为什么要设计出 RCFile?
图文介绍 SQL 的三种查询计划处理模型
下面文章您可能感兴趣
Apache Beam成为Apache顶级项目
北京第三次Spark meetup会议资料分享
atoi和itoa函数实现
Apache Spark 黑名单(Blacklist)机制介绍
Paxos Made Simple 译文
怎么在Idea IDE里面打开Spark源码而不报错
Spark源码分析之Worker
Hive中order by,Sort by,Distribute by和Cluster By介绍
Spark 从 Kafka 读数并发问题
Kafka集群Leader均衡(Balancing leadership)
Kafka集群调优
上海(Shanghai) Apache Spark Meetup第十四次聚会
Hadoop历史服务器详解
Apache Spark常见的三大误解
高速免费HTTP代理IP(2015-05-14更新)
Presto在字节跳动的内部实践与优化
nginx:按天自动切日志并压缩
Spark会把数据都载入到内存么
Hadoop2.2.0完全分布式集群平台安装与设置
SHC:使用 Spark SQL 高效地读写 HBase
发表我的评论
取消评论
提交评论
有人回复时邮件通知我
表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!
有人回复时邮件通知我
使用微博登录
使用GitHub登录
使用QQ登录