Uber 如何在 Apache Parquet 中使用 ZSTD 压缩减少大量存储空间实践
Spark Structured Streaming 2021年最新进展的总结
OPPO 大数据计算集群资源调度架构演进
Linux 查看物理 CPU 个数、核数、逻辑 CPU 个数
生成 TPCH 数据并导入到 Hive
OPPO大数据离线计算平台架构演进
使用 Alluxio 实现 Presto Caching @ Uber
2021年最新美区 Apple ID 注册教程
下面文章您可能感兴趣
使用 Python APIs 对 Delta Lake 表进行简单可靠的更新和删除操作
Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)介绍
Apache Flink状态管理和容错机制介绍
Presto 在有赞的实践之路
Spark函数讲解:combineByKey
Apache Spark 2.4 内置图像数据源介绍
Open Distro for Elasticsearch:AWS 自家版本的开源 ElasticSearch
在 json4s 中自定义 CustomSerializer
Java 14 将于3月17日正式发布,包含大量减少代码冗余的新特性
Flink快速上手之Scala API使用
Spark 2.1.0与CarbonData 1.0.0集群模式部署及使用入门指南
Hadoop2.2.0完全分布式集群平台安装与设置
Apache Spark 自定义优化规则:Custom Strategy
Spark 1.1.0中使用Hive注意事项
Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎
HBase 数据压缩介绍与实战
Spark Python API函数学习:pyspark API(1)
如何在Spark、MapReduce和Flink程序里面指定JAVA_HOME
Apache Cassandra 在 Facebook 的应用
Kafka原理与技术
发表我的评论
取消评论
提交评论
有人回复时邮件通知我
表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!
有人回复时邮件通知我
使用微博登录
使用GitHub登录
使用QQ登录