Uber 如何在 Apache Parquet 中使用 ZSTD 压缩减少大量存储空间实践

Spark Structured Streaming 2021年最新进展的总结

Spark Structured Streaming 2021年最新进展的总结

OPPO 大数据计算集群资源调度架构演进

OPPO 大数据计算集群资源调度架构演进

Linux 查看物理 CPU 个数、核数、逻辑 CPU 个数

Linux 查看物理 CPU 个数、核数、逻辑 CPU 个数

生成 TPCH 数据并导入到 Hive

生成 TPCH 数据并导入到 Hive

OPPO大数据离线计算平台架构演进

OPPO大数据离线计算平台架构演进

使用 Alluxio 实现 Presto Caching @ Uber

使用 Alluxio 实现 Presto Caching @ Uber

2021年最新美区 Apple ID 注册教程

2021年最新美区 Apple ID 注册教程

下面文章您可能感兴趣

使用 Python APIs 对 Delta Lake 表进行简单可靠的更新和删除操作

Apache Spark 3.0 动态分区裁剪（Dynamic Partition Pruning）介绍

Apache Flink状态管理和容错机制介绍

Presto 在有赞的实践之路

Spark函数讲解：combineByKey

Apache Spark 2.4 内置图像数据源介绍

Open Distro for Elasticsearch：AWS 自家版本的开源 ElasticSearch

在 json4s 中自定义 CustomSerializer

Java 14 将于3月17日正式发布，包含大量减少代码冗余的新特性

Flink快速上手之Scala API使用

Spark 2.1.0与CarbonData 1.0.0集群模式部署及使用入门指南

Hadoop2.2.0完全分布式集群平台安装与设置

Apache Spark 自定义优化规则：Custom Strategy

Spark 1.1.0中使用Hive注意事项

Delta Lake 0.5.0 正式发布，支持包括 Hive/Presto 等多种查询引擎

HBase 数据压缩介绍与实战

Spark Python API函数学习：pyspark API(1)

如何在Spark、MapReduce和Flink程序里面指定JAVA_HOME

Apache Cassandra 在 Facebook 的应用

Kafka原理与技术