自学内容网 自学内容网

大数据最佳实践

本文主要收录一些大数据不错的实践文章

1、数禾云上数据湖最佳实践 

https://blog.51cto.com/u_15089766/2601706

该文章介绍了数禾云的数据胡实践,包含presto以及数据湖等组件的一些部署架构,文章听不错的,里面提到了为了避免presto与yarn计算资源之间的互相影响,独立部署了presto集群与hadoop集群

2、Presto高性能引擎在美图的实践 https://jonhuster.blog.csdn.net/article/details/136487794

 该文介绍了美图在presto上的一些应用实践

3、大数据存储加速与服务化在Shopee的实践 【Shopee】大数据存储加速与服务化在Shopee的实践 - 从大数据到人工智能

该文介绍了 Shopee在大数据查询上一些优化实践,涉及到presto、Alluxio 等,涉及到一些功能的自定义扩展

4、从 Hadoop 到云原生, 大数据平台如何做存算分离 从 Hadoop 到云原生, 大数据平台如何做存算分离 - JuiceFS 博客

本文介绍大数据行业近几年讨论较多的存算分离的实践,主要是对象存储+JuiceFS

5、Presto在滴滴的探索与实践 Presto在滴滴的探索与实践

本文介绍滴滴公司在 Presto上的一些实践经验


原文地址:https://blog.csdn.net/john1337/article/details/136496221

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!