自学内容网 自学内容网

了解Hadoop

发展历程:

单机数据系统

localFS单机存储、SQL单机计算

分布式系统:

扩展数据存储Hadoop:基于磁盘:Hadoop核心【HDFS分布式文件系统、MapReduce分布式计算框架、资源管理和任务调度】+SQL on Hadoop【Hive、Impala、Presto】:

扩展数据计算spark:基于内存:spark核心+sparkSQL+sparkStreaming+MLlib+Graphx


原文地址:https://blog.csdn.net/qq_33803292/article/details/144687263

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!