• pdf 文档 這些年,我們一起追的Hadoop

    0 码力 | 74 页 | 45.76 MB | 1 年前
    3
    文档介绍了Hadoop的起源、发展历程及其核心组件。Hadoop由Doug Cutting主导开发,最初源自Lucene和Nutch项目,2006年从Nutch独立出来,并于2008年成为Apache顶级项目。Hadoop通过MapReduce进行批处理,通过YARN支持多种处理方式,将Hadoop从批处理应用转变为数据操作系统,支持交互式SQL查询等功能。Hadoop的生态系统包括HDFS、Hive、Tez、Impala等工具,广泛应用于大数据处理。
共 1 条
  • 1
前往