Hadoop 概述
定义,辅之以自动化(机器脱离人类自主运转)企业在其周边(围绕着 一个空间)所开发的应用程序。 以 Apache 的多种可用产品和大量供应商提供的将 Hadoop 与企 业工具相集成的解决方案为基础,Hadoop 的开放源码和企业生态系 统还在不断成长。HDFS是该生态系统的主要组成部分。由于Hadoop 有着低廉的商业成本,因此很容易去探索 Hadoop 的特性,无论是 通过虚拟机,还是在现有环境建立混合生态系统。使用 用开源的集成工具在无须编写代码的情况下即可轻松地将 Apache Hadoop 连接到数百种数据系统。如果你的职业不是程序员或开发人 员,那么这点对你来说无疑是使用 Hadoop 的加分项。大多数供应 商使用各种开放源码解决方案用于数据集成,这些解决方案原生支 持 Apache Hadoop,包括为 HDFS、HBase、Pig、Sqoop 和 Hive 提 供连接器(见图 1-6)。 基于 Hadoop0 码力 | 17 页 | 583.90 KB | 1 年前3
共 1 条
- 1