Hadoop 迁移到阿里云MaxCompute 技术方案
................................................................................. 18 4.2.2 数据迁移自动化 .................................................................................................. 分析与报表:对数据进行分析和展现以获取洞察。如 BI 工具、jupyter 等。 数据作业编排:将多个数据处理动作(数据移动、处理转换等)编排成为工作流并周期性地 执行以实现数据处理工作的自动化。如 Apache Oozie、Sqoop 等。 2.1.2 开源大数据组件架构 Alibaba Cloud MaxCompute 解决方案 9 2.1.3 阿里云大数据组件架构 量、预估迁 移后的成本,从而对迁移工作进行整体评估和决策。 4.2.2 数据迁移自动化 利用迁移工具,可以对 Hive Meta 及数据进行检测扫描,自动在 MaxCompute 创建对应 的 Meta,同时根据不同的网络环境,用户可选择多种数据迁移上云的方案,迁移工具提供了对 应的数据迁移自动化工具,能够将 Hive 的数据自动转换并高吞吐地加载到 MaxCompute 上, 支持从0 码力 | 59 页 | 4.33 MB | 1 年前3Hadoop 概述
为:生物与它们所处环境的非生物组成部分(如空气、水、土壤和矿 产)作为一个系统进行交互的共同体。基于技术的生态系统也有类似 的属性。它是产品平台的结合,由平台拥有者所开发的核心组件所 定义,辅之以自动化(机器脱离人类自主运转)企业在其周边(围绕着 一个空间)所开发的应用程序。 以 Apache 的多种可用产品和大量供应商提供的将 Hadoop 与企 业工具相集成的解决方案为基础,Hadoop0 码力 | 17 页 | 583.90 KB | 1 年前3大数据集成与Hadoop - IBM
很 长的时间,限制了快速响应最新需求的能力。 • 数据转换相对简单,因为无法使用ETL工具将较为复杂 的逻辑推送到RDBMS。 • 数据质量受到影响。 • 关键任务(如数据剖析)无法实现自动化-在很多情况下 根本无法执行。 • 未实施有效的数据治理(数据管理、数据沿袭、影响分 析),因而响应法规要求变得更加困难且非常昂贵,对 关键业务数据的信心更无从谈起。 相反,采用海量可扩展数据集成平台来优化大数据集成工作0 码力 | 16 页 | 1.23 MB | 1 年前3
共 3 条
- 1