发布中心 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

大数据时代的Intel之Hadoop

大数据时代的Intel乊Hadoop 系统方案架构师：朱海峰英特尔®中国于计算创新中心 2013.4 北京法律声明本文所提供乊信息均不英特尔® 产品相关。本文丌代表英特尔公司戒其它机构向仸何人明确戒隐含地授予仸何知识产权。除相关产品的英特尔销售条款不条件中列明乊担保条件以外，英特尔公司丌对销售和/戒使用英特尔产品做出其它仸何明确戒隐含的担保，包括对适用亍特定用途、适销英特尔可以随时在丌发布声明的情冴下修改规格和产品说明。设计者丌应信赖仸何英特产品所丌具有的特性，设计者亦丌应信赖仸何标有保留权利摂戒未定义摂说明戒特性描述。英特尔保留今后对其定义的权利，对亍因今后对其迚行修改所产生的冲突戒丌兼容性概丌负责。此处提供的信息可随时改变而毋需通知。请勿使用本信息来对某个设计做出最终决定。文中所述产品可能包含设计缺陷戒错误，已在勘误表中注明，这可能会使产品偏离已经发布的技术规范。英特尔提供最新的勘误表备索。 server纯写入时高负载应能达到>1万条记录/秒（每记录200字节）英特尔Hadoop功能增强－跨数据中心大表虚拟大表分中心 A 分中心 B 分中心 C 特点与优势全局虚拟大表，访问方便大表数据分区存放在物理分中心接入仸何分中心可访问全局数据高可用性适合本地高速写入分布式聚合计算，避免大数据传输英特尔Hadoop发行版 – 主要特色

0 码力 | 36 页 | 2.50 MB | 1 年前
3
通过Oracle 并行处理集成 Hadoop 数据

查询中。这避免了将数据获取到本地文件系统并物化到 Oracle 表中，之后才能在 SQL 查询中访问这些数据的过程。甲骨文（中国）软件系统有限公司北京远洋光华中心办公室地址：北京市朝阳区景华南街5号远洋光华中心C座21层邮编：100020 电话：(86.10) 6535-6688 传真：(86.10) 6515-1015 北京上地6号办公室地址：元邮编：610041 电话：(86.28) 8530-8600 传真：(86.28) 8530-8699 大连分公司地址：大连软件园东路23号大连软件园国际信息服务中心2号楼五层502号A区邮编：116023 电话：(86.411) 8465-6000 传真：(86.411) 8465-6499 济南分公司地址：济南市泺源大街150号，中信广场11层1113单元 11室邮编：210028 电话：(86.25) 8476-5228 传真：(86.25) 8476-5226 杭州分公司地址：杭州市西湖区杭大路15号，嘉华国际商务中心702室邮编：310007 电话：(86.571) 8717-5300 传真：(86.571) 8717-5299 西安分公司地址：西安市高新区科技二路72号，零壹广场主楼1401室

0 码力 | 21 页 | 1.03 MB | 1 年前
3
Hadoop 迁移到阿里云MaxCompute 技术方案

SQL 语法转换，参见 6.5.1.2。 3. 转换后的 SQL 会根据 workflow.xml 中的配置，自动生成项目空间下开发环境的工作流节点。 4. 客户可以运行测试实例，验证后发布到生产环境。 7 经典用例 7.1 基本功能 7.1.1 准备工具和环境预先下载好工具包：odps-data-carrier.zip Alibaba Cloud MaxCompute MaxCompute 解决方案 58 2. 配置完成并上传打包文件后，Dataworks 服务会自动转换并生成 Dataworks 的工作流和节点任务。【注意】：仅支持发布到开发环境，需要客户自己测试验证后，发布到生产环境。 8.1.6.2 创建 Dataworks 标准工作流 1. 参见 6.4.2，如果您使用其他调度引擎，需要在 6.4.2.2 中按照 Dataworks 的标准模板配置 MaxCompute 解决方案 59 2. 配置完成并上传打包文件后，Dataworks 服务会自动转换并生成 Dataworks 的工作流和节点任务。【注意】：仅支持发布到开发环境，需要客户自己测试验证后，发布到生产环境。 8.1.6.3 Dataworks 服务支持 Oozie+Dataworks 混乱模式的工作流迁移即：支持 7.5.1.1 和 7.5.1.2 两种混合配置模式，Dataworks

0 码力 | 59 页 | 4.33 MB | 1 年前
3
這些年，我們一起追的Hadoop

這些年，我們一起追的 Hadoop Hadoop, the Apple of Our Eyes 蘇國鈞 monster.supreme@gmail.com 資訊工業策進會數位教育研究所資訊技術訓練中心 1 / 74 在 Java SE 與 Java EE 領域有十多年的講師教學經驗，熟悉 SOAP/RESTful Services、Design Patterns、EJB/JPA 等 Java

0 码力 | 74 页 | 45.76 MB | 1 年前
3
Hadoop 概述

能够帮助你通过使用虚拟机上的单节点群集来开始 Hadoop 之旅，如图 1-4 所示。由于 Hadoop 是一个商用(几乎没有额外成本)的解决方案，因此 HDP 使得你能够将其部署到云端或者自己的数据中心。 HDP 为你提供数据平台基础以供搭建自己的 Hadoop 基础设施，这包括一长串商业智能(BI)及其他相关供应商的列表。平台的设计目标是支持处理多种来源及格式的数据，并且允许设计自定义

0 码力 | 17 页 | 583.90 KB | 1 年前
3
Hadoop 3.0以及未来

2003 Hadoop从 Nutch分离 Google GFS & MapReduce Paper HBase Hive Cloudera创立 Hortonworks创立 Hadoop 1.0发布 Hadoop 2.0 GA Spark成为顶级顷目 Hadoop 3.0 2017 Hadoop生态系统文件存储层 HDFS 资源／任务调度 YARN 计算引擎MapReduce

0 码力 | 33 页 | 841.56 KB | 1 年前
3
尚硅谷大数据技术之Hadoop（入门）

2）Flume：Flume 是一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统， Flume 支持在日志系统中定制各类数据发送方，用于收集数据； 3）Kafka：Kafka 是一种高吞吐量的分布式发布订阅消息系统；尚硅谷大数据技术之 Hadoop（入门） ————————————————————————————— 更多 Java –大数据

0 码力 | 35 页 | 1.70 MB | 1 年前
3

共 7 条前往

页

大数时代 Intel Hadoop 通过 Oracle 并行处理并行处理集成数据迁移阿里 MaxCompute 技术方案這些我們一起概述 3.0 以及未来硅谷入门

分类

语言

格式

大数据时代的Intel之Hadoop

通过Oracle 并行处理集成 Hadoop 数据

Hadoop 迁移到阿里云MaxCompute 技术方案

這些年，我們一起追的Hadoop

Hadoop 概述

Hadoop 3.0以及未来

尚硅谷大数据技术之Hadoop（入门）