大数据时代的Intel之Hadoop
大数据时代的Intel乊Hadoop 系统方案架构师:朱海峰 英特尔®中国于计算创新中心 2013.4 北京 法律声明 本文所提供乊信息均不英特尔® 产品相关。本文丌代表英特尔公司戒其它机构向仸何人明确戒隐含地授予仸何知识产权。除相关产品的英特尔销售条款不条件中列明乊担保条件以外,英特 尔公司丌对销售和/戒使用英特尔产品做出其它仸何明确戒隐含的担保,包括对适用亍特定用途、适销 英特尔可以随时在丌发布声明的情冴下修改规格和产品说明。设计者丌应信赖仸何英特产品所丌具有的特性,设计者亦丌应信赖仸何标有保留权利摂戒未定义摂说明戒特性描述。英特尔保 留今后对其定义的权利,对亍因今后对其迚行修改所产生的冲突戒丌兼容性概丌负责。此处提供的信息可随时改变而毋需通知。请勿使用本信息来对某个设计做出最终决定。 文中所述产品可能包含设计缺陷戒错误,已在勘误表中注明,这可能会使产品偏离已经发布的技术规范。英特尔提供最新的勘误表备索。 server纯写入时高负载应能 达到>1万条记录/秒(每记录200字节) 英特尔Hadoop功能增强 - 跨数据中心大表 虚拟大表 分中心 A 分中心 B 分中心 C 特点与优势 全局虚拟大表,访问方便 大表数据分区存放在物理分中心 接入仸何分中心可访问全局数据 高可用性 适合本地高速写入 分布式聚合计算,避免大数据传输 英特尔Hadoop发行版 – 主要特色0 码力 | 36 页 | 2.50 MB | 1 年前3通过Oracle 并行处理集成 Hadoop 数据
查询中。这避免了将数据 获取到本地文件系统并物化到 Oracle 表中,之后才能在 SQL 查询中访问这些数据的过程。 甲骨文(中国)软件系统有限公司 北京远洋光华中心办公室 地址:北京市朝阳区景华南街5号远洋光华中心C座21层 邮编:100020 电话:(86.10) 6535-6688 传真:(86.10) 6515-1015 北京上地6号办公室 地址: 元 邮编:610041 电话:(86.28) 8530-8600 传真:(86.28) 8530-8699 大连分公司 地址:大连软件园东路23号大连软件园国际信息服务中心2号楼五层502号A区 邮编:116023 电话:(86.411) 8465-6000 传真:(86.411) 8465-6499 济南分公司 地址:济南市泺源大街150号,中信广场11层1113单元 11室 邮编:210028 电话:(86.25) 8476-5228 传真:(86.25) 8476-5226 杭州分公司 地址:杭州市西湖区杭大路15号,嘉华国际商务中心702室 邮编:310007 电话:(86.571) 8717-5300 传真:(86.571) 8717-5299 西安分公司 地址:西安市高新区科技二路72号,零壹广场主楼1401室0 码力 | 21 页 | 1.03 MB | 1 年前3Hadoop 迁移到阿里云MaxCompute 技术方案
SQL 语法转换,参见 6.5.1.2。 3. 转换后的 SQL 会根据 workflow.xml 中的配置,自动生成项目空间下开发环境的工作流节 点。 4. 客户可以运行测试实例,验证后发布到生产环境。 7 经典用例 7.1 基本功能 7.1.1 准备工具和环境 预先下载好工具包:odps-data-carrier.zip Alibaba Cloud MaxCompute MaxCompute 解决方案 58 2. 配置完成并上传打包文件后,Dataworks 服务会自动转换并生成 Dataworks 的工作流和节 点任务。【注意】:仅支持发布到开发环境,需要客户自己测试验证后,发布到生产环境。 8.1.6.2 创建 Dataworks 标准工作流 1. 参见 6.4.2,如果您使用其他调度引擎,需要在 6.4.2.2 中按照 Dataworks 的标准模板配置 MaxCompute 解决方案 59 2. 配置完成并上传打包文件后,Dataworks 服务会自动转换并生成 Dataworks 的工作流和节 点任务。【注意】:仅支持发布到开发环境,需要客户自己测试验证后,发布到生产环境。 8.1.6.3 Dataworks 服务支持 Oozie+Dataworks 混乱模式的工作流迁移 即:支持 7.5.1.1 和 7.5.1.2 两种混合配置模式,Dataworks0 码力 | 59 页 | 4.33 MB | 1 年前3這些年,我們一起追的Hadoop
這些年,我們一起追的 Hadoop Hadoop, the Apple of Our Eyes 蘇國鈞 monster.supreme@gmail.com 資訊工業策進會 數位教育研究所 資訊技術訓練中心 1 / 74 在 Java SE 與 Java EE 領域有十多 年的講師教學經驗,熟悉 SOAP/RESTful Services、Design Patterns、EJB/JPA 等 Java0 码力 | 74 页 | 45.76 MB | 1 年前3Hadoop 概述
能够帮助你通过使用虚拟机上的单节点群集来开始 Hadoop 之 旅,如图 1-4 所示。由于 Hadoop 是一个商用(几乎没有额外成本)的 解决方案,因此 HDP 使得你能够将其部署到云端或者自己的数据 中心。 HDP 为你提供数据平台基础以供搭建自己的 Hadoop 基础设 施,这包括一长串商业智能(BI)及其他相关供应商的列表。平台的 设计目标是支持处理多种来源及格式的数据,并且允许设计自定义0 码力 | 17 页 | 583.90 KB | 1 年前3Hadoop 3.0以及未来
2003 Hadoop从 Nutch分离 Google GFS & MapReduce Paper HBase Hive Cloudera创立 Hortonworks创立 Hadoop 1.0发布 Hadoop 2.0 GA Spark成为顶级顷目 Hadoop 3.0 2017 Hadoop生态系统 文件存储层 HDFS 资源/任务调度 YARN 计算引擎MapReduce0 码力 | 33 页 | 841.56 KB | 1 年前3尚硅谷大数据技术之Hadoop(入门)
2)Flume:Flume 是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统, Flume 支持在日志系统中定制各类数据发送方,用于收集数据; 3)Kafka:Kafka 是一种高吞吐量的分布式发布订阅消息系统; 尚硅谷大数据技术之 Hadoop(入门) ————————————————————————————— 更多 Java –大数据0 码力 | 35 页 | 1.70 MB | 1 年前3
共 7 条
- 1