MaxCompute - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Hadoop 迁移到阿里云MaxCompute 技术方案

Hadoop 迁移到阿里云 MaxCompute 技术方案（V2.8.5）编写人：MaxCompute 产品团队日期：2019.05 Alibaba Cloud MaxCompute 解决方案 2 目录 1 概要 .................................. Hadoop 生态的产品映射 ......................................................................... 9 2.2 MaxCompute 特性介绍 ......................................................................................... ................... 11 2.2.2 MaxCompute 产品特性 .................................................................................................... 11 3 MaxCompute 迁移场景分析 .........................

0 码力 | 59 页 | 4.33 MB | 1 年前
3
阿里云 AnalyticDB for PostgreSQL - 打造更简单易用的Cloud SQL Data Warehouse

2：离线数仓场景数据集成按天/小时批量同步交易库数据ADBPG MySQL/PG/SQLServer/Oracle –>DataX/OSS-> ADBPG 3：大数据计算场景同步MaxCompute/Hadoop数据，ADBPG做在线分析大数据平台->DataX/OSS/Blink/-> ADBPG 4：数据湖分析场景数据按冷热分析，支持在线查询OSS分布式云存储上的格式化数据 PostgreSQL 智能分析服务 DataV QuickBI 云上大数据计算平台大数据平台数据分析应用制式化报表个性化报表仪表盘自助查询宏观分析模型分析 MaxCompute 生产系统数据库关系型数据库A RDS …… 关系型数据库B RDS 关系型数据库C RDS 关系型数据库D ECS自建自建大数据计算平台 Hadoop

0 码力 | 22 页 | 2.98 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

model2 … PAI-ABTest A/B流量划分 PAI-Rec – 推荐引擎 BE召回/Hologres hot x2i vec 排序粗排精排重排 MaxCompute Datahub 离线特征样本构造实时特征 Flink 训练数据推荐日志模型发布在线流程离线流程智能推荐解决方案 > PAI-REC 推荐引擎 PAI-REC ML Service (PaaS) AI Service (SaaS) 机器学习框架(PAI-TensorFlow/PAI-PyTorch/Caffe /Alink/…) 计算引擎(MaxCompute / EMR / Flink) 基础硬件（CPU/GPU/FPGA/NPU）阿里云容器服务(ACK) • 200+组件 • 数十个场景化模版 • 所见即所得交互式建模（DSW）

0 码力 | 40 页 | 8.51 MB | 1 年前
3
Kubernetes日志平台建设最佳实践-元乙

SparkStreaming Function Compute Hadoop HIVE Big Data Analytics Batch Processing Pig PAI MaxCompute EMR Interactive Analytics DLA Log Service / Analytics �� Flink Storm �� Audit

0 码力 | 30 页 | 53.00 MB | 1 年前
3
202306 ⼈⼈可⽤的开源数据可视化分析⼯具

ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2 数据库 / Impala / StarRocks / TiDB / MaxCompute / Presto / Kylin / 达梦 / API 数据源等；⽀持数据源的⾼级设置，例如最⼤连接数、最⼩连接数、连接超时时间等；⽀持数据源有效性校验，⽀持定时检测数据源的连接状态；⽀持⽤户⾃⾏上传数据库驱动

0 码力 | 27 页 | 3.61 MB | 1 年前
3
DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 06 ⽉

ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2数据库 / Impala / StarRocks / TiDB / MaxCompute / Presto / API 数据源等；⽀持数据源的新建、编辑、删除等；⽀持数据源的⾼级设置，如最⼤连接数、最⼩连接数、连接超时时间等；⽀持数据源有效性校验；⽀持定时检测数据源的连接状态；⽀持⽤户⾃⾏上传数据库驱动并使⽤；

0 码力 | 27 页 | 10.32 MB | 1 年前
3
DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 12 ⽉

ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2数据库 / Impala / StarRocks / TiDB /MaxCompute / Presto / Kylin / 达梦 / API 数据源等；⽀持数据源的新建、编辑、删除等；⽀持数据源的⾼级设置，如最⼤连接数、最⼩连接数、连接超时时间等；⽀持数据源有效性校验；

0 码力 | 27 页 | 3.58 MB | 1 年前
3
DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 04 ⽉

ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2数据库 / Impala / StarRocks / TiDB /MaxCompute / Presto / Kylin / 达梦 / API 数据源等；⽀持数据源的新建、编辑、删除等；⽀持数据源的⾼级设置，如最⼤连接数、最⼩连接数、连接超时时间等；⽀持数据源有效性校验；

0 码力 | 27 页 | 3.60 MB | 1 年前
3
24-云原生中间件之道-高磊

大数据平台在云原生环境下落地艰难。那么如何实现大数据云原生化呢？立足满足现在和未来的企业需求进行渐进式改造推进是比较合理的方式。(阿里巴巴甚至根据新时代的诉求，把原先的大数据平台JStorm都给舍弃掉，全面奔向MaxCompute云原生体系) 高级能力-云原生大数据|AI-业务赋能的基石-2-架构改造上的问题和困难 • 弹性扩缩容能力无法满足快速增长的业务需求：随着业务的发展，流量和数据量突增，尤其对于实时计算，需要资源

0 码力 | 22 页 | 4.39 MB | 5 月前
3

共 9 条前往

页

分类

语言

格式

Hadoop 迁移到阿里云MaxCompute 技术方案

阿里云 AnalyticDB for PostgreSQL - 打造更简单易用的Cloud SQL Data Warehouse

阿里云上深度学习建模实践-程孟力

Kubernetes日志平台建设最佳实践-元乙

202306 ⼈⼈可⽤的开源数据可视化分析⼯具

DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 06 ⽉

DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 12 ⽉

DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 04 ⽉

24-云原生中间件之道-高磊