网易数帆 领先的数字化转型技术与服务提供商 2021
中国长三角数字经济大会“数字经济优秀案例企业” CTDC 年度优秀微服务创新产品奖 浙江省大数据应用服务创新奖 信通院 OSCAR 尖峰开源用户奖 教育部科技进步一等奖( “海量混合时态数据融合处理关键技术及应用”项目) 全球云计算大会“全球最佳实践奖” 2021 2020 2019 2018 HONOR 数帆荣誉 07 (部分) 北京嗨学网教育科技股份有限公司 北京卡车之家信息技术股份有限公司 储解耦。 先设计 后开发 业内首个提出中台的模型设 计标准,遵循先设计后开发理 念,通过模型设计中心对逻辑 建模进行指导。 统一指标管理 基线智能预警 海量任务运维和管理,提供 异常基线报警处理,辅助任务 运维人员完成工作。 数据资产360 建立集安全、价值、成本、质 量、标准于一体的健康评估指 标体系和优化工具,打造360° 无死角数据资产治理体系。 指标建设流程规范化,消除指 标口径二义性,帮助企业进行 与检索,支持任务运行状态各 维 度 metrics 的 汇 总 与 展 示,实现全链路监控与智能诊 断。 PRODUCT 基于 Apache Flink 构建的高性能、一站式实时大数据处理方案,广泛适用于流式数据处理场景。 有数实时计算平台 一站式、低门槛分析建模平台,帮助客户更快、更便捷、更智能地挖掘数据价值。 有数机器学习平台 19 产品能力 产品能力 全渠道数据融合 支持多渠道数据整合,可灵活0 码力 | 43 页 | 884.64 KB | 1 年前32023 中国开源开发者报告
Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, GPT-2和GPT-3模型开发的前研究人员组建, 专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。 李彦宏称:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语 言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。” 长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的 token 上训练的,微调 Chat 模型是在 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于 构建全栈网络和多平台应用程序。 2023 年 10 月,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高 达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。 在上下文窗口长度、长窗口文本生成质量、长上下文理解以及长文本问答、 摘要等方面的表现均全面领先 Claude2。 2023 年 9 月,蚂蚁集团正式开 源代码大模型 CodeFuse——基0 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 更加「接地气」,受到了更多开 发者的喜爱。 虽然面临资源的挑战,但它们的 灵活性和社区驱动力使得它们获 得了更多开发者的支持。 9 / 111 本年度最活跃的开源组织 不同开源组织在 Issue 解决 和 PR 处理数量上的差异,反映了它 们在开发活跃度、社区参与度和 技术成熟度上的不同战略。 技术大厂主导的项目往往具有较 高的资源投入和社区管理效率, 而民间组织则可能更注重技术问 题的快速解决,并逐步吸引更多 openKylin MindSpore openGauss Ascend dromara anolis OpenCloudOS Stream UBML 解决 Issue 处理 PR 10 / 111 编程语言流行趋势 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 Java JavaScript0 码力 | 111 页 | 11.44 MB | 8 月前3Moonshot AI 介绍
⾃媒体与内容创作者:学习特定公众号、⽂件、⽹⻚链接的⻛格,辅助创作;快速搜集创作所需信 息,提供丰富的资料与灵感。 • ⾦融和咨询分析师:通过即时搜索,帮你第⼀时间掌握⾏业动态和市场信息,并提供洞察与分析。 • 法律从业⼈员:⾼效处理⼤量案件资料、整理证据、梳理法律政策,协助你撰写法律⽂书和报告, 提升⼯作效率。 专访⽉之暗⾯杨植麟:losslesslongcontextiseverything Lossless 时间,核⼼是怎么在这个思想基础上解决更多问题。 海外独⻆兽:其实contextlength⽆限⻓的话,我们也不需要tokenizer了? 杨植麟:对。本质上模型⾜够强的话,它可以处理任何的token、pixel、byte。有了⽆限⻓的 contextlength,你可以直接把硬盘上所有的东西都输给它,它会变成你真正的新计算机,根据这些 context采取⾏动。 集 了⼀⽀顶尖AI团队,他们曾参与GoogleBard、Gemini、盘古、悟到多个⼤模型的研发过程中。 今年10⽉,⽉之暗⾯正式发布了第⼀款对话类产品Kimi智能助⼿,具备世界级的⻓⽂本处理能⼒,该 产品⽀持约20万字中⽂的上下⽂⻓度,使得整体表现⾮常惊艳。杨植麟认为,如今基于Transformer架 构的⼤模型,是“新时代的计算机”,参数数量决定计算复杂度,上下⽂⻓度决定内存⼤⼩⸺因此,0 码力 | 74 页 | 1.64 MB | 1 年前32023年中国基础软件开源产业研究白皮书
架构/内核 云原生基础设施 安全 测试 行业解决方案 治理类 职能组织 社区基础设施 版本发行 社区生态管理 服务器 云计算 边缘计算 智能终端 桌面 … 操作系统应用场景 处理器 … 服务器 端设备 内存 系统软件 … 数据库管 理软件… 应用软件 编译软件 开源促进“更好的”操作系统被“更好地”使用 硬件适配 软件适配 19 ©2023.11 iResearch 府 ( 工 业 交 通 金 融 ) 通用性强: 同一数据库 可以轻松扩 展至其他互 联网平台 架构复杂: 多为单体应 用,架构上 耦合度较 高,代码难 度高 架构轻:前 端展示、中 层业务处理 逻辑、后端 数据库 “求稳定”:更注重 系统对业务的安全性 和稳定性的支持,因 而采用自建服务器或 私有云的运营方式 “求灵活”:更注重 系统对业务快速扩张 和灵活变动的支持, 因而更多采取订阅云 源项目较分散,需要进一步集中开源力量 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 云原生应用编排及管理 编排与调度 远程调用 服务代理 API网关 服务网格 分布式架构 消息处理 Serverless 自动化配置 数据库 镜像制作 … 边缘计算 人工智能 大数据 区块链 … 云原生底层技术 容器技术 存储技术 网络技术 云原生顶层应用 云 原 生 应 用 安 全0 码力 | 43 页 | 4.69 MB | 1 年前32021 中国开源年度报告
来看,这对开源的发 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 在于让部分厂商为了取得差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放 式创新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术竞争力以及产品 本身的可维护性。 段夕华:不知道 21 年底所爆发的 log4j 漏洞,是否 稳定高效、安全可靠、开放兼容的新型数据基础设施。核心产品为分布式关系型数据库 TiDB。TiDB 是 PingCAP 公司自主设计、研发的开源分布式关系型数据库,是一款同时支持在线事务处理与在线分析 处理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布式数据库产品。 图表 33 :PingCAP 发展历史 图表 34 运营情况 图表 42 :Jina AI 融资历史 资料来源:GitHub,云启资本 资料来源:Crunchbase,云启资本 5.4 Zilliz Zilliz 是研发面向人工智能的新一代数据处理和分析平台 ,其主要是为应用型企业提供底层技术。Zilliz 研发的 GPU 加速的 AI 数据中台解决方案 Mega,其中包括数据 ETL 系统 MegaETL、数据库系统 MegaWise、面向0 码力 | 132 页 | 14.24 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
始 投入使用。 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立的服务网格解决方案,包括处理在Kuberne- tes集群上运行的微服务的流量管理、策略执行 和可观测性等任务,以简化应用程序的部署和 管理。OSM于2020年8月推出,同年加入云原 生计算基金会(CNCF)。不久后,该项目成为 域名配置https证书时,增加搜索功能或优 先匹配与域名相同的证书; • 支持配置日志存储路径。 近日,Prometheus v2.44.0发布,版本特性更 新如下: • 将每次发送的默认样本数提高到2000; • 支持处理原生直方图数据; • 在命令行中添加用于检查Prometheus服务 器健康状态和可用性的功能; • 添加所有查询加载的样本总数指标。 OpenYurt v1.3.0发布 OpenYurt是由阿里云开源的基于原生Kuberne- Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示 词注入”技术。人工智能研究员Simon Willison 详细介绍了提示词注入的危险,这种技术可以令0 码力 | 22 页 | 1.99 MB | 1 年前32021 中国开源年度报告
指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放式创 新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术 竞争力以及产品本身的可维护性。 Du Junping: Due to the rapid 中国开源年度报告·数据篇 2021 China Open Source Annual Report · Data GitHub 数据 GitHub Data 说明 Description 为了方便后续处理,每个表格后都附上了 csv 文件。Each table has a csv file attached to it for ease of follow-up. 活跃度公式 Activity 业用户提供稳定高效、安全可靠、开放兼容的新型数据基础设施。核心产品为分布式关系型数 据库 TiDB。TiDB 是 PingCAP 公司自主设计、研发的开源分布式关系型数据库,是一款同时 支持在线事务处理与在线分析处理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布式数据库产品。 PingCAP, an enterprise-level0 码力 | 199 页 | 9.63 MB | 1 年前32020 中国开源年度报告
⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 来,越来越多的⼈开始远程办公,事实上促进了更多的⼈有机会“斜杠化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2 Committee,即技术监督委员会的缩写,主要向云原⽣社区提供技术领导)来 处理。项⽬被拒绝时,可能是“⽬前不合适”这种情况,并且可以⿎励该项⽬在解决问题后 重新申请。整个过程所需的时间并不固定。⽬前该阶段有 Artifact Hub、Backstage 等 44 个项⽬。 孵化(incubating):同沙箱流程,所有的例外情况(包括拒绝)均由 TOC 来处理。⽬ 前该阶段的项⽬有 Argo、Buildpa MindSpore 是⼀种适⽤于端边云场景的新型开源深度学习训练/推理框架。 MindSpore 提供 了友好的设计和⾼效的执⾏,旨在提升数据科学家和算法⼯程师的开发体验,并为 Ascend AI 处理器提供原⽣⽀持,以及软硬件协同优化。 项⽬地址:https://gitee.com/mindspore/mindspore 相关数据(数据选⾃仓库 mindspore/mindspore)0 码力 | 46 页 | 4.09 MB | 1 年前3中国开源软件产业研究报告
OPENPITRIX 应用发布和管理平台 KUBEEYE K8s集群自动巡检工具 Fluentbit Operator K8s的Fluent Bit kube-events K8s事件处理 Notification Manager K8s消息通知 Alerting Syst 高性能报警系统 S2i-operator 基于Kubernetes CRD的控制器 OpenFunction Cloud作为云基座。 ZStack核心产品——ZStack Cloud产品架构与核心性能优势 简单 Simple 下载简单,部署简单, 运维简单,管理简单 健壮 Strong 稳定高效,轻松处理高 并发,故障自恢复 弹性 Scalable 同时管理多个平台,客 户按需使用资源 智能 Smart 同时管理多个平台,客 户按需使用资源 管理 实现异构平 台资源纳管, 同时管理多 个平台0 码力 | 68 页 | 3.63 MB | 1 年前3
共 10 条
- 1