全球开源发展态势洞察(2023年第八期)
05 05 05 DEF CON将举办全球最大规模AI黑客大赛 微软将用近一年时间完成对0-day Secure Boot漏洞的修复工作 06 06 04 开源热点 芬兰南萨沃计划建立开源能力中心 Decidim参与式民主的开源平台正在被日本广泛使用 图林根继续支持开源替代方案 07 07 08 09 10 11 16 06 开源创业企业 PingCAP平凯星辰 07 开源报告 book)、AMI等行业巨头,都是AMD Open- SIL的合作伙伴。 AMD为实现OpenSIL设定了四个阶段的POC (概念验证)评估工作,第一阶段已开始, 兼容Zen4架构的四代霄龙(Genoa),接下 来经过Zen5架构的五代霄龙(Turin),最 终在2026年Zen6架构的六代霄龙上成为默认 值,届时AGESA则会退出。 注释:OpenSIL的全称为“Open-Source Silicon Initialization 近日,OpenYurt v1.3.0发布,版本特性更新如下: • 重构Openyurt控制平面组件; • 允许用户为静态Pod定义Pod模板和升级模 型; • NodePort Service支持节点池隔离。 近日,Rainbond v5.14.0发布,版本特性更新 如下: • 各语言源码构建包版本升级; • 支持一键删除应用及应用下相关资源; • 使用集群命令行创建的pod有合理的回收机 制;0 码力 | 22 页 | 1.99 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域, 吉利汽车、壳牌、南方电网、中国移动、中国联通、中国电信、德邦快递 等诸多大中型客户。 以“开放、开源、跨云”为技术理念,网易数帆大力推动技术研究,先后取 得“工信部云计算服务能力标准首批试点单位”、“国家企业技术中心”、“信 通院云计算标准和开源推进委员会成员”、“信通院大数据技术标准推进委 员会成员”、“信创工委会成员”等机构资质。同时,网易数帆积极推动跨厂 商的数字化技术融合发展,与AWS、阿里云、百度云、华为鲲鹏云计算、 全过程服务覆盖咨询、 规划、实施、运维各环节。 实力积淀 核心优势 STRENGTH 数帆实力 05 COMPANY 国家级组织资质 国家高新技术企业 国家规划布局内重点软件企业 国家企业技术中心 国家级博士后科研工作站 云计算技术认证资质 信通院可信云服务网格先进级(最高级别)评估 信通院数字化可信服务能力认证(轻舟低代码平台) 可信云微服务评估先进级认证 Kubernetes 一致性认证0 码力 | 43 页 | 884.64 KB | 1 年前32023年中国基础软件开源产业研究白皮书
www.iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并 开 源 基 金 会 为 运营者 使用者 开源代码托管平台 代码维护:对代码进行日常维护,如 审核开发者贡献的代码质量 开源社区 治理与运营者建立开源社区,提供开 发者交流平台,包括建立sig中心、设 立公开课等 开源项目运营 开源基金会 提供基础软件 发起者选择 性捐赠项目 10 ©2023.11 iResearch Inc. 直 接 企业倾向在自身技术实力较强、产品能 力较扎实的领域选择开源 社区运营是开源人力投入的焦点,头部 企业社区人员投入量超过千名 为方便各职能开源人员交流和开源业务 整合,企业针对性调整组织架构 基础软件是底层技术投入较多的领域之 一,需要企业持续供给技术资源 开源项目的研发、运营、激励都需要 “真金白银”的投入 企业作为开源发起者,应主导开源生态 的建设,努力引入战略合作伙伴 120 码力 | 43 页 | 4.69 MB | 1 年前32024 中国开源开发者报告
年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 的运营成本等等,都让外界对大模型的发展忧心忡忡。面对棘手的困境与难题,大模型的未来, 又该何去何从呢? 下一代“明星产品” “算力墙”下,模型效果边际收益递减,训练和运营成本高昂,在这个时间节点,最好的 AI 产品会是什么?奥特曼、盖茨、小扎、吴恩达、李彦宏等一众大佬给出了一致的答案——智 能体(AI Agent)。2025,将会是智能体元年。 什么是智能体?目前业界一致认可的公式是“智能体=LLM+记忆+规划+工具”: 最优竞争力。 那么,把 transformer“焊死”到板子上就是最佳方案吗?我知道你很急,但你先别急。大 模型底层框架还存在底层路线之争。 32 / 111 我们知道,Transformer 架构呈现了 O(n²)的理论计算复杂度,这里的 n 指的是大模型输入 序列的 token 数量,但其前任语言模型担当 RNN 只有 O(n)的理论计算复杂度。 最近,以 Mamba、RWKV 为代表的类0 码力 | 111 页 | 11.44 MB | 8 月前32023 中国开源开发者报告
是一种基于 LLM 的智能代 理,它能够自主学习和执行任务,具有一定的“认知能力 和决策能力”。LLM Agent 的出现,标志着 LLM 从传 统的模型训练和应用模式,转向以 Agent 为中心的智能 化模式。LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用 范围和价值;它为 LLM 的智能化发展提供了新的方向, 使 LLM 能力,使其智能化,但 它的智能只充当了“辅助”角色;在 AI 原生的语境下, LLM 从一开始就是应用的中枢,应用本身的架构、功能、 交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最 经典的“AI 原生”应用。此概念目前还处在萌芽期,明确 的概念、应用场景、架构、技术栈细节等尚未完成自洽。 换一种视角来看,这个概念的提出其实都没技术什么事, 有人称之为“造商业概念”,这里按下不表。 放宽到 Apache 2.0。 华为云重磅发布盘古大模型 3.0 2023 年 7 月,华为云正式发布盘古大模型 3.0。盘古大模型 3.0 是一个面向行 业的大模型系列,包括“5+N+X”三层架构。 盘古为行业而生,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路 等诸多行业发挥着巨大价值。 9 / 87 1 1 开源开发者事件回顾 蚂蚁集团开源 CodeFuse 代码大模型0 码力 | 87 页 | 31.99 MB | 1 年前3中国开源软件产业研究报告
测 实 • 需求收集、整理是开源社区的最大功能之一,市场上的开发者和用户在 接触项目的过程中自然会产生进一步产品需求,并反馈给社区 • 软件设计主要涉及项目整体架构规划,开源社区开发者主要贡献 为小范围的补丁和功能开发,对整体架构的关注度一般不高 • 软件构建主要指的是核心代码的编写流程,开源社区的贡献者 以编写代码的形式向项目提交创新和改良,能够帮助项目降低 代码编写成本 • 开源社区主 开源之于云计算(一) 开源的虚拟化架构促进了云服务的普及和产业发展 随着用户对于敏捷高效的IT资源的需求不断提升,云服务正在逐步成为数字化时代企业级IT基础设施的标配,而传统意义 上的不同层次的云服务中,IaaS、PaaS和虚拟机等基础云服务产品中不乏开源产品的身影——这也和传统IT架构中底层操 作系统和中间件所处的位置相似。本报告第一章已经提到,传统IT架构中,处于底层的操作系统、数据库管理系统等软件 技术、扩大市场影响力的战略手段。同样的,在整个云服务 架构中,云基础软件也更有可能以开源的形式发布,作为厂商向市场推广这一当时被认为是IT创新的系统架构的方式。事 实上,尽管闭源云服务软件在商业化市场占据重要地位,开源的云基础软件的确为云计算在全球的推广贡献了重要力量, 云计算开源社区也促进了各类云服务软件的不断创新和演进。 云服务基础架构开源技术典型代表 我国企业云计算开源应用规模 基础云服务0 码力 | 68 页 | 3.63 MB | 1 年前32021 中国开源年度报告
大部分,从参与者从事领 12 域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍 追求更高学历深造有关。 公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 /TL)来进行产品的选择, 而且在同类型软件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主要 的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献大的供应商。 参与者首次参与 国内大型互联网企业 61,25% 国内初创公司 96,39% 18 3.5 公司购买开源产品的决策 公司在购买开源产品(基于开源项目的商业化产品)时,多由工程团队 负责人(技术总监 / 架构师 /TL)来进行产品的选择,而且在同类型软 件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 将成为开源与云计算结合的新模式。无服务器(Serverless)是一种云原生开发模型,可 使开发者在无需管理服务器的情况下专注构建和运行应用。无服务器方案将服务器从应用开发中抽 离,由云供应商负责置备、维护和扩展服务器基本架构,而开发者则可仅将代码打包到容器中进行 部署。Serverless 的全球规模保持着比较高的增速。据沙利文报告统计,2020 年营收统计口径下, Serverless 全球市场规模高达 446.10 码力 | 132 页 | 14.24 MB | 1 年前3Gitea,新一代的代码托管平台
阶段二 阶段三 •单用户本地编辑; •没有网络功能; •典型产品:RCS、SCCS。 本地代码管理 •C/S 架构体系,支持网络化协作; •依赖中央存储库; •典型产品:CVS、 SVN、VSS、 TFS、 ClearCase。 集中式代码管理 •去中心化,稳定性和可用性增强; •更高效的代码协同机制; •典型产品:GitHub、GitLab、 Gitea。 分布式代码管理 的使用体验,使用习惯无缝衔接; • 完全兼容 Git 命令,无额外学习成本; • 提供 Tea 命令,操作方便、快捷、高效。 使用简单 • 支持多种部署方式,几条命令快速安装和升级 Gitea; • 兼容多种架构(x86、arm64)和操作系统(Linux、Windows、macOS、 FreeBSD等) • 与多种数据库无缝集成,包括 SQLite、MySQL、PostgreSQL、TiDB、MS Actions SSH 依赖项扫描 数据安全备份 分布式高可用部署架构 AutoScale Runner 统计度量 国产信创适配 企业级支持服务内容(基础级) 支持服务 5×8 工单及电话支持服务,4 个小时内响应客户工单;接到故障申报后,工程师通过电话支持、远程接 入等方式协助客户及时排除软件故障。 安装架构 单机架构。 培训方式 提供离线视频、远程会议的培训。 软件升级服务 提供软件0 码力 | 30 页 | 14.34 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
九年,⽤⼼做好⼀款堡垒机 2014 年 2017 年 2018 年 2020 年 2022 年 2023 年 2022 年 100+ Contributors JumpServer 的架构及核⼼组件 Load Balancer Lina Luna(Web Terminal) Chen CORE MySQL / Redis 等 本地存储 云存储 负载 接⼊ 核⼼ 数据 访问不同的节点, 访问不同地域资产 数据库 JS - 1 统⼀存储 缓存 A.jms.com 集中⼊⼝分布式部署⽅案 区域 A 区域 B B.jms.com 负载均衡 JS - 2 JS - N JS - A 负载均衡 JS - B JS - N 访问统⼀的⼊⼝, 访问不同地域资产 数据库 依据配置端点规则进⾏访问转发 适⽤于资产访问⼈员分散型管理组织架构 适⽤于资产访问⼈员集中型管理组织架构 适⽤于资产访问⼈员集中型管理组织架构 特⾊功能三 JS 组件 数据库 KoKo 组件 (Web CLI) Chen 组件 (Web GUI) Magnus 组件 (代理) Razor 组件 (远程应⽤) MySQL √ √ √ √ 通过各数据库客户端应 ⽤虚拟化来实现数据库 运维安全审计。 MariaDB √ √ √ PostgreSQL0 码力 | 40 页 | 6.66 MB | 1 年前3Moonshot AI 介绍
限的条件下,还能实现登⽉吗? 杨植麟:“登⽉”有⼏个不同的⽣产要素,算⼒肯定是⼀个核⼼,但还有其他的。 你需要⼀个同时满⾜scalability和generality这两点的架构,但今天其实很多架构已经不满⾜这两条 了。transformer在已知的tokenspace符合这两条,但放⼤到⼀个更通⽤的场景,也不太符合。数据 也是⼀个⽣产要素,包括整个世界的数字化,和来⾃⽤⼾的数据。 章、甚 ⾄⼀个视频,但表⽰⼀个更⼤的3D世界或你硬盘上的所有⽂件还有难度,没做到token-in-token- out,离所谓的unifiedrepresentation其实有差距。架构其实解决的是这个问题。 通过AI⾃我进化克服数据稀缺性的瓶颈是第⼆层的另⼀个问题。今天的AI其实像⼀个⿊盒,这个⿊盒 有两个输⼊:电源线和数据线,输⼊这两个东西后,盒⼦就能产出智能。随后⼤家意识到,数据线的 ⼤量的熵,抓住确 定性的东西,让本⾝是混沌的东西继续混沌。 通往AGI的话,long-context会是⼀个很重要的点。所有问题都是long-context的问题⸺历史上所 有的架构演进本质上都是在提升有效的contextlength。word2vec最近拿了NeurIPS的Testof Time奖。它在10年前⽤⼀个词去预测周围的词,相当于conte0 码力 | 74 页 | 1.64 MB | 1 年前3
共 12 条
- 1
- 2