2023 中国开源开发者报告
领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable Diffusion 和 Midjourney 这两大图像生成系统 模型作为协作执行者(来自 HuggingFace Hub)组成。 7 月 13 日,京东全面推出京东言犀大模型, 服务千行百业,拥抱产业智能。言犀大模型 融合了 70%的通用数据与 30%京东数智供 应链原生数据,致力于面向知识密集型、任 务型产业场景,解决真实产业问题。 2023 年 6 月,百度智能云推出了基于大模型的 “Comate”代码助手。 借助文心大模型的理解、推理能力,“Comate” Meta 代码生成大模型:Code Llama OpenAI 开发者大会宣布 GPTs 商店 用“磁链链接”发布的 Mixtral 8x7B ——全球首个开源 MoE 大模型 2023 年 12 月,有 “欧洲版 OpenAI” 之称的大模型创业公司——Mistral AI 用「磁链链接」开源了 87 GB 的 8x7B MoE 模型:Mixtral 8x7B。 这是一个开放权重的高质量稀疏混合专家模型(SMoE),采用0 码力 | 87 页 | 31.99 MB | 1 年前32021 中国开源年度报告
自由的。但是,在软件吞噬世界、开源吞噬软件的今天,开源技术, 2021 中国开源年度报告 3 已经成为整个世界的基础设施之一。能力越大,责任越大。应用越广, 风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何 建设更加健康的开源生态呢?在这样一种生态中,各方的责任又该 如何界定呢? 历史感 开源社已经连续第四年发布中国开源年度报告了,也举办了第六届 中国开源年会了。不断的,在与朋友的交流中,我们常常会谈到 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要通过公司领导,工程团队负责人进行决策。 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉至工程团队技术负责人的趋势是不可避免的。这 同时也要求技术产品的采购在决策 时代下的技术创新与商业创新正在齐头并进。技术层面上,人工智能、开源数据和区块链是新 兴创新的一些例子。而得益于时刻保持创新的开发者社区,开源已成为云计算,SaaS 服务,下一代数据库, 移动设备,互联网甚至区块链的基础。下一代商业模式可能包括广告支持的 OSS,类似于大型专有企业 支持的开源项目、数据驱动的收入以及通过区块链货币化的加密代币。 80 图表 8 :开源的良性循环 图表0 码力 | 132 页 | 14.24 MB | 1 年前3Moonshot AI 介绍
后花⼀倍的成本来训练。会出现新的范式,推理即训练,⽽且这个推理不是为任何⽤⼾服务的,只为 ⾃⼰本⾝的合成数据服务。 出现这种情况的话,能源的问题也解决了,因为推理是可以分布式的。⽽且它不违背定律,本质还是 个能源守恒。只不过我把计算范式改变了,让能源能够以分布式的⽅式解决。 超级应⽤:模型的微调可能最终不存在 海外独⻆兽:Google和抖⾳背后的搜索和推荐有很强的⻜轮效应,算法能根据⽤⼾的⾏为实时反 你的产品和研发。 在这种新的计算范式下⾯,它会产⽣新的计算,会产⽣新的内存。⽐如说参数数量可能就会决定计算 复杂度,上下⽂的⻓度就会决定内存⼤⼩。有了很⼤的内存之后,你就可以去解锁很复杂的计算链 路,⽐如训练⼀个很复杂的Agent完成各种任务,阅读不同的⽂件,去综合不同的分析,最后得到想要 的结果。 同时,它也是降低幻觉⾮常好的⼿段。如果你平⽩⽆故的去问⼀个模型,那他可能会开始有 H 往这个路 径⼀直⾛下去,然后不断地去寻找更⾼效的scale它的⽅式,就可以得到⼀个⾮常好的结果,能够解决 很多以前很难解决的问题⸺不管是记忆的问题、推理的问题,还是很多常识,甚⾄是更复杂的多链路 问题。 这个经历给了我很深的冲击,或者说创业的铺垫。 2020年开始,我去找很多机构合作,⼀起去训练⼤模型,也是最早在国内训练了很多像盘古、悟道⼤ 模型,这个过程也⼀直在酝酿⼀个真正的时机。0 码力 | 74 页 | 1.64 MB | 1 年前32021 中国开源年度报告
在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是自由的。但是,在软件吞噬 世界、开源吞噬软件的今天,开源技术,已经成为整个世界的基础设施之一。能力越大,责任 越大。应用越广,风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何建设更加 健康的开源生态呢?在这样一种生态中,各方的责任又该如何界定呢? When the open source was just a niche hobby, it was free performance. 【专家点评】/ [Expert Comment] 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的 选型是由在一线的开发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要 通过公司领导,工程团队负责人进行决策。 Jiang Ning: Are the open source products herein referred to as 时代下的技术创新与商业创新正在齐头并进。技术层面上,人工智能、开源数据和区 块链是新兴创新的一些例子。而得益于时刻保持创新的开发者社区,开源已成为云计算,SaaS 服务,下一代数据库,移动设备,互联网甚至区块链的基础。下一代商业模式可能包括广告支 持的 OSS,类似于大型专有企业支持的开源项目、数据驱动的收入以及通过区块链货币化的加 密代币。 Technology innovation and0 码力 | 199 页 | 9.63 MB | 1 年前3中国开源软件产业研究报告
、市场推广、版 本迭代更新、版权管理和安全管理等内容,这些环节和商业企业的软件项目有一些相似之处,但更加注重从社区的使用者 和贡献者处得到观点和启发,并用以驱动项目未来的发展。 开源软件主体和产业链关系 源作者 软件作品 企业开源 开源基金会 开 源 社 区 代码托管平台 开源软件论坛 专家指导 产业联盟 法律服务 市场宣传 二次开发者 软件用户 • 开源代码的源作者/最初贡献 0% web和应用程序开发 13.6% 人工智能、机器学习、数 据和分析 10.8% 隐私与安全 5.1% cross-technology 4.8% 物联网与嵌入式 4.6% 区块链 4.3% DevOps, CI/CD & Site Reliability 3.8% 开源最佳实践 3.8% 其他 11.5% 库 22.9% 大数据 11.1% 网络服务器 华为是中国重要的开源参与者,是开放原子开源基金会的发起人之一,同时也是诸多开源项目的重要贡献者,目前已经对 外开源的项目包含OpenHarmony、OpenGauss等。其中,OpenHarmony是华为于2020年开源的分布式操作系统,采用 了组件化设计方案,可根据设备的资源能力和业务特征进行灵活裁剪,满足不同形态的终端设备对于操作系统的要求,可 适应各类智能设备;OpenGauss是华为于2019年开源的数据库产品,内0 码力 | 68 页 | 3.63 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
领先的数字化转型技术与服务提供商 网易数帆是网易集团旗下 TO B 企业服务品牌,定位于领先的数字化转型 技术与服务提供商,为客户提供创新、可靠的国产软件基础平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易 数帆历程 关于数帆 数帆实力 荣誉资质 客户名录 客户口碑 业务全景 产品篇 网易有数 网易轻舟 网易易智 客户案例篇 解决方案篇 数据中台解决方案 业务中台解决方案 金融分布式解决方案 金融大数据解决方案 零售大数据解决方案 零售行业 金融行业 制造行业 综合行业 02 03 04 02 01 04 05 06 08 09 10 12 升级轻舟云原生软件生产力平台及有数全链路数据生产力平台;发布金融分布式、金融大数据、零售大数据、制造业智慧供应链等行业解决方案。 发布轻舟低代码平台 2.0 。 大数据开源项目 Kyuubi 全票进入 Apache 软件基金会孵化器。 有数 BI 个人版永久免费;发布机器学习平台、消费者运营平台、标签画像、流量分析等产品。 2020 2021 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。0 码力 | 43 页 | 884.64 KB | 1 年前3Gitea,新一代的代码托管平台
TFS、 ClearCase。 集中式代码管理 •去中心化,稳定性和可用性增强; •更高效的代码协同机制; •典型产品:GitHub、GitLab、 Gitea。 分布式代码管理 基于 Git 的分布式 代码托管 具备 DevSecOps 延伸能力 Gitea 是谁? • 2016 年 11 月 fork 自 gogs,开始独立发展; • 基于 MIT 开源协议; • 延伸能力:项目管理 项目看板 遵循 Scrum 来进行项目管理组织;支持工单看板功能, 可以将项目中的工单按照需求拖动到不同泳道中进行管理。 Issues 管理 跟踪项目的需求,功能和缺陷;工单支持标签、里程碑、指派、 时间跟踪、到期时间、依赖关系等功能。 Gitea 延伸能力:百科管理(Wiki) 百科 Wiki 基于 Git 版本控制系统的文档托管,使用 Markdown 语法书写文档,实现项目知识库管理; 开发者支持。 X-Pack 增强包 + 企业级支持服务 X-Pack 增强包(已上线功能) 集成对接企业微信、钉钉、 飞书等 Gitea Actions SSH 依赖项扫描 数据安全备份 分布式高可用部署架构 AutoScale Runner 统计度量 国产信创适配 企业级支持服务内容(基础级) 支持服务 5×8 工单及电话支持服务,4 个小时内响应客户工单;接到故障申报后,工程师通过电话支持、远程接0 码力 | 30 页 | 14.34 MB | 1 年前32023年中国基础软件开源产业研究白皮书
©2023 iResearch Inc. 2023年中国基础软件开源 产业研究白皮书 2 目 录 CONTENTS 01 02 03 开源基础软件界定及中外发展对比 中国开源基础软件产业链及参与者洞察 中国开源基础软件产业细分领域洞察 3 开源基础软件界定 及中外发展对比 01 4 ©2023.11 iResearch Inc. 中国开源基础软件 产业链及参与者洞察 02 9 ©2023.11 iResearch Inc. www.iresearch.com.cn 开源产业链关系 以开源 区进行评分,辅助开发者选择要参与的开源项目;4)开源产业联盟往往会对行业贡献 技术指标、开源规范等,引导行业专业化发展。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 开源产业链 运营: 发起者为运营者 开源技术论坛\开源社区评估机构\开源产业联盟 提供参与者交流的平台,推动开源技术发展、打造最佳实践 赋能开源全产业生态的循环流转与运行规范 发起者 代码/文档贡献0 码力 | 43 页 | 4.69 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
制造业已经完成了从集中式制造向分布式制造的演进,⼤型制造企业往往在境内外拥有多个⽣产基地,需要借助堡垒机实现 分布式 IT 资产的统⼀运维安全审计。 政府及国有企业 政府机构及国有企业拥有⼤量机密信息,运维的安全等级要求很⾼,堡垒机是提⾼其安全合规⽔平的必备选择。 服务业 传统服务⾏业,以及包括了物流交通⾏业在内的、依托于信息技术发展演进的现代服务业,普遍具有分布式基础设施的安全 管控需求,同时 医疗医药 医疗医药⾏业的信息化⽔平呈现⾼速发展的态势,IT 资产规模快速扩张,迫切需要通过堡垒机实现⼤规模 IT 资产的统⼀管 理与安全运维。 房地产及酒店 房地产和酒店⾏业的业务系统通常随业务经营场所分布式构建,IT 基础设施⾼度分散,需要通过堡垒机实现 IT 基础设施的 统⼀安全运维。 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 堡垒机企业版 堡垒机企业版部分⽤户。 强⼤的市场影响⼒:堡垒机 = JumpServer JumpServer 堡垒机的特⾊功能 体验极佳的 Web Terminal ⼴泛的 多云管理⽀持 超⼤规模 分布式资产⽀持 全⾯的数据库 运维安全审计⽀持 ⽀持审计录像 的云端存储 内置多组织体系 强⼤的 远程应⽤发布能⼒ 灵活的 软件 / 硬件 部署⽅案选择 1 3 6 8 2 40 码力 | 40 页 | 6.66 MB | 1 年前32020 中国开源年度报告
远程办公是当下⾮常重要的⼀种办公⽅式,在参与者中,有⼋成认为远程办公是重要的,并且 有接近九成的参与者有过远程办公的经历。 【专家点评】 ⾼阳:远程办公会变成⼀种常态化的办公和协作⽅式融⼊到我们的⼯作和⽣活中,开源运动和 分布式、远程协同本来就是天然融合的。 4.6 第⼀次接触的开源产品 有 32% 的参与者第⼀次接触的开源产品为互联⽹产品,紧随其后的便是操作系统相关的产品 与开发⼯具,调查结果与以往基本⼀致,说明互 ElmFE/element 作为 前端组件,表现也⼗分突出。 PingCAP 在开源领域的表现也是⾮常地亮眼。Top50 项⽬中上榜的项⽬有 6 个,包括由其 ⾃主设计、研发的开源分布式关系型数据库 pingcap/tidb,分布式事务型的键值数据库 tikv/tikv,⽂档项⽬ pingcap/docs-cn、pingcap/docs 等,表明 PingCAP 很重视项⽬⽂档 的建设。值得关注的项⽬是 从 GitHub 上的数据未能充分展现其实⼒,中美宏观贸易战的影响在此略⻅⼀斑。WeBank 微 众银⾏作为新兴的互联⽹⾦融公司,已开源 27 个项⽬,44 个 repo,覆盖⼈⼯智能、区块 链、云计算和⼤数据等领域,也是公司早期就建⽴开源办公室的⾦融公司。滴滴开源势头很 猛,成⽴开源委员会,不仅积极参与业界开源项⽬,还在 GitHub 上积极开放出 38 个 repo。Deepin 的桌⾯环境0 码力 | 46 页 | 4.09 MB | 1 年前3
共 12 条
- 1
- 2