2021 中国开源年度报告
PingCAP/TiDB,其开源策略、战术均值得大家学习借鉴。 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和 政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认可。尤其是开源与数据(数据库 & 大数据) 以及 AI 等热点技术相结合,更是为市场带来了极大的想象空间。 参与者所在企业类型 外企 国内初创公司 国内大型互联网企业 国企 / 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 在于让部分厂商为了取得差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放 式创新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术竞争力以及产品 本身的可维护性。 段夕华:不知道 21 年底所爆发的 log4j 漏洞,是否会让公司购买开源产品更加保守谨慎?开源安全任重而道远。 托管意味着提供一个完全托管的项目版本,当用户想要在生产中部署时,可以使用该软件启动远程服务器, 而不必担心它不用担心备份、停机、升级等问题。Databricks、Acquia 等公司已经成功证明了托管模 式商业化路径的可行性。但是这也引起了公有云提供商(例如 AWS)与开源社区的矛盾。 Restrictive Licensing 限制性许可——通过提供一个带有稍带限制的开源许可证来激励使用者进行付 费。GPL0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
tactics are worth learning. 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认 可。尤其是开源与数据(数据库&大数据)以及 AI 等热点技术相结合,更是为市场带来 了极大的想象空间。 Du Junping: In the past two years, 指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放式创 新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术 竞争力以及产品本身的可维护性。 Du Junping: Due to the rapid development Roadmap strategy development and community construction - product management 在开发者社区进行有效构建后,下一个阶段是指定产品路线并加速扩大社区。企业应明确软件 产品的专有和开源路线图,分析产品特点及使用信息反馈以预测销售机会。目前大多数开源软 件企业采用 Open Core 开放核心模式以及 SaaS 托管模式,旗下产品或服务通常分为免费版0 码力 | 199 页 | 9.63 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
数帆历程 关于数帆 数帆实力 荣誉资质 客户名录 客户口碑 业务全景 产品篇 网易有数 网易轻舟 网易易智 客户案例篇 解决方案篇 数据中台解决方案 业务中台解决方案 金融分布式解决方案 金融大数据解决方案 零售大数据解决方案 零售行业 金融行业 制造行业 综合行业 02 03 04 02 01 04 05 06 08 09 10 12 16 35 38 39 25 26 27 28 29 COMPANY 企业篇 COMPANY HISTORY 升级轻舟云原生软件生产力平台及有数全链路数据生产力平台;发布金融分布式、金融大数据、零售大数据、制造业智慧供应链等行业解决方案。 发布轻舟低代码平台 2.0 。 大数据开源项目 Kyuubi 全票进入 Apache 软件基金会孵化器。 有数 BI 个人版永久免费 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 Spark 3.x 版本开发;开源企业级数据湖探索平台 Kyuubi ;发布首个开源项目分布式存储系统 Curve。 2019 发布全链路数据中台解决方案。 2018 发布轻舟微服务、“瀚海”私有云及国内首款云计算全栈一体机。 2017 加入云原生计算基金会(CNCF)。0 码力 | 43 页 | 884.64 KB | 1 年前3Moonshot AI 介绍
Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 引领⼤模型的“⽆损⻓上下 ⾔模型可以有⾮常尖峰的分布。让它回答“中国的⾸ 都”,模型对“北”这个字能给出99%的概率。同时,如果我今天让它写⼀本⼩说,那它可能下⼀个 词的概率分布就会很均匀。概率其实是⼀个通⽤的表⽰⽅式。本质上这个世界上有⼤量的熵,抓住确 定性的东西,让本⾝是混沌的东西继续混沌。 通往AGI的话,long-context会是⼀个很重要的点。所有问题都是long-context的问题⸺历史上所 后花⼀倍的成本来训练。会出现新的范式,推理即训练,⽽且这个推理不是为任何⽤⼾服务的,只为 ⾃⼰本⾝的合成数据服务。 出现这种情况的话,能源的问题也解决了,因为推理是可以分布式的。⽽且它不违背定律,本质还是 个能源守恒。只不过我把计算范式改变了,让能源能够以分布式的⽅式解决。 超级应⽤:模型的微调可能最终不存在 海外独⻆兽:Google和抖⾳背后的搜索和推荐有很强的⻜轮效应,算法能根据⽤⼾的⾏为实时反 馈,⽤0 码力 | 74 页 | 1.64 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
堡垒机企业版 JumpServer 公开案例研究 4 JumpServer ⼀体机及信创⽅案 3 5 ⽬ 录 各种类型 的 IT 资产 为什么要使⽤堡垒机? - 以更安全、更⾼效的⽅式管控和登录各种类型的资产 - 系统管理员 普通⽤户 外包⼈员 临时访客 服务器 ⽹络设备 数据库 Kubernetes 事前授权 事中监察 事后审计 管理者期望 堡垒机的 4A 能⼒ 身份鉴别 制造业已经完成了从集中式制造向分布式制造的演进,⼤型制造企业往往在境内外拥有多个⽣产基地,需要借助堡垒机实现 分布式 IT 资产的统⼀运维安全审计。 政府及国有企业 政府机构及国有企业拥有⼤量机密信息,运维的安全等级要求很⾼,堡垒机是提⾼其安全合规⽔平的必备选择。 服务业 传统服务⾏业,以及包括了物流交通⾏业在内的、依托于信息技术发展演进的现代服务业,普遍具有分布式基础设施的安全 管控需求,同时需 医疗医药⾏业的信息化⽔平呈现⾼速发展的态势,IT 资产规模快速扩张,迫切需要通过堡垒机实现⼤规模 IT 资产的统⼀管 理与安全运维。 房地产及酒店 房地产和酒店⾏业的业务系统通常随业务经营场所分布式构建,IT 基础设施⾼度分散,需要通过堡垒机实现 IT 基础设施的 统⼀安全运维。 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 堡垒机企业版 JumpServer0 码力 | 40 页 | 6.66 MB | 1 年前32023 中国开源开发者报告
1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 GenAI。根据金融数据和软件公司 PitchBook 的数据,从 截至 3 月 29 日追踪的 9 笔交易来看,生成式 AI 公司 的投前估值中位数已经飙升至 9000 万美元,高于 2022 年的 4250 万美元。PitchBook 的分析师预测,以 32% 的复合年增长率计算,到 2026 年,生成式 AI 市场规模 将达到 981 亿美元。 1 1 由 英 国 知 名 风 投 公 司 Air Street 英伟达凭借各国、初创公司、大型科技公司和研究人员 对其 GPU 的巨大需求,跻身市值万亿美元俱乐部; 主要芯片供应商开发了不受出口管制影响的替代产品; 在 ChatGPT 的带领下,生成式 AI 的应用在图像、 视频、编码、语音等领域取得了突破性的进展,带动了 180 亿美元的风险投资和企业投资。 O'Reilly 发 布 的 “ 2023 Generative AI in the0 码力 | 87 页 | 31.99 MB | 1 年前32020 中国开源年度报告
⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 来,越来越多的⼈开始远程办公,事实上促进了更多的⼈有机会“斜杠化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 来越多的,⾼质量的中国开源项 ⽬,选择在 Gitee 上开源。曾经有⼀位朋友提到的 “One World, Two Systems”,将会逐 渐变成现实。 如果中国的开源,以⼀种与世界隔离的⽅式 “崛起”,这并不是我们希望看到的未来。 3. 开源向善以及我们尚未做好准备 疫情爆发以来,众多的开源⼈奉献⾃⼰的时间、精⼒、技术和智慧,投⼊到⼀个⼀个的抗疫相 关的开源项⽬之中,也因此诞⽣了诸 调查内容:主要涵盖个⼈信息、⼯作状况、开源社区以及开发者技术 调查⽅法:以在线问卷⽅式搜集样本和数据,交叉对⽐法分析数据 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:59 问题类型:单选、多选、开放性 样本量:236 2、重要发现 由于疫情,今年的问卷全部通过线上的⽅式传播,因此收集到的样本量相⽐往年较少,但仍旧 能够管中窥豹,观察到中国开源世界的悄然变化。通过分析0 码力 | 46 页 | 4.09 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
DEF CON将举办全球最大规模AI黑客大赛 微软将用近一年时间完成对0-day Secure Boot漏洞的修复工作 06 06 04 开源热点 芬兰南萨沃计划建立开源能力中心 Decidim参与式民主的开源平台正在被日本广泛使用 图林根继续支持开源替代方案 07 07 08 09 10 11 16 06 开源创业企业 PingCAP平凯星辰 07 开源报告 开源软件国家情报报告-捷克 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 Mirantis发布轻量级 Kubernetes发行版k0s v1.27 Docker和Kubernetes开发公司Mirantis发布 了其轻量级开源Kubernete发行版的最新版本 器健康状态和可用性的功能; • 添加所有查询加载的样本总数指标。 OpenYurt v1.3.0发布 OpenYurt是由阿里云开源的基于原生Kuberne- tes构建的、业内首个对于Kubernetes非侵入式 的边缘计算项目,目标是扩展Kubernetes以无 缝支持边缘计算场景。它提供了完整的Kuber- netes API兼容性;支持所有 Kubernetes工作负 载、服务、运营商、CNI插件和CSI插件;提供良0 码力 | 22 页 | 1.99 MB | 1 年前32023年中国基础软件开源产业研究白皮书
openEuler通过全栈原子化解耦和榫卯架构,可以做到版本灵活构建和服务自由组合,从而实现一套操作系统架构对全场景应用、主 流设备的全覆盖。除南向支持多样设备,北向覆盖应用场景外,openEuler还通过分布式套件与OpenHarmony系统互通,从而提 供更全面、更丰富的解决方案。这种融合不仅有助于促进用户之间的无缝交互,也为开发者提供了更多的创新空间和灵活性。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 openEuler连接全景图 主流场景100%支持 | 含3.5W+主流应用 + + 工业控制 云原生 大数据 CDN MEC … 覆盖全场景应用 支持多样性设备 服务器 边缘计算 嵌入式 云计算 主流计算架构100%覆盖 | 220+整机,1000+板卡 LoongArch ARM X86 RISC-V SW-64 … Power openEuler:面向数字基础设施的开 源操作系统,通过一套操作系统架构 OpenHarmony技术架构 应 用 层 发 行 版 内核层 LiteOS-M LiteOS-A Linux kernel Uniproton 驱动 HDF统一驱动框架 开发框架与系统服务 分布式基座 图 形 部 件 媒 体 部 件 Ability 部 件 ArkUI 部 件 网 络 部 件 安 全 部 件 通 信 部 件 传 感 器 部 件 …… 政务 金融 制造0 码力 | 43 页 | 4.69 MB | 1 年前32024 中国开源开发者报告
力,也为国际开 源生态的发展产生了积极的影响,为全球开发者提供了更多创新和应用的可能。 中国开源模型从最初的质疑中崛起,逐步赢得了广泛认可。这不仅彰显了中国开源模型从追 随者到行业引领者的跨越式成长,也为全球人工智能发展注入了新的活力与动力。中国开源模型 的成功并非偶然。在政府对人工智能产业的持续支持以及国内人工智能行业对模型研发的巨额投 入下,从基础算法到行业应用、从算力基础设施到数据资源整合,中国人工智能生态体系正在迅 种监管创新为开源模型的发展提供了稳定的政策环境,同时确保技术应用符合社会价值导向。比 如 《人工智能示范法 2.0(专家建议稿)》对于免费且已开源方式提供人工智能研发的个人和 组织给予减轻或免承担法律责任;《生成式人工智能服务管理暂行办法》 则明确了人工智能技 术的使用和合规要求,促进了开源模型在合规框架下良性发展。 变革 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 Tibor Blaho 还曾爆料,OpenAI 用于训练“猎户座“的数据中,已经包含了由 GPT-4 和 O1 产出的合成数据。 这不仅是因为自然存在的高质量文本的匮乏,还因为智能体所需的数据很可能需要显式地蕴 含任务思考和规划的拆解信息。然而,针对合成数据的问题,学术界早有预警,模型可能会在合 成数据上的持续训练中崩坏【14】。 33 / 111 这是因为合成数据往往携带“错误”和“幻觉”,在一些冷门的知识上尤甚。因此,合成数0 码力 | 111 页 | 11.44 MB | 8 月前3
共 12 条
- 1
- 2