2023 中国开源开发者报告
2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。 二、 New Bing(Bing AI)代表了微软在 LLM 领域的野心和 Midjourney 这两大图像生成系统 的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应 用,它们突破了传统图像生成方式的局限,仅需要用户提供 文字描述,就可以生成高质量的数字艺术作品。它们的图像 生成质量、样式多样性和用户便捷性都是极大的突破。这为 广大的个人用户和创意行业提供了强有力的工具,彻底改变 了数字艺术内容的创作方式。同时,它们也引发了人工智能 在创作领域的伦理和法律讨论。LLM 的 “ 2023 Generative AI in the Enterprise”报告显示: 54% 的 AI 用户预计 AI 的最大好处是提高生产力。 77% 的受访者使用 AI 来辅助编程。其中提到的具体 应用包括欺诈检测、教学和客户关系管理。 AI 用户表示,AI 编程(66%)和数据分析(59%) 是最需要的技能。 许多 AI 采用者仍处于早期阶段:26% 的人使用0 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
2017 年 2018 年 2019 年 2020 年 2021 年 2022 年 2023 年 2024 年 2014-2024 Gitee 用户数增长曲线 1350 万 2024年Gitee总用户数 150 万 2024年Gitee新增用户数 5 / 111 开发者是社区的力量源泉 140,000 1,000,000 3,000,000 5,000,000 15,000 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 DeepSeek Janus 等多款移动友好型模型。其中,最新发布的 GLM Edge 1.5B 模型通过与 高通 GenAI 扩展的联合优化,在搭载骁龙 8 Gen 4 处理器的手机上实现了每秒 65 个 tokens0 码力 | 111 页 | 11.44 MB | 8 月前3中国开源软件产业研究报告
的价值量,还有可能为之带来增长 开源软件理念的前身是美国计算机软件产业起步之时就在软件开发者群体中流传的“自由软件”理念,彼时这些开发者认 为软件不应该成为一种私有财产,而应该被公开成为公共资源,这样做的好处在于通过让海量的用户对软件进行使用和反 馈来帮助开发者进行产品升级——这是一种只有在软件这样的产品上才能够实现的发展模式;然而,自由软件理念与企业 商业化运营背道而驰。随着计算机产业的发展,软件作为一种产品的商业价值显 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 开源软件的发展理念(二) 通过海量用户和开发者汇聚创意和检查漏洞,由市场自然选 择最优的发展路径——与“大教堂”相反的“集市”模式 Eric S·Raymond所著的《大教堂与集市 The Cathedral & the Bazaar 发模式:“大教堂”模式指代的是软件企业进行商业化软件开发的流程, 通常由少数领导决策、下属团队执行,开发过程紧凑高效,以商业化成功为导向;“集市”模式指代的是开源软件的开发 模式,软件代码公开,海量用户和开发者在了解软件的过程中不断提出改进意见并查缺补漏,并都在开源社区中交换彼此 的创意和意见,满足市场需求的开发路径自然会获得更多人的青睐和进一步的改进。热衷于开源运动的开发者认为,“集 市”模式通0 码力 | 68 页 | 3.63 MB | 1 年前32023年中国基础软件开源产业研究白皮书
技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 5%)。 Github2025年开源贡献者比例预估(按国别分) 从国内角度看中国开源现状 Gitee2022年平台上开源指标的变化 平台仓库 2500万 新增用户 200万 新仓库 480万 总用户 1000万 CSDN2023年调研:使用开源软件的开发者比例 64% 32% 2% 2% 经常使用 偶尔使用 不清楚 从未使用 42% 49% 2022 2023 iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开0 码力 | 43 页 | 4.69 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
网易早期云存储产品诞生,支撑网易邮箱运行。 数帆阶段 网易云阶段 前身阶段 数帆历程 04 COMPANY 背靠24 年互联网技术积累 成熟可靠 年 24 140 余项技术专利 140 12 亿终端用户体验支持 亿 12 100 余家行业头部客户 + 100 产品与方案均经 网易大规模内部实践验证; 标杆项目均与行业龙头企业共建。 自主可控 产品基于开源内核, 底层实现全面跨云; 基础软件实现国产兼容,推动信创。 领域标杆厂商 CCF Top10 大数据应用最佳实践案例 中国长三角数字经济大会“数字经济优秀案例企业” CTDC 年度优秀微服务创新产品奖 浙江省大数据应用服务创新奖 信通院 OSCAR 尖峰开源用户奖 教育部科技进步一等奖( “海量混合时态数据融合处理关键技术及应用”项目) 全球云计算大会“全球最佳实践奖” 2021 2020 2019 2018 HONOR 数帆荣誉 07 温氏集团 网易数帆轻舟团队协助我们构建了大华统一产品服务中心,大幅 提升了不同产品线的信息交互效率。轻舟云原生平台使我们统一 了企业信息化标准,降低了运维难度,并提升了平台的稳定性和可 扩展性,改善了用户体验。后续将继续基于轻舟进行共享能力中 心的沉淀,加速前端业务需求的响应速度,构建企业信息化服务 资产体系。 信息科技部 屠经理 大华股份 网易数帆与海亮的合作是基于海亮自身的业务需求出发的,在与0 码力 | 43 页 | 884.64 KB | 1 年前32021 中国开源年度报告
……………………………………………………………………………………… 66 6 2.4 新增开源项目领域分布 …………………………………………………………………………… 66 2.5 年度最受开发者关注的用户 ……………………………………………………………………… 67 2.6 年度最受开发者关注的组织 ……………………………………………………………………… 67 2.7 Gitee 指数 ………… 涨,学校里老师 们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源领域投入的比例偏小。开源领域资深专家 的比例偏低,技术人员梯度不够合理,也是国内各大开源社区在吸引贡献者方面,可以优化的地方。 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人单位越来越认可学生 在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应该也不乏各种刷榜行为,需要开源项目所 的优势。客观来看,这对开源的发 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 在于让部分厂商为了取得差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放 式创新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术竞争力以及产品 本身的可维护性。 段夕华:不知道 21 年底所爆发的 log4j0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
情高涨,学校里老师们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源 领域投入的比例偏小。开源领域资深专家的比例偏低,技术人员梯度不够合理,也是国内 各大开源社区在吸引贡献者方面,可以优化的地方。 Du Junping: More than 40% of the developers participating in open source projects are students 指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放式创 新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术 竞争力以及产品本身的可维护性。 Du Junping: Due to the Jiang Ning: people use open source projects from the perspective of solving their problems. 堵俊平:用户是大部分人接触开源的首要角色,也是最重要的角色。对开源项目而言,有 独创性的特色功能是引发大众关注和使用的关键。 Du Junping: Users are the first and most0 码力 | 199 页 | 9.63 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
Azure CNI Overlay Azure CNI Overlay可以利用覆盖的网络来降低 IP地址的使用率,同时提供更好的性能和可扩 展性。借助该功能,AKS集群可以扩展至非常 大的规模,并且用户定义的私有CIDR还可以在 不同AKS集群中重复使用,从而大幅扩展了 AKS中运行的容器化应用程序可用的IP空间。 02 前沿技术 全球开源态势洞察|第十期 04 Envoy Gateway v0 置等; • 添加EDS支持(Endpoint Discovery Service)。 近日,OpenYurt v1.3.0发布,版本特性更新如下: • 重构Openyurt控制平面组件; • 允许用户为静态Pod定义Pod模板和升级模 型; • NodePort Service支持节点池隔离。 近日,Rainbond v5.14.0发布,版本特性更新 如下: • 各语言源码构建包版本升级; • 的动态配置更新机制,同时保持了轻量级的配 置文件结构。此外,Contour引入全新入口 API HTTPProxy,该API通过自定义资源定义 (CRD)来实现。其主要目标是扩展Ingress API的功能,以提供更丰富的用户体验并解决 原始设计中的局限性。 近日,Contour v1.25.0发布,版本特性更新 如下: • Contour的HTTPProxy支持配置Envoy的 RBAC过滤器的功能,以根据IP地址允许或0 码力 | 22 页 | 1.99 MB | 1 年前3Moonshot AI 介绍
Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 引领⼤模型的“⽆损⻓上下⽂”时代。202 海外独⻆兽:contextlength的提升存在什么规律?有技术可预⻅性吗? 杨植麟:我⾃⼰感觉存在contextlength的摩尔定律。但需要强调:给定⻓度下的准确率也⾮常重 要,需要同时优化⻓度和准确率(⽆损压缩)两个指标。 在保证模型能⼒和智商的情况下,我觉得⼤概率contextlength的提升是指数级增⻓的。 多模态:⼤部分架构不值得被scaleup 海外 er才会有techvision? 杨植麟:核⼼是两点,⼀个是抓⼤放⼩,⼀个是终局思维。我跟很多researcher合作过,容易出现的 ⼀个问题就是过分雕花,容易在局部⾥看到有很多可以优化的东西,⽐如我们发现transformer解决 了LSTM的contextlength问题,但如果再跳出来⼀层,就会发现本质上每⼀代技术都是在提升 contextlength。0 码力 | 74 页 | 1.64 MB | 1 年前32020 中国开源年度报告
Foundation)」官⽅正式对外发声,⼤家对此抱有多重期望:推⼴开源的理念,开源⽂化 教育和社区建设,建⽴开源⽣态体系,对开源项⽬进⾏早期的孵化和扶持,帮助中国开源 社区进⾏资源的整合和优化,并接轨国际开源社区。 3、开发者群体特征 3.1 参与者普遍年轻且学历较⾼,男性占⽐⼋成 参与者的年龄集中在 20-39岁,受教育程度普遍在本科及以上,其中男性占⽐约为 84%,⼥ 性为 16%,与去年持平。 中国成⽴开源基⾦会的作⽤ 参与者们⼀致认为中国成⽴开源基⾦会是⾮常有意义的,可以推⼴开源的理念,开源⽂化教 育,社区建设,建⽴开源⽣态体系,利于开源项⽬早起的孵化和扶持,帮助中国开源社区进⾏ 资源的整合和优化,也有助于接轨国际开源社区。 【专家点评】 蒋涛:在全球科技竞争和中国开源核心技术发展态势下,从开源生态制高点着眼,建设和发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 提升,更好地满⾜⼴⼤ AI 开 发者的使⽤需求,也让⼴⼤开发者形成了更强的社区认同感。 深度学习框架在 AI 技术栈中处于承上启下的位置,向下对接芯⽚,向上承接应⽤,与芯⽚⼴ 泛适配、深度融合优化⾄关重要。因此⻜桨跟硬件⼚商建⽴了紧密合作关系,很多芯⽚⼚商直 接在⻜桨社区贡献代码,为⻜桨⽣态发展做了⼤量贡献。⻜桨也持续与各⼤开源组织、AI 社 区深度合作,并得到启智(OpenI)社区的⽀持成为其中重要⼀员。通过0 码力 | 46 页 | 4.09 MB | 1 年前3
共 12 条
- 1
- 2