2024 中国开源开发者报告
本部分图表仅用于数据展示,不涉及先后排名 作为国内及业内领先的 AI 开发基础设施,本部分图表 中的开发框架、向量数据库、 开发平台、大模型均表现出 色,代表着它们的代码提交 频率、参与者、代码合并比 率等协作开发工作保持着较 高的水平。 17 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名 稳健性-活跃度 作为 AI 开发生态中的关键组 成部分,本部分图表中的开发 速完善。这一趋势表明,未来中国有可能在全球人工智能领域占据更为核心的地位。 开源生态的繁荣与协作 随着开源模型影响力的提高,中国开源社区的活跃度也明显提升。无论是企业、研究机构还 是个体开发者都更加积极地参与到开源工作中。 以阿里巴巴的通义千问 Qwen 为例,据不完全统计,截止 2024 年 9 月,全球已有近 8 万基于 Qwen 的衍生模型,超越了 Meta 的 Llama。该系列模型已被集成到 Hugging 设,建立了更完善的协作机制,从而在开源模型 (如 InternLM) 和数据集 (如 Infinity-MM) 领 域贡献了大量有影响力的基础工作和资源。 2024 年,中国开源社区涌现出众多高质量的自发研究成果。其中,MAP 团队推出的全开 源模型 Map Neo 引人瞩目。该模型在训练数据、脚本以及模型对齐工作上实现了全面公开, 成为国内少有的真正意义上完全开源的项目。 22 / 111 而 InstantX 团队的0 码力 | 111 页 | 11.44 MB | 8 月前32021 中国开源年度报告
…………………………………………………………… 27 目 录 2021 中国开源年度报告 5 4.2 检索开源项目的原因 ……………………………………………………………………………… 29 4.3 参与开源社区的工作 ……………………………………………………………………………… 30 4.4 接触开源的时间 …………………………………………………………………………………… 31 4.5 在开源中的时间投入 …………………………………………………………… 83 3.1 开源软件商业化可以选择的路径和案例 ………………………………………………………… 84 3.2 开源项目的 life cycle 以及软件供应商在对应阶段的重点工作 ……………………………… 85 3.3 商业化过程中的风险点 …………………………………………………………………………… 87 4 投资——如何找到下一个开源独角兽 …………………………………………………… 从两个角度展开,其中包括个人信息(包括工作信息和开发者技术信息)和开源社区参与 情况,与往年不同的是,今年我们加入了开源社区度量和开源商业化相关的话题,欢迎大 家参与问卷并发表自己的想法。 通过 44 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现状, 从而为开源的后来人提供权威的参考。 调查对象 :覆盖开发者、社区成员、贡献者、学生、政府企业管理人员 调查内容 :主要涵盖个人信息、工作状况、开源社区以及开发者技术0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
Chinese open source scenarios in 2021. 这份问卷是每年中国开源年报的重要一环,不基于调研的分析报告不过是纸上谈兵。问卷从两 个角度展开,其中包括个人信息(包括工作信息和开发者技术信息)和开源社区参与情况,与 往年不同的是,今年我们加入了开源社区度量和开源商业化相关的话题,欢迎大家参与问卷并 发表自己的想法。 This questionnaire is community members, contributors, students, government and corporate executives 调查内容 :主要涵盖个人信息、工作状况、开源社区以及开发者技术 Survey content: mainly covers personal information, work status, open source community men and 18% are women, which is the same as last year. 相较于 2020 年,今年的问卷参与者中,还未工作的人群占了绝大部分,从参与者从事领 域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍追 求更高学历深造有关。 Compared with 2020, the majority of participants0 码力 | 199 页 | 9.63 MB | 1 年前32023 中国开源开发者报告
全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 编程(66%)和数据分析(59%) 是最需要的技能。 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试 的最大风险。 工业和信息化部赛迪研究院数据显示,目前,我国已有超 过 19 个大语言模型研发厂商。其中,15 职前盗取了公司开发的手游 源代码;并将该手游的源代 码提供给 了另一家网络 公 司,对方进行简单 “换皮” 之 后就开始上线经营。 创建颜值打分网站——结局很“刑” 一年私吞 260 余万元 民警随即展开工作,最终嫌疑人曹某迫于压力主动投案自首。 曹某是该公司的软件工程师,他坦白称,去年 8 月发现公司网站后台的漏洞, 用母亲和朋友身份证注册了两个 ETC 账户。一年内两个账户分别从公司提取 来了 2300 码力 | 87 页 | 31.99 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
Platform v2.5发布 04 04 04 04 05 05 05 05 DEF CON将举办全球最大规模AI黑客大赛 微软将用近一年时间完成对0-day Secure Boot漏洞的修复工作 06 06 04 开源热点 芬兰南萨沃计划建立开源能力中心 Decidim参与式民主的开源平台正在被日本广泛使用 图林根继续支持开源替代方案 07 07 08 09 10 11 16 确定位攻击活动,同时还可以根据集群的当前 状态提供可操作的补救措施。具体功能包括: • 实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; • 防止部署不合规的工作负载,减少潜在爆炸 半径; • 扫描漏洞并为运行的容器生成SBOM。 OpenSIL的目标不是取代UEFI,而是集成在 其他主固件中,比如核心启动、重启、Forti- BIOS,可以与主固件静态链接,绕过任何主 Google、AWS(亚马逊)、Meta(Face- book)、AMI等行业巨头,都是AMD Open- SIL的合作伙伴。 AMD为实现OpenSIL设定了四个阶段的POC (概念验证)评估工作,第一阶段已开始, 兼容Zen4架构的四代霄龙(Genoa),接下 来经过Zen5架构的五代霄龙(Turin),最 终在2026年Zen6架构的六代霄龙上成为默认 值,届时AGESA则会退出。 注0 码力 | 22 页 | 1.99 MB | 1 年前3中国开源软件产业研究报告
关于开源软件的内容(代码) • 开源软件必须包含可理解与运用的源代码,或提供简便的获取 源代码的方式;且开源代码必须允许以源码或编辑后文件的形 式传播 • 开源许可须允许源码修改及其他衍生工作 关于开源软件传播的规范 • 开源许可不得限制开源软件的再传播,不得以此为由收费;仅 当配合补丁文件一起发布时,开源许可证可以禁止修改的代码 的发布;必须允许修改后的代码生成的软件的发布 • 企业开源 开源基金会 开 源 社 区 代码托管平台 开源软件论坛 专家指导 产业联盟 法律服务 市场宣传 二次开发者 软件用户 • 开源代码的源作者/最初贡献 者可能是企业、个人、工作 室等主体,没有任何限制 • 源作者开源软件作品的动机, 可能是企业的战略和市场决 策,也可能是个人的爱好和 对开源产业的支持 • 聚焦到企业为主体的开源行为上来,企业进行开源运营可以选择通过自 语 言,Java的使用率达到37.2%。从增速上 来看,易语言、Rust和Dart位列2020年增 速最快语言前三甲。易语言以中文作为程 序代码,可实现用中文来编写程序,便于 国人进行程序编写与开发工作 ↑ ↓ 283 458 514 1500 2017 2018 2019 2020 2017-2020年开源项目数 82% 82% 82% 84% 84% 89% 2020年行业代码库开源占比0 码力 | 68 页 | 3.63 MB | 1 年前3Gitea,新一代的代码托管平台
依赖项扫描 百科管理 项目管理 其他能力… 合并请求 代码审查 分支管理 代码仓库 Git代码托管 核心能力 新一代的代码托管平台 Gitea 的定位 遵循典型的 Git flow 工作流程 编写代码 01 创建仓库 管理员创建仓库,分支保护策略 、合并方式等,并进行初始化 02 clone 仓库 开发人员将仓库 clone 到本地开发机器 03 创建分支,代码编写, 风格兼容 • API 高度兼容:大部分 GitHub 第 三方应用可复用; • Actions 高度兼容:大部分 GitHub Actions 插件可复用; • 工作流程/操作语法兼容:与 GitHub Actions 工作流程、操作语 法高度兼容。 生态兼容 • 类 Github 的使用体验,使用习惯无缝衔接; • 完全兼容 Git 命令,无额外学习成本; • 提供 Tea 命令,操作方便、快捷、高效。 SQL 等。 部署简单 • 拥有出色的第三方集成社区,全面覆盖控制面板、迁移、插件、脚本、工作流、 主题等各方面内容; • Drone、Jenkins、VSCode、 Intellij 等应用均已内置集成 Gitea; • 支持通过 Gitea API 将 Gitea 与其他系统或工具集成,实现高效的工作流程。 集成简单 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 简单易用0 码力 | 30 页 | 14.34 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
规划、实施、运维各环节。 实力积淀 核心优势 STRENGTH 数帆实力 05 COMPANY 国家级组织资质 国家高新技术企业 国家规划布局内重点软件企业 国家企业技术中心 国家级博士后科研工作站 云计算技术认证资质 信通院可信云服务网格先进级(最高级别)评估 信通院数字化可信服务能力认证(轻舟低代码平台) 可信云微服务评估先进级认证 Kubernetes 一致性认证 华为鲲鹏计算兼容性测试认证 业内首个提出中台的模型设 计标准,遵循先设计后开发理 念,通过模型设计中心对逻辑 建模进行指导。 统一指标管理 基线智能预警 海量任务运维和管理,提供 异常基线报警处理,辅助任务 运维人员完成工作。 数据资产360 建立集安全、价值、成本、质 量、标准于一体的健康评估指 标体系和优化工具,打造360° 无死角数据资产治理体系。 指标建设流程规范化,消除指 标口径二义性,帮助企业进行 指标规范化管理,提高数据输 解决跨系统数据一致性问题 满足快速地个性化开发,支持创新 解决方案: 打造统一技术中台解决方案 实现业务中台分布式服务化建设 建设统一的技术中台支持快速迭代 客户收益: 稳步推进企业服务化架构升级 解决工作流引擎数据一致性问题 解决了金融企业中统一的接入问题 混合所有制金融科技服务企业。 华融科技 客户需求: 信息系统难以形成有效管理和支撑 业务的多样性,运维挑战大 外联服务多,支持难度大、周期长0 码力 | 43 页 | 884.64 KB | 1 年前32023年中国基础软件开源产业研究白皮书
实现互惠互利、共建共享 获得职业发展机会 提高自我认同 提升自身知识技术水平 占比(%) 56.6% 53.9% 参与开源贡献的原因 开源代码仓、开源社区公开课程、讲座、技术指南已 成为开发者在工作学习外的重要行业知识来源 知识技术 水平提升 实现自我 价值认同 开发者多以兴趣为导向选择开源项目,在帮助项目逐 渐完善的过程中,完成自身的价值认同 获得职业 发展机会 对开源社区的贡献能够很好的反应开发者的技术素 参与传播开源项目 13.8% 参与文档相关贡献 10.9% 参加开源兴趣小组 8.9% 协助社区活动举办 5.5% 维护基于开源商业化项目 5.2% 开源布道者 4.5% 参与开源社区运营工作 4.4% 其他 0.9% 开源社区中,使用者比例最高,使用开源软件、发掘开源代码是大多 数开发者加入开源项目的起点,随着与社区的绑定不断加深,使用者 逐渐向贡献者转化,围绕项目提出自身的建议或优化方向。 业专家与“技术大神”,履行了“提升我国对全球开源贡献”这一重要使命。 来源:开放原子开源基金会官网,2023年11月;公开资料,由艾瑞咨询研究院自主研究及绘制。 开放原子开源基金会 技术指导 营销指导 项目指导 用户指导 项目工作委员会 开源战略咨询:帮助企业制定开源战略布局,规划开源成功路 径,提出开源实施方案 开源法律赋能:提供开源许可证翻译,完成评审并发布。组织开 源法律书籍翻译,公益课程及合规论坛 开源项目运营:支0 码力 | 43 页 | 4.69 MB | 1 年前3
共 9 条
- 1