2024 中国开源开发者报告
型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能, 赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在性能和成本上实现了革命性突破,开创高性价比的 AI 新纪元。 智谱的 CogVideoX 系列文生视频模型,成为全球首批开源的文生视频模型之一,不仅在 技术方面让中国视频生成模型列入领先梯队,强化了中国模型在全球范围的竞争力,也为国际开 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 DeepSeek Janus 等多款移动友好型模型。其中,最新发布的 GLM Edge 1.5B 模型通过与 高通 GenAI 扩展的联合优化,在搭载骁龙 8 Gen0 码力 | 111 页 | 11.44 MB | 8 月前32023 中国开源开发者报告
ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、 摘要、写作、编码,以及响应用户的提问。 四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长, 可通过 API 访问。此外还上线了面向公众的 beta 网站 claude.ai。 2023 年 3 月 14 日,OpenAI 正式推出 GPT-4。 GPT-4 是多模态大型语言模型(Large 发布不久后,一款让这个最强大语言模型能够自主完成任务的开源项 目——Auto-GPT 横空出世,在 AI 领域掀起巨大的波澜。它就像是赋予了 GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断 提高自己的性能。 Auto-GPT 是首批将 GPT-4 应用于自动执行任务的程序之一。 2023 年 11 月 17 日,OpenAI 突然发布公告,宣布 Sam Altman 将辞去首席 执行官一职,并离开 2023 年 9 月,蚂蚁集团正式开 源代码大模型 CodeFuse——基 于蚂蚁基础大模型研发。 这是蚂蚁自研的代码生成专属 大模型,帮助开发者自动生成代 码、自动增加注释、自动生成测 试用例、修复和优化代码等。 2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个 经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720 亿个阿拉伯语词块和 27900 码力 | 87 页 | 31.99 MB | 1 年前3Moonshot AI 介绍
的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 与DeepMind和CMU合作研究,⾸次实现⼩样本性能逼近全监督学习的⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 引领⼤模型的“⽆损⻓上下⽂”时代。20 海外独⻆兽:contextlength的提升存在什么规律?有技术可预⻅性吗? 杨植麟:我⾃⼰感觉存在contextlength的摩尔定律。但需要强调:给定⻓度下的准确率也⾮常重 要,需要同时优化⻓度和准确率(⽆损压缩)两个指标。 在保证模型能⼒和智商的情况下,我觉得⼤概率contextlength的提升是指数级增⻓的。 多模态:⼤部分架构不值得被scaleup 海外0 码力 | 74 页 | 1.64 MB | 1 年前32023年中国基础软件开源产业研究白皮书
iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开 主研究及绘制。 法务服务 社区 治理 社区 运营 代码 审核 开源 开发 生态 合作 法务 合规 开源企业发起者内的多组织协作 开源开发 战略合作 社区运营 代码审核 软件优化 选择适合开源项目的开源协 议,依据企业对项目的开源 方案审定协议中个别条款 向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 4.4% 其他 0.9% 开源社区中,使用者比例最高,使用开源软件、发掘开源代码是大多 数开发者加入开源项目的起点,随着与社区的绑定不断加深,使用者 逐渐向贡献者转化,围绕项目提出自身的建议或优化方向。 14 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、性能优越性、产品成熟度及安全可靠性等方面得到了 各行业客户的验证。目前已服务各领域头部客户百余家,包括工商银行、 浙商银行、银监会、人保金服、深圳证券交易所、华泰证券、名创优品、 古茗、百胜集团、 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更 新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。 异构网络访问 支 持 异 构 协 议 转 换 为 HTTP 协 议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 基于开源自主可控 基于社区开源版本,进行源码级内核优 化,性能增强,自主可控。 完备的监控 丰富的企业经验积累,支持完备的监控 指标。 多云混合云 统一视图管理多云、混合云集群,应用多 集群部署、运维。 可视化流水线 模块化能力,支持可视化拖拽,快速配0 码力 | 43 页 | 884.64 KB | 1 年前3中国开源软件产业研究报告
,艾瑞咨询研究院根据公开资料研究及绘制。 企业开源的战略意义(二) 开源在企业中的使用率提升,带来多维度战略价值 除前文所述的商业价值和成本优化之外,开源软件产业对企业的战略意义还体现在以下三方面:1)技术价值,对具备技 术优势的头部企业而言,开源可加强同业间的交流,实现产品优化,走向国际;对技术能力较弱的企业来说,开源可实现 社会协作,缩小与业界头部企业的技术差距,扩大市场份额。2)品牌价值,企业建立开源社区可实现对技术、人才的网 活跃的开源企业一般为“BATH”四大综合科技企 业以及其他互联网、云计算企业等 从可行性角度上讲,上述企业具备较强的技术、人才和资金 能力,能够自主进行或支持大规模开源运营 从优化产品方面,如前文所述,开源能够帮助企业利用开源 社区资源进行产品优化和升级,提升竞争力 从国内市场状况上看,科技企业、云服务企业正处于激烈的 市场竞争中,开源为企业带来市场影响力、人才吸引力方面 的提升,为企业带来各种隐性收益 特征进行灵活裁剪,满足不同形态的终端设备对于操作系统的要求,可 适应各类智能设备;OpenGauss是华为于2019年开源的数据库产品,内核源自PostgreSQL,采用木兰宽松许可证v2,具 备高性能、高可用、高安全、易运维、全开放的特点,深度融合华为在数据库领域多年的研发经验,并构建起了多个学习 交流平台。 华为OpenHarmony开源分布式操作系统架构 华为OpenGauss开源数据库架构0 码力 | 68 页 | 3.63 MB | 1 年前32021 中国开源年度报告
公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 /TL)来进行产品的选择, 而且在同类型软件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主要 的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献大的供应商。 参与者首次参与 / 转而参与开源项目的原因多为主观原因,例如更好的技能施展空间、更和谐的 社区氛围、更多的朋友,而应公司所在组织的要求来参与开源社区的占比很小。 涨,学校里老师 们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源领域投入的比例偏小。开源领域资深专家 的比例偏低,技术人员梯度不够合理,也是国内各大开源社区在吸引贡献者方面,可以优化的地方。 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人单位越来越认可学生 在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应该也不乏各种刷榜行为,需要开源项目所 公司在购买开源产品(基于开源项目的商业化产品)时,多由工程团队 负责人(技术总监 / 架构师 /TL)来进行产品的选择,而且在同类型软 件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 /TL)来进行产品的选 择,而且在同类型软件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是 主要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献大的供应商。 When companies buy open source products, the engineering team leader (technical 情高涨,学校里老师们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源 领域投入的比例偏小。开源领域资深专家的比例偏低,技术人员梯度不够合理,也是国内 各大开源社区在吸引贡献者方面,可以优化的地方。 Du Junping: More than 40% of the developers participating in open source projects are students 公司在购买开源产品(基于开源项目的商业化产品)时,多由工程团队负责人(技术总监/架 构师/TL)来进行产品的选择,而且在同类型软件的购买中,半数的人会考虑软件供应商对开 源社区的贡献,但不是主要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡 献大的供应商。 When companies buy open source products (commercial products based on open0 码力 | 199 页 | 9.63 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
全球开源态势洞察|第十期 03 Azure AKS正式推出网络方案 Azure CNI Overlay Azure CNI Overlay可以利用覆盖的网络来降低 IP地址的使用率,同时提供更好的性能和可扩 展性。借助该功能,AKS集群可以扩展至非常 大的规模,并且用户定义的私有CIDR还可以在 不同AKS集群中重复使用,从而大幅扩展了 AKS中运行的容器化应用程序可用的IP空间。 02 前沿技术 2017年6月 2016年12月 2016年8月 2015年9月 2015年4月 PingCAP连续两年在CNCF全球贡献排行榜中位列中国企业第一位,全球排名第6位 TiDB通过信通院分布式数据库性能与基础能力两项评测 PingCAP团队的论文《TiDB: A Raft-based HTAP Database》入选VLDB 2020,成为业界第一篇 Real-time HTAP分布式数据库工业 通过公共管理实体在公共管理环境中开发独特的软件解决方案,确保为公共管理表现提供最佳和 高效支持。 - 建立一个统一的、明确的平台,用于开发和推广在公共行政领域的开源软件项目,以支持公共行 政的最高质量的绩效,并持续优化在公共行政领域进一步发展开源软件解决方案所需的资源。 - 向公共行政机构提供确切的、经过验证并已实施的软件解决方案,包括支持、咨询和转让等经验。 - 在公共行政机构互相分享各自的专业知识时,需尽可能降低成本。0 码力 | 22 页 | 1.99 MB | 1 年前32020 中国开源年度报告
Foundation)」官⽅正式对外发声,⼤家对此抱有多重期望:推⼴开源的理念,开源⽂化 教育和社区建设,建⽴开源⽣态体系,对开源项⽬进⾏早期的孵化和扶持,帮助中国开源 社区进⾏资源的整合和优化,并接轨国际开源社区。 3、开发者群体特征 3.1 参与者普遍年轻且学历较⾼,男性占⽐⼋成 参与者的年龄集中在 20-39岁,受教育程度普遍在本科及以上,其中男性占⽐约为 84%,⼥ 性为 16%,与去年持平。 中国成⽴开源基⾦会的作⽤ 参与者们⼀致认为中国成⽴开源基⾦会是⾮常有意义的,可以推⼴开源的理念,开源⽂化教 育,社区建设,建⽴开源⽣态体系,利于开源项⽬早起的孵化和扶持,帮助中国开源社区进⾏ 资源的整合和优化,也有助于接轨国际开源社区。 【专家点评】 蒋涛:在全球科技竞争和中国开源核心技术发展态势下,从开源生态制高点着眼,建设和发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 提升,更好地满⾜⼴⼤ AI 开 发者的使⽤需求,也让⼴⼤开发者形成了更强的社区认同感。 深度学习框架在 AI 技术栈中处于承上启下的位置,向下对接芯⽚,向上承接应⽤,与芯⽚⼴ 泛适配、深度融合优化⾄关重要。因此⻜桨跟硬件⼚商建⽴了紧密合作关系,很多芯⽚⼚商直 接在⻜桨社区贡献代码,为⻜桨⽣态发展做了⼤量贡献。⻜桨也持续与各⼤开源组织、AI 社 区深度合作,并得到启智(OpenI)社区的⽀持成为其中重要⼀员。通过0 码力 | 46 页 | 4.09 MB | 1 年前3
共 12 条
- 1
- 2