2024 中国开源开发者报告
Part 2: TOP101-2024 大 模 型 观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编 李泽辰,Gitee 主编 高瞻,Gitee AI 运营 设计:张琪0 码力 | 111 页 | 11.44 MB | 8 月前32023 中国开源开发者报告
的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。 二、 New Bing(Bing AI)代表了微软在 LLM 领域的野心和 决心,它首次把当时世人能想到最有价值又可行的 LLM 应用场景——“智能对话+联网搜索”——无缝整合了起来, 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 LLM 从传 统的模型训练和应用模式,转向以 Agent 为中心的智能 化模式。LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用 范围和价值;它为 LLM 的智能化发展提供了新的方向, 使 LLM 能够更加接近于人类智能。 九、 AI 原生,目前还没有明确的定义,大致是说,不同于当前 各种应用在原本的基础上增加 AI 能力,使其智能化,但0 码力 | 87 页 | 31.99 MB | 1 年前32023年中国基础软件开源产业研究白皮书
具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 开源内容传播应用与 迭代升级,达到社会 集体效应最大化 5 ©2023.11 iResearch Inc. Apache许可证 百分比(%) 来源:Gitee《2022中国开源开发者报告》,结合专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 开发者对常见开源许可证了解情况 开源开发者对于许可证种类与应用的了解不全 17%的开源开发者对于所有开源许可证不了解但直接使用 开发者对于许可证的种类认知并不全面,了解程度最高的 Apache许可证占比仅有60%,对于常见开源许可证都了解且 自觉遵守的开发者占比只有11%。0 码力 | 43 页 | 4.69 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
Nutanix推出Kubernetes数据管理平台 Nutanix Data Services for Kubernetes Mirantis发布轻量级Kubernetes发行版k0s v1.27 Azure AKS正式推出网络方案Azure CNI Overlay 02 02 02 03 03 03 Envoy Gateway v0.4发布 OpenYurt v1.3.0发布 Rainbond v5.14.0发布 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立的服务网格解决方案,包括处理在Kuberne- tes集群上运行的微服务的流量管理、策略执行 和可观测性等任务,以简化应用程序的部署和 管理。OSM于2020年8月推出,同年加入云原 生计算基金会(CNCF)。不久后,该项目成为 云原生计算基金会(CNCF)沙箱级别的项目。 Nutanix Data Services for Kubernetes。具体 功能如下: • NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 Mirantis发布轻量级0 码力 | 22 页 | 1.99 MB | 1 年前3中国开源软件产业研究报告
红帽(RedHat)公司的收入结构 谷歌公司收入结构 17 20 21 4.4 6.2 8.2 2.8 3.5 4.2 FY2017 FY2018 FY2019 基础设施订阅(亿美元) 应用开发新兴技术订阅(亿美元) 培训服务(亿美元) 853 981 1041 112 170 198 200 215 231 141 170 217 58 89 131 谷歌云(亿美元) 红帽公司的主要收入来自于对开源的Linux及其他云基础软件的发 行版订阅收入和配套服务。 广告收入是谷歌的核心收入来源,而谷歌开源的Chromium浏览器 内核能够帮助谷歌的各种网络服务(广告载体)在更大范围推广。 16 ©2022.2 iResearch Inc www.iresearch.com.cn 云计算、容 器和虚拟化 22.7% 网络和边缘计算 15.0% web和应用程序开发 13.6% 人工智能、机器学习、数 据和分析 10.8% 隐私与安全 5.1% cross-technology 4.8% 物联网与嵌入式 4.6% 区块链0 码力 | 68 页 | 3.63 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、性 华为鲲鹏技术兼容性测试认证 QUALIFICATION 数帆资质(部分) 06 及以前 《Gartner 2020 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院“大数据'星河'案例-行业大数据应用优秀案例” 信通院 OSCAR 尖峰开源创新(二次开发)奖 云计算开源产业联盟云原生十大优秀案例 infoQ 中国技术力量年度榜单 InfoQ2020 最有价值技术团队 InfoQ2020 最佳技术社区驱动力奖 ICT 技术成熟度曲线》Cloud ABI 领域标杆厂商 CCF Top10 大数据应用最佳实践案例 中国长三角数字经济大会“数字经济优秀案例企业” CTDC 年度优秀微服务创新产品奖 浙江省大数据应用服务创新奖 信通院 OSCAR 尖峰开源用户奖 教育部科技进步一等奖( “海量混合时态数据融合处理关键技术及应用”项目) 全球云计算大会“全球最佳实践奖” 2021 2020 2019 20180 码力 | 43 页 | 884.64 KB | 1 年前32021 中国开源年度报告
在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是 自由的。但是,在软件吞噬世界、开源吞噬软件的今天,开源技术, 2021 中国开源年度报告 3 已经成为整个世界的基础设施之一。能力越大,责任越大。应用越广, 风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何 建设更加健康的开源生态呢?在这样一种生态中,各方的责任又该 如何界定呢? 历史感 开源社已经连续第四年发布中国开源年度报告了,也举办了第六届 段夕华:我觉得以 actor 和 comment 来衡量项目的活跃度也似乎也有失偏颇,小体量的工具类开源项目如 node.js 的 co、java 的 fastjson 一般这两个数字也不会很大,但被四处应用,star 数也不少。为保证公平起 见,我觉得可以考虑以上数字除以代码行数,另外,挤掉水分后的 star 和 fork 还是蛮有说服力的。 54 3 中国企业开源数据分析(按活跃度排序) company Android 开发语言 1.89% ↓ 4 注:Android 开发语言为 Java 和 Kotlin,这里为了跟后端的 Java 做区分所以用 Android 概括。 Java 作为国内目前应用最广泛的语言,在 2021 年仍保持着强大的竞争力,仓库数量在极高存量的情况下 仍有不错的增长态势,使用 Java 的仓库数量占比超越了 2020 年的 37%,回到了 2019 年的 50% 左右。0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
responsibility 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是自由的。但是,在软件吞噬 世界、开源吞噬软件的今天,开源技术,已经成为整个世界的基础设施之一。能力越大,责任 越大。应用越广,风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何建设更加 健康的开源生态呢?在这样一种生态中,各方的责任又该如何界定呢? When the open source was just 段夕华:我觉得以 actor 和 comment 来衡量项目的活跃度也似乎也有失偏颇,小体量 的工具类开源项目如 node.js 的 co、java 的 fastjson 一般这两个数字也不会很大,但 被四处应用,star 数也不少。为保证公平起见,我觉得可以考虑以上数字除以代码行数, 另外,挤掉水分后的 star 和 fork 还是蛮有说服力的。 In my opinion, it seems biased languages 1.89% ↓4 注:Android 开发语言为 Java 和 Kotlin,这里为了跟后端的 Java 做区分所以用 Android 概 括。 Java 作为国内目前应用最广泛的语言,在 2021 年仍保持着强大的竞争力,仓库数量在极高 存量的情况下仍有不错的增长态势,使用 Java 的仓库数量占比超越了 2020 年的 37%,回 到了 2019 年的 50%左右。0 码力 | 199 页 | 9.63 MB | 1 年前3Gitea,新一代的代码托管平台
开源项目介绍 Gitea 企业版介绍 3 Gitea 优势总结 2 代码托管平台的发展历程 阶段一 阶段二 阶段三 •单用户本地编辑; •没有网络功能; •典型产品:RCS、SCCS。 本地代码管理 •C/S 架构体系,支持网络化协作; •依赖中央存储库; •典型产品:CVS、 SVN、VSS、 TFS、 ClearCase。 集中式代码管理 •去中心化,稳定性和可用性增强; 通过灵活的配置满足不同应用场景的需求 安全稳定 被⼴泛验证,39k+ GitHub Star、40万+ 安装量、 1000+ 贡献者,覆盖 1000万+ 开发者 Gitea 优势总结 极佳体验 • 在 UI 上与 GitHub 采用类似的风 格设计; • 在使上与 GitHub 保证一致的使用 体验。 风格兼容 • API 高度兼容:大部分 GitHub 第 三方应用可复用; • SQL 等。 部署简单 • 拥有出色的第三方集成社区,全面覆盖控制面板、迁移、插件、脚本、工作流、 主题等各方面内容; • Drone、Jenkins、VSCode、 Intellij 等应用均已内置集成 Gitea; • 支持通过 Gitea API 将 Gitea 与其他系统或工具集成,实现高效的工作流程。 集成简单 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式0 码力 | 30 页 | 14.34 MB | 1 年前32020 中国开源年度报告
来开源⾃⼰的项⽬,其次则是 Gitee 和 Gitlab。 【专家点评】 蒋涛:随着开源规模和商业化的快速发展,开源平台作为开源项目和开发者生态的重要基础及 支撑体系,未来将承载更多的服务和应用场景,也将发展出各自特色。2020 年新发布的 CODE China,作为独立第三方开源平台,将重点围绕 AIOT,为更多开源项目和开发者提供 运营支持和生态服务。 6.9 技术论坛 知乎和0 码力 | 46 页 | 4.09 MB | 1 年前3
共 10 条
- 1