2021 中国开源年度报告
2021 中国开源年度报告 1 想获得更多信息 请扫码关注开源社微信公众号 2 前言 2022 年来了,网上有一个段子,说这不过是“2020 too”,2022 年 1 月,也不过是 2020 年第 25 月。看起来一切都没有变化,我们 依然在 COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 : 所有人都在奋力奔跑,奋勇向前。 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我 今年的报告,我 们索性新增了《开源大事记》栏目,整整总结了十个趋势。所以在 这个前言里,我们就聊聊感想吧。 出圈 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首 先是嗅觉灵敏的投资人开始关注开源这个“赛道”,然后是基于中美 对抗的背景,很多人开始从国际政治、国家实力、国家安全的角度, 来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
changes and moving in an unknown direction at high speed. 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地 the state in the air, we are running hard and moving forward courageously. 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我们索性新增了《开源大事 记》栏目,整整总结了十个趋势。所以在这个前言里,我们就聊聊感想吧。 In last year's China Open Source Annual Report feelings. 出圈 / Out of the Circle 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首先是嗅觉灵敏的投资人开始 关注开源这个“赛道”,然后是基于中美对抗的背景,很多人开始从国际政治、国家实力、国家 安全的角度,来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安全事件,更 是令大家议论纷纷。这样一个令人喜忧参半的现象,也许还会继续持续下去。0 码力 | 199 页 | 9.63 MB | 1 年前32023年中国基础软件开源产业研究白皮书
©2023 iResearch Inc. 2023年中国基础软件开源 产业研究白皮书 2 目 录 CONTENTS 01 02 03 开源基础软件界定及中外发展对比 中国开源基础软件产业链及参与者洞察 中国开源基础软件产业细分领域洞察 3 开源基础软件界定 及中外发展对比 01 4 ©2023.11 iResearch Inc. iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑0 码力 | 43 页 | 4.69 MB | 1 年前32020 中国开源年度报告
2020 中国开源年度报告 前⾔ 撰写这篇前⾔,我们的⼼情⼀直很复杂,很难⽤某种词汇来概括。在⼼⾥升起的⼀句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据,以及我们⾃⼰的感觉都能发现:全球开源都出现⼀个⼤发展的趋势。GitHub 的 活跃代码仓库与活跃⽤户数在⾼速增⻓(35.3% / 21.2%);Gitee 的代码仓库与⽤户数在以 更加惊⼈的速度增⻓(192% / 162%)。 ⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项⽬的影响⼒不断增加、⽊兰协议的推出、开放原⼦基⾦会的成⽴, Gitee 的超⾼速增⻓,CODE0 码力 | 46 页 | 4.09 MB | 1 年前32023 中国开源开发者报告
1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 上下文窗口,可处 理约 40 万字的文本,成为当时全球大模型中最长的上下文 窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 2023 年的 LLM、 GenAI。根据金融数据和软件公司 PitchBook 的数据,从 截至 3 月 29 日追踪的 9 笔交易来看,生成式0 码力 | 87 页 | 31.99 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
⼴受欢迎的开源堡垒机 2023 年 12 ⽉ 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 堡垒机企业版 JumpServer 公开案例研究 4 JumpServer ⼀体机及信创⽅案 3 5 ⽬ 录 各种类型 的 IT 资产 为什么要使⽤堡垒机? - 以更安全、更⾼效的⽅式管控和登录各种类型的资产 - 系统管理员 普通⽤户 ⼤型制造企业往往在境内外拥有多个⽣产基地,需要借助堡垒机实现 分布式 IT 资产的统⼀运维安全审计。 政府及国有企业 政府机构及国有企业拥有⼤量机密信息,运维的安全等级要求很⾼,堡垒机是提⾼其安全合规⽔平的必备选择。 服务业 传统服务⾏业,以及包括了物流交通⾏业在内的、依托于信息技术发展演进的现代服务业,普遍具有分布式基础设施的安全 管控需求,同时需要兼顾海量资产的纳管和⾼可⽤,堡垒机是其必备的 5 ⽬ 录 JumpServer 堡垒机是谁? 项⽬创⽴并成为中国明星开源项⽬; 正式加⼊ FIT2CLOUD ⻜致云; OSCAR 尖峰开源技术创新奖; IT 产品信息安全认证证书(⽹络安全审查技术与认证中⼼颁发); 计算机信息系统安全专⽤产品销售许可证(公安部颁发); 项⽬创始⼈⼴宏伟获评中国开源先锋 33 ⼈; ⽹络安全专⽤产品安全检测证书(公安部颁发)。 注:GitHub0 码力 | 40 页 | 6.66 MB | 1 年前32021 中国开源开发者报告
0 码力 | 35 页 | 36.74 MB | 1 年前32024 中国开源开发者报告
点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 肖滢,OSCHINA 副主编 李泽辰,Gitee 主编 高瞻,Gitee AI 运营 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee0 码力 | 111 页 | 11.44 MB | 8 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
受众自动生成创意广告文案和宣传语,提高广 告创作效率。 • 中小企业AI定制化服务:为中小企业提 供定制化的AI解决方案,如智能客服、营销 和办公工具,提升企业竞争力。 • 开源AI教育平台:借助DeepSeek R1 的低成本特性,创建开源AI教育平台,提供 免费课程和实验资源,促进AI教育普及。 • 智能编程教育助手:为编程学生提供实 时编程指导,自动生成代码示例,帮助解决 编程难题。 • 自动化代码审查工具:自动审查代码, 及“替换为"和",使句子更简洁。 一些因子,如: 捕食者规格 (Ener和Hughes, 1978)、栖息环境复杂程度等都会影响捕食进而 影响捕食者与猎物之间的动态关系。 一 些 因 素 , 如 捕 食 者 规 格 ( E I n e r 和 Hughes,1978)和栖息环境复杂程度,会影响 捕食以及捕食者与猎物之间的动态关系。 将"因子"替换为"因素",删除了 多余的”如:"和"等" 英文学术写作润色指令 PS:使用感受会因个体差异而有不同,仅作参考 生成综述对比:可读性与实用性 AI综述平台 元知AI综述工具 PubScholar平台 知网研学平台 斯坦福STORM 引用格式规 范 生成的引用格式标准且规范,能 够清晰准确地列出参考文献,符 合学术出版的要求,确保文献的 格式符合高水平的学术标准 引用格式较为简化,虽然能提 供基本的引用信息,但在一些 细节上缺少学术规范,适合较 为基础的文献综述0 码力 | 85 页 | 8.31 MB | 7 月前3开源中国 2023 大模型(LLM)技术报告
GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。 这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和 库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 com/docs/get_started/introduction) �� LangChain 是一个帮助开发者使用 LLM 创建应用的开源框 架,它可以将 LLM 与外部数据源进行连接,并允许与 LLM 进行交互。 LangChain 于 2022 年 10 月作为开源项目推出,并于 2023 年 4 月注册成立公司,累计获得超过 3000 万美元的 投资,估值达到了 2 亿美元。 在 GitHub0 码力 | 32 页 | 13.09 MB | 1 年前3
共 183 条
- 1
- 2
- 3
- 4
- 5
- 6
- 19