2020 中国开源年度报告
2020 中国开源年度报告 前⾔ 撰写这篇前⾔,我们的⼼情⼀直很复杂,很难⽤某种词汇来概括。在⼼⾥升起的⼀句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据,以及我们⾃⼰的感觉都能发现:全球开源都出现⼀个⼤发展的趋势。GitHub 的 活跃代码仓库与活跃⽤户数在⾼速增⻓(35.3% / 21.2%);Gitee 的代码仓库与⽤户数在以 更加惊⼈的速度增⻓(192% / 162%)。 ⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项⽬的影响⼒不断增加、⽊兰协议的推出、开放原⼦基⾦会的成⽴, Gitee 的超⾼速增⻓,CODE0 码力 | 46 页 | 4.09 MB | 1 年前32021 中国开源年度报告
2021 中国开源年度报告 1 想获得更多信息 请扫码关注开源社微信公众号 2 前言 2022 年来了,网上有一个段子,说这不过是“2020 too”,2022 年 1 月,也不过是 2020 年第 25 月。看起来一切都没有变化,我们 依然在 COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 : 所有人都在奋力奔跑,奋勇向前。 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我 今年的报告,我 们索性新增了《开源大事记》栏目,整整总结了十个趋势。所以在 这个前言里,我们就聊聊感想吧。 出圈 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首 先是嗅觉灵敏的投资人开始关注开源这个“赛道”,然后是基于中美 对抗的背景,很多人开始从国际政治、国家实力、国家安全的角度, 来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
changes and moving in an unknown direction at high speed. 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从 and the state in the air, we are running hard and moving forward courageously. 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我们索性新增了《开源大事 记》栏目,整整总结了十个趋势。所以在这个前言里,我们就聊聊感想吧。 In last year's China Open Source Annual Report feelings. 出圈 / Out of the Circle 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首先是嗅觉灵敏的投资人开始 关注开源这个“赛道”,然后是基于中美对抗的背景,很多人开始从国际政治、国家实力、国家 安全的角度,来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安全事件,更 是令大家议论纷纷。这样一个令人喜忧参半的现象,也许还会继续持续下去。0 码力 | 199 页 | 9.63 MB | 1 年前32021 中国开源开发者报告
0 码力 | 35 页 | 36.74 MB | 1 年前32023 中国开源开发者报告
1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 大模型、中科院的紫东太初大模型、 百川智能的百川大模型、商汤的日日新大模型、MiniMax 的 ABAB 大模型、上海人工智能实验室的书生通用大模型、腾 讯的混元大模型、蚂蚁的百灵大模型等。 另一方面,除了大模型本身,中国在 LLM 相关技术领域也 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow0 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编 李泽辰,Gitee 主编 高瞻,Gitee AI 运营 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要0 码力 | 111 页 | 11.44 MB | 8 月前3开源中国 2023 大模型(LLM)技术报告
32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 LLM Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 算力 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。 这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和 库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能0 码力 | 32 页 | 13.09 MB | 1 年前3中国开源软件产业研究报告
中国开源软件产业研究报告 ©2022.2 iResearch Inc. 源远·流长 2 ©2022.2 iResearch Inc www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 摘要 SMS 开源与云计算:开源软件与云计算产业既有互相促进的良性合作,也有因利益纠纷带来的冲 突和矛盾。一方面,云计算产业的大量的基础软件都是开源软件,开源生态为云计算行业的 产品创新提供了持续的动力,而云服务企业的平台也为众多开源软件提供了市场分发渠道; 另一方面,由于全球范围内普遍存在云企业托管开源软件后不回馈开源社区的情况,二者的 发展理念也存在一定矛盾。 中国的开源软件法制建设:国内 中国的开源软件法制建设:国内涉及开源的法律诉讼主要包含两种,其一是软件侵权案被告 方以原告所诉软件为开源软件为由进行抗辩,其二是开源软件作者起诉被告企业未遵守开源 协议。国内开源司法实践以保护软件研发的创造性劳动为核心,对上述两类案件通常支持原 告方立场。涉及开源的法律法规建设正在进一步完善,有望为我国的开源软件产业创设更有 序的发展环境。 SMS 中国的开源软件产业发展:得益于政策支持、软件产业高速发展、软件行业人才不断累计,0 码力 | 68 页 | 3.63 MB | 1 年前32023年中国基础软件开源产业研究白皮书
©2023 iResearch Inc. 2023年中国基础软件开源 产业研究白皮书 2 目 录 CONTENTS 01 02 03 开源基础软件界定及中外发展对比 中国开源基础软件产业链及参与者洞察 中国开源基础软件产业细分领域洞察 3 开源基础软件界定 及中外发展对比 01 4 ©2023.11 iResearch Inc. iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑0 码力 | 43 页 | 4.69 MB | 1 年前3走进开源 - Apache ServiceComb
走进开源 - Apache ServiceComb [社区网站] http://servicecomb.apache.org [Github ] https://github.com/apache?q=servicecomb 议程 • 什么是开源 • 开源开发是什么状态 • 如何参与开源 [社区网站] http://servicecomb.apache.org [Github ] q=servicecomb 软件发展史 开源软件 自由软件 商业软件 [社区网站] http://servicecomb.apache.org [Github ] https://github.com/apache?q=servicecomb 一种思想运动 用户可以自由地运行,拷贝,分 发,学习,修改并改进该软件 一旦在该软件基础上修改,则必 须保证修改后的软件也“自由” 开源发展第一阶段 [社区网站] 自由软件和商业软件 之间的折中 遵循版权前提下,可以自由访问、使 用、改变和共享,也可用做商用目的 开源发展第二阶段 [社区网站] http://servicecomb.apache.org [Github ] https://github.com/apache?q=servicecomb 开源发展第三阶段 [社区网站] http://servicecomb.apache.org [Github0 码力 | 28 页 | 1.92 MB | 1 年前3
共 939 条
- 1
- 2
- 3
- 4
- 5
- 6
- 94