2020 中国开源年度报告
2020 中国开源年度报告 前⾔ 撰写这篇前⾔,我们的⼼情⼀直很复杂,很难⽤某种词汇来概括。在⼼⾥升起的⼀句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据,以及我们⾃⼰的感觉都能发现:全球开源都出现⼀个⼤发展的趋势。GitHub 的 活跃代码仓库与活跃⽤户数在⾼速增⻓(35.3% / 21.2%);Gitee 的代码仓库与⽤户数在以 更加惊⼈的速度增⻓(192% / 162%)。 ⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项⽬的影响⼒不断增加、⽊兰协议的推出、开放原⼦基⾦会的成⽴, Gitee 的超⾼速增⻓,CODE0 码力 | 46 页 | 4.09 MB | 1 年前32021 中国开源年度报告
2021 中国开源年度报告 1 想获得更多信息 请扫码关注开源社微信公众号 2 前言 2022 年来了,网上有一个段子,说这不过是“2020 too”,2022 年 1 月,也不过是 2020 年第 25 月。看起来一切都没有变化,我们 依然在 COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 : 所有人都在奋力奔跑,奋勇向前。 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我 今年的报告,我 们索性新增了《开源大事记》栏目,整整总结了十个趋势。所以在 这个前言里,我们就聊聊感想吧。 出圈 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首 先是嗅觉灵敏的投资人开始关注开源这个“赛道”,然后是基于中美 对抗的背景,很多人开始从国际政治、国家实力、国家安全的角度, 来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
changes and moving in an unknown direction at high speed. 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地 the state in the air, we are running hard and moving forward courageously. 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我们索性新增了《开源大事 记》栏目,整整总结了十个趋势。所以在这个前言里,我们就聊聊感想吧。 In last year's China Open Source Annual Report feelings. 出圈 / Out of the Circle 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首先是嗅觉灵敏的投资人开始 关注开源这个“赛道”,然后是基于中美对抗的背景,很多人开始从国际政治、国家实力、国家 安全的角度,来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安全事件,更 是令大家议论纷纷。这样一个令人喜忧参半的现象,也许还会继续持续下去。0 码力 | 199 页 | 9.63 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
⼴受欢迎的开源堡垒机 2023 年 12 ⽉ 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 堡垒机企业版 JumpServer 公开案例研究 4 JumpServer ⼀体机及信创⽅案 3 5 ⽬ 录 各种类型 的 IT 资产 为什么要使⽤堡垒机? - 以更安全、更⾼效的⽅式管控和登录各种类型的资产 - 系统管理员 普通⽤户 5 ⽬ 录 JumpServer 堡垒机是谁? 项⽬创⽴并成为中国明星开源项⽬; 正式加⼊ FIT2CLOUD ⻜致云; OSCAR 尖峰开源技术创新奖; IT 产品信息安全认证证书(⽹络安全审查技术与认证中⼼颁发); 计算机信息系统安全专⽤产品销售许可证(公安部颁发); 项⽬创始⼈⼴宏伟获评中国开源先锋 33 ⼈; ⽹络安全专⽤产品安全检测证书(公安部颁发)。 注:GitHub 堡垒机企业版 JumpServer 公开案例研究 4 JumpServer ⼀体机及信创⽅案 3 5 ⽬ 录 JumpServer 社区版 JumpServer 企业版 • 基于 GPL v3 开源许可协议,免费下载; • 极致 UI 体验,⽀持容器化部署; • 全⾯超越传统堡垒机的应⽤体验; X-Pack 增强包 + 原⼚企业级⽀持服务 JumpServer 企业版的功能架构0 码力 | 40 页 | 6.66 MB | 1 年前32021 中国开源开发者报告
0 码力 | 35 页 | 36.74 MB | 1 年前32023 中国开源开发者报告
1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 上下文窗口,可处 理约 40 万字的文本,成为当时全球大模型中最长的上下文 窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 2023 年的 LLM、 GenAI。根据金融数据和软件公司 PitchBook 的数据,从 截至 3 月 29 日追踪的 9 笔交易来看,生成式0 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 肖滢,OSCHINA 副主编 李泽辰,Gitee 主编 高瞻,Gitee AI 运营 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee0 码力 | 111 页 | 11.44 MB | 8 月前3开源中国 2023 大模型(LLM)技术报告
GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。 这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和 库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 com/docs/get_started/introduction) �� LangChain 是一个帮助开发者使用 LLM 创建应用的开源框 架,它可以将 LLM 与外部数据源进行连接,并允许与 LLM 进行交互。 LangChain 于 2022 年 10 月作为开源项目推出,并于 2023 年 4 月注册成立公司,累计获得超过 3000 万美元的 投资,估值达到了 2 亿美元。 在 GitHub0 码力 | 32 页 | 13.09 MB | 1 年前3中国开源软件产业研究报告
中国开源软件产业研究报告 ©2022.2 iResearch Inc. 源远·流长 2 ©2022.2 iResearch Inc www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 摘要 SMS 开源与云计算:开源软件与云计算产业既有互相促进的良性合作,也有因利益纠纷带来的冲 突和矛盾。一方面,云计算产业的大量的基础软件都是开源软件,开源生态为云计算行业的 产品创新提供了持续的动力,而云服务企业的平台也为众多开源软件提供了市场分发渠道; 另一方面,由于全球范围内普遍存在云企业托管开源软件后不回馈开源社区的情况,二者的 发展理念也存在一定矛盾。 中国的开源软件法制建设:国内 中国的开源软件法制建设:国内涉及开源的法律诉讼主要包含两种,其一是软件侵权案被告 方以原告所诉软件为开源软件为由进行抗辩,其二是开源软件作者起诉被告企业未遵守开源 协议。国内开源司法实践以保护软件研发的创造性劳动为核心,对上述两类案件通常支持原 告方立场。涉及开源的法律法规建设正在进一步完善,有望为我国的开源软件产业创设更有 序的发展环境。 SMS 中国的开源软件产业发展:得益于政策支持、软件产业高速发展、软件行业人才不断累计,0 码力 | 68 页 | 3.63 MB | 1 年前3202306 ⼈⼈可⽤的开源数据可视化分析⼯具
2023 年 6 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 DataEase可以帮助⽤户快速分析业务数据并洞察其趋势,为企业的业 务改进与优化提供⽀持。DataEase⽀持丰富的数据源连接,能够通过 拖拉拽的⽅式快速制作图表,并且可以⽅便地与他⼈进⾏分享。 ⼈ ⼈ 可 ⽤ 的 开源数据可视化分析⼯具 DataEase 开源项⽬的使命 Trending 榜单; • ⽇均下载安装次数超过 100 次。 注:GitHub Star 数量统计截⽌⾄ 2023 年 6 ⽉ 1 ⽇。 Star 11,300+ DataEase 开源项⽬概览 仪表板 视图 数据集 数据源 本地模式基于 Apache Doris 和 Kettle ⽀持多数据集关联 ⽀持数据集字段计算 ⽀持定时同步 直连模式 本地模式 多图库⽀持 可视化配置多种属性与样式0 码力 | 27 页 | 3.61 MB | 1 年前3
共 156 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16