2021 中国开源开发者报告
0 码力 | 35 页 | 36.74 MB | 1 年前32023 中国开源开发者报告
1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 3 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多0 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编0 码力 | 111 页 | 11.44 MB | 8 月前32020 中国开源年度报告
2020 中国开源年度报告 前⾔ 撰写这篇前⾔,我们的⼼情⼀直很复杂,很难⽤某种词汇来概括。在⼼⾥升起的⼀句话 是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据,以及我们⾃⼰的感觉都能发现:全球开源都出现⼀个⼤发展的趋势。GitHub 的 活跃代码仓库与活跃⽤户数在⾼速增⻓(35.3% / 21.2%);Gitee 的代码仓库与⽤户数在以 更加惊⼈的速度增⻓(192% / 162%)。 ⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项⽬的影响⼒不断增加、⽊兰协议的推出、开放原⼦基⾦会的成⽴, Gitee 的超⾼速增⻓,CODE0 码力 | 46 页 | 4.09 MB | 1 年前32021 中国开源年度报告
2021 中国开源年度报告 1 想获得更多信息 请扫码关注开源社微信公众号 2 前言 2022 年来了,网上有一个段子,说这不过是“2020 too”,2022 年 1 月,也不过是 2020 年第 25 月。看起来一切都没有变化,我们 依然在 COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 : 所有人都在奋力奔跑,奋勇向前。 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我 今年的报告,我 们索性新增了《开源大事记》栏目,整整总结了十个趋势。所以在 这个前言里,我们就聊聊感想吧。 出圈 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首 先是嗅觉灵敏的投资人开始关注开源这个“赛道”,然后是基于中美 对抗的背景,很多人开始从国际政治、国家实力、国家安全的角度, 来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
changes and moving in an unknown direction at high speed. 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地 the state in the air, we are running hard and moving forward courageously. 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我们索性新增了《开源大事 记》栏目,整整总结了十个趋势。所以在这个前言里,我们就聊聊感想吧。 In last year's China Open Source Annual Report feelings. 出圈 / Out of the Circle 开源不仅越来越热,而且已经在圈外的朋友中引发了各种讨论。首先是嗅觉灵敏的投资人开始 关注开源这个“赛道”,然后是基于中美对抗的背景,很多人开始从国际政治、国家实力、国家 安全的角度,来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安全事件,更 是令大家议论纷纷。这样一个令人喜忧参半的现象,也许还会继续持续下去。0 码力 | 199 页 | 9.63 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
⼴受欢迎的开源堡垒机 2023 年 12 ⽉ 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 堡垒机企业版 JumpServer 公开案例研究 4 JumpServer ⼀体机及信创⽅案 3 5 ⽬ 录 各种类型 的 IT 资产 为什么要使⽤堡垒机? - 以更安全、更⾼效的⽅式管控和登录各种类型的资产 - 系统管理员 普通⽤户 5 ⽬ 录 JumpServer 堡垒机是谁? 项⽬创⽴并成为中国明星开源项⽬; 正式加⼊ FIT2CLOUD ⻜致云; OSCAR 尖峰开源技术创新奖; IT 产品信息安全认证证书(⽹络安全审查技术与认证中⼼颁发); 计算机信息系统安全专⽤产品销售许可证(公安部颁发); 项⽬创始⼈⼴宏伟获评中国开源先锋 33 ⼈; ⽹络安全专⽤产品安全检测证书(公安部颁发)。 注:GitHub 堡垒机企业版 JumpServer 公开案例研究 4 JumpServer ⼀体机及信创⽅案 3 5 ⽬ 录 JumpServer 社区版 JumpServer 企业版 • 基于 GPL v3 开源许可协议,免费下载; • 极致 UI 体验,⽀持容器化部署; • 全⾯超越传统堡垒机的应⽤体验; X-Pack 增强包 + 原⼚企业级⽀持服务 JumpServer 企业版的功能架构0 码力 | 40 页 | 6.66 MB | 1 年前3开源中国 2023 大模型(LLM)技术报告
/ 32 LLM 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器 学习模型和深度学习模型的软件框架。这些框架提供了 必要的工具和库,使开发者能够更容易地处理大量的数 据、管理巨大的网络参数量,并有效地利用硬件资源。 微调(Fine Tuning)是在大模型框架基础上进行的一个 关键步骤。在模型经过初步的大规模预训练后,微调是 用较小、 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, GPU 或 TPU 等硬件。这类工具可以显著提高训练和推理的速度, 使得处理大规模数据集和复杂模型变得可行。NVIDIA CUDA 和 Google Cloud TPU 均是此类工具。 这类工具通常由开源社区支持和维护,提供了灵活、可扩展的工具和 库来构建和训练大型机器学习模型,如 TensorFlow 和 PyTorch 和 Hugging Face Transformers 等。 TensorFlow0 码力 | 32 页 | 13.09 MB | 1 年前3中国开源软件产业研究报告
中国开源软件产业研究报告 ©2022.2 iResearch Inc. 源远·流长 2 ©2022.2 iResearch Inc www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 摘要 SMS 开源与云计算:开源软件与云计算产业既有互相促进的良性合作,也有因利益纠纷带来的冲 突和矛盾。一方面,云计算产业的大量的基础软件都是开源软件,开源生态为云计算行业的 产品创新提供了持续的动力,而云服务企业的平台也为众多开源软件提供了市场分发渠道; 另一方面,由于全球范围内普遍存在云企业托管开源软件后不回馈开源社区的情况,二者的 发展理念也存在一定矛盾。 中国的开源软件法制建设:国内 中国的开源软件法制建设:国内涉及开源的法律诉讼主要包含两种,其一是软件侵权案被告 方以原告所诉软件为开源软件为由进行抗辩,其二是开源软件作者起诉被告企业未遵守开源 协议。国内开源司法实践以保护软件研发的创造性劳动为核心,对上述两类案件通常支持原 告方立场。涉及开源的法律法规建设正在进一步完善,有望为我国的开源软件产业创设更有 序的发展环境。 SMS 中国的开源软件产业发展:得益于政策支持、软件产业高速发展、软件行业人才不断累计,0 码力 | 68 页 | 3.63 MB | 1 年前3202306 ⼈⼈可⽤的开源数据可视化分析⼯具
2023 年 6 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 DataEase可以帮助⽤户快速分析业务数据并洞察其趋势,为企业的业 务改进与优化提供⽀持。DataEase⽀持丰富的数据源连接,能够通过 拖拉拽的⽅式快速制作图表,并且可以⽅便地与他⼈进⾏分享。 ⼈ ⼈ 可 ⽤ 的 开源数据可视化分析⼯具 DataEase 开源项⽬的使命 Trending 榜单; • ⽇均下载安装次数超过 100 次。 注:GitHub Star 数量统计截⽌⾄ 2023 年 6 ⽉ 1 ⽇。 Star 11,300+ DataEase 开源项⽬概览 仪表板 视图 数据集 数据源 本地模式基于 Apache Doris 和 Kettle ⽀持多数据集关联 ⽀持数据集字段计算 ⽀持定时同步 直连模式 本地模式 多图库⽀持 可视化配置多种属性与样式0 码力 | 27 页 | 3.61 MB | 1 年前3
共 165 条
- 1
- 2
- 3
- 4
- 5
- 6
- 17