2023年中国基础软件开源产业研究白皮书
www.iresearch.com.cn 开源企业洞察(1/2) 避免聚焦ROI的短视思维,树立长期战略意识,持续加码开源项目运营 基础软件的开源发起者一般为企业级开发者,对于他们来讲,开源项目从设立、运营到最终成熟是一个长期的过程。不同于传统项 目具有明确、可量化的ROI,开源项目为 供更全面、更丰富的解决方案。这种融合不仅有助于促进用户之间的无缝交互,也为开发者提供了更多的创新空间和灵活性。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 openEuler连接全景图 主流场景100%支持 | 含3.5W+主流应用 + + 工业控制 云原生 大数据 CDN MEC … 覆盖全场景应用 支持多样性设备 服务器 边缘计算 嵌入式 云计算 主流计算架构100%覆盖 戴还是其他智能终端设备,OpenHarmony都能提供高效、稳定的操作系统支持,为用户带来优质的智能体验。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 OpenHarmony架构与应用全景图 一套开发框架支持应用 运行于不同的设备形态 一套架构积木化拼装, 对轻量、小型、标准场 景设备提供系统支持 硬件生态丰富,通用处 理器与各类加速器全覆 盖 将单用户的多种终端整 合为单一虚拟终端0 码力 | 43 页 | 4.69 MB | 1 年前3中国开源软件产业研究报告
与英特尔、思科等上下游厂商打造精选开源解决方案, 实现与全球开发者的协作创新,推动技术、产品从开发、上线到迭代、应用,进而赋能百行千业的数字创新。 青云科技开源地图 青 云 科 技 开 源 地 图 HydroFS 分布式文件系统 QuanXiang低代码平台 OpenELB 负载均衡器 KUBEKEY K8s安装系统 OPENPITRIX 应用发布和管理平台 KUBEEYE K8s集群自动巡检工具 业内共同认可和遵守的契约文本,履行相关义务也是诚实信用原则的体现。 只有信守开源软件所附的许可证条款,才能保证将开源软件不断散播出去, 让社会公众能够享有开源软件带来的便利与发展成果,不致于被私人占有导 致公共利益受到损害。 46 ©2022.2 iResearch Inc 运营模式、文化氛围等方面也有着显著的区别,这主要表现为:企 业组织擅长商业化运营但缺乏开源社区运营所需的独立性、中立性,高校和科技协会虽然在这方面表现更好,但是普遍不 具备将项目实现产业化落地所需的思维和资源,也缺乏企业所拥有的海量开发人员的支持。随着数字经济的不断发展和产 业渗透,支持开源基金会的组织还有可能来自于IT产业外,美国电影艺术与科学学院(奥斯卡颁奖组织)就与Linux基金会 在2010 码力 | 68 页 | 3.63 MB | 1 年前32024 中国开源开发者报告
人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 然地存在大量数据可用于训练,还蕴含了人类的思维模式。 在此基础上训练得到的 LLM,自然具备被诱导出类人思考的潜力。在 COT(思维链)【4】、 TOT(思维树)【5】等技术的加持下,大模型正在学习拆解自己的“思维”,OpenAI 的 o1 就是 典型案例,强化了推理能力的同时,也大大缓解了幻觉问题。 2. 大模型做不到的,“现存工具”强势补位。 无商业限制的基座的可能性也很高。小应 用开发商很可能很容易获得一个低成本 serving 的“量化小基座”。 “7B”是一个 magic number!无论是 RAG 里的向量表征模型,还是文生图、文本识别 (OCR)、语音合成(TTS)、人脸识别等等垂直领域,一个 1B~7B 的小模型已经可以满足很 多生产、应用需要,并且效果也在逐步推高【8,9,10】。这些模型,作为智能体的“三头六臂”, 确实好用,包括新推出的“光标位置预测” 功能。 但是 AI 编程发展没有那么快,在国内生成代码采纳率还比较低,根据《2024 软件研发应 用大模型国内现状调研报告》,多数团队在 10-40%之间,如图 1 所示。 图 1 大模型(LLM)在编程上的应用及其生成代码的采纳率 在 2024 年,我们还看到了“AI 程序员”Devin 的诞生,Devin 能够独立完成复杂的编码和 调试任务、自主查找和修复代码库中的错误,构建和部署应用程序。在0 码力 | 111 页 | 11.44 MB | 8 月前3Moonshot AI 介绍
专业解读⽂件:⽆论是⾦融分析、法律咨询还是市场调研,Kimi都能以专业⽔准提供⽀持。超⻓⽂ 档、多个⽂件,都可以快速摘要、翻译、答疑,⽀持上传PDF、Word、Excel、PPT、TXT⽂件和 图⽚。 • 整理资料:⽆论是堆积如⼭的发票,还是复杂冗⻓的会议记录,Kimi都能智能识别整理,⾃动提取 关键点,让资料整理不再繁琐,信息⼀⽬了然。 • 辅助创作:根据你提供的⽹⻚链接、⽂件、指令 实世界的很多 数据都存在噪声,我们需要过滤掉这些噪声,让模型只学能学习到的内容。在这个过程中,对于那些 不确定的可能性,也要分配⾜够的概率。举个例⼦,如果要⽣成⼀张图⽚,那么它的loss会⽐⽣成⼀ 段⽂字更⾼,这是因为图⽚包含了更多的混沌和信息量,但只需捕捉其中你能掌握的部分,剩余的部 分可以认为是有概率发⽣的。⽐如,⽔杯的颜⾊是绿⾊还是红⾊就是有概率会发⽣的,但颜⾊这个信 息不会改 能。今天我觉得 其实划分职能没有什么意义,需要每个⼈都很多⾯。 海外独⻆兽:什么样的researcher才会有techvision? 杨植麟:核⼼是两点,⼀个是抓⼤放⼩,⼀个是终局思维。我跟很多researcher合作过,容易出现的 ⼀个问题就是过分雕花,容易在局部⾥看到有很多可以优化的东西,⽐如我们发现transformer解决 了LSTM的contextl0 码力 | 74 页 | 1.64 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。 12 PRODUCT 首批通过信通院认定项目:首批可信云·微服务先进级评估;首批可信云·服务网格先进级评估 安装包等、耗费人力 工具本质 人员基础要求 适用业务 研发效率和成本 对现有体系影响 应用管理平台 对比项 轻舟低代码 基于通用标准语言封装而成的 可视化开发语言 熟悉IT概念,思维逻辑清晰 大中专计算机专业即可 基于宿主语言 可满足80%业务研发需求 显著加快开发速度 为公司降低开发成本 影响较小 可灵活集成公司现有研发资产 提供一站式云原生应用管理平台 灵活管理应用及制品 任务运维 文件管理 任务开发 租户管理 自助分析 权限管理 可视化调度 数据开发及管理平台 标签画像 消费者运营平台 机器学习平台 BI 有数优势 有数全链路数据生产力平台2.0能力全景图 易用 覆盖企业数据全链路的大数 据产品,全面降低数据使用门 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 云部署。 高效 联动数据链路多环节,从系统 层面加快业务高效运营和有0 码力 | 43 页 | 884.64 KB | 1 年前32023 中国开源开发者报告
工程建立了一套“人机交互语法”,来更精准地向 LLM 传 达想要它生成何种输出的指令。这为人们与 LLM 之间建立 高效、准确的“沟通桥梁”提供了可能性。什么“链式思考 1 1 (CoT)”、“自动推理并使用工具(ART)”、“思维 树(ToT)”……甚至运用心理学对 LLM 进行“情绪提 示(EmotionPrompt)”,提示词工程俨然在将 LLM 一 点一点解剖,试图让人类成为可以将其掌控的“咒术师”。 八、 AutoGPT 网站,提供了许多高质量的电影、电视 剧、音乐、游戏和软件等种子资源。它成立于 2008 年,总部位于保加利 亚,已经成为了 BitTorrent 社区中备受喜爱的网站之一。 libjpeg-turbo 是一个 JPEG 图 像编解码器。 它 使 用 SIMD 指 令 ( MMX 、 SSE2、AVX2、Neon、AltiVec) 来加速 x86、x86-64、Arm 和 PowerPC 系统上的基线 JPEG 压缩和解压缩,以及 简化代码的编码规则!“使此类简化代码相当容易编写并确保在需要时进行运 行时检查的库。”--还是那句话--遇到个大杂汇语言,谁能简化代码--与其要 求别人简化,还是请先简化简化自己语言吧。 图乱:语言的设计哲学不一样吧。C/C++(尤其是 C)我记得是说相信程序员知 道自己在做什么,这样灵活性很强,上限会很高,但下限也会很低,你要想 s, 语言肯定不会拦着你。后来的语言,像 Java 之类的,就开始从语言层面进行0 码力 | 87 页 | 31.99 MB | 1 年前32021 中国开源年度报告
到 59,7,1% 40 到 49,34,6% 30 到 39,120,22% 参与者年龄分布 参与者性别分布 男 女 男,441,82% 女 ,96,18% 14 注:问卷篇中饼图的数据标签,例如“硕士 ,107,20%”,其中硕士表 示选项,107 是选择该选项的人数,20% 是选择该选项人数所占的比例。 专家点评 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 32429 6518 GitHub 数据 2021 中国开源年度报告 49 VSCode 工作时间分布打孔图 不管是从活跃度及具体数据,还是直观的打孔图来看,VSCode 都是当之无愧的国际开源项目,参与人 数多,涉及地区广。 NixOS/nixpkgs 工作时间分布打孔图 每一位开发者在使用 Linux 的过程中想必都遭受过软件包版本冲突的痛苦折磨。NixOS 系统以非常出色 的 dcloudio/uni-app 596 50 3 40 52 PaddlePaddle/Paddle 工作时间分布打孔图分析 ant-design/ant-design 工作时间分布打孔图分析 pingcap/tidb 工作时间分布打孔图分析 pingcap/tidb 工作时间分布打孔图分析 2021 中国开源年度报告 53 专家点评 王蓉:期待后续榜单能以项目为单位聚合同一个大项目的 repository,这样我们0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
注:问卷篇中饼图的数据标签,例如“硕士,107,20%”,其中硕士表示选项,107 是选择该选项 的人数,20%是选择该选项人数所占的比例。 Note: The data labels of the pie chart 932022448100 15618 80426 5336 9 dotnet/runtime 13663.644119775200 7816 82210 7011 VSCode 工作时间分布打孔图 VSCode Punch Chart for Work Time Distribution VSCode is a deserved international open source project whether from the activity and specific data or the visual punch chart. NixOS/nixpkgs 工作时间分布打孔图 NixOS/nixpkgs Punch Chart for Work Time Distribution 每一位开发者在使用 Linux 的过程中想必都遭受过软件包版本冲突的痛苦折磨。NixOS0 码力 | 199 页 | 9.63 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
CON将举办全球最大规模AI黑客大赛 微软将用近一年时间完成对0-day Secure Boot漏洞的修复工作 06 06 04 开源热点 芬兰南萨沃计划建立开源能力中心 Decidim参与式民主的开源平台正在被日本广泛使用 图林根继续支持开源替代方案 07 07 08 09 10 11 16 06 开源创业企业 PingCAP平凯星辰 07 开源报告 开源软件国家情报报告-捷克 05 开源法律速览 案例分享:全国首例GPL抗辩获得支持案 提案等流程参与政府政策法规的制定过程来实现数 字民主。 全球开源态势洞察|第十期 08 图林根继续支持开源替代方案 德国图林根自由州与OpenTalk团队的合作成果在Chemnitzer Linux-Tage大会上宣布并展示。 在该会议中,Peer Heinlein(OpenTalk首席执行官)与Christian Stötzer(图林根自由州财政 部负责人)就“图林根自由州的IT战略:开源与数字主权”进行联合演讲。Peer 德国图林根自由州已经表明了其对开源项目的支持。其一,在2019年设立开源奖(图林根开源 奖由图林根经济、科学和数字社会部发起,旨在提高开源解决方案的认知度),其获奖者包括 edu sharing、in.RET、IG Papiergraben。其二,在2019年该州议会通过了一项关于公共采购 的规定,明确将开源定义为“源代码公开可访问且许可证不限制其使用、分发和修改的软件解决 方案”。图林根州公共采购法(Thüringer Ve0 码力 | 22 页 | 1.99 MB | 1 年前32020 中国开源年度报告
但是,接下来应该怎么发展呢?为了抗击疫情⽽凝聚起来的⼈,创造的项⽬,积累的经验,总 结的教训,应该如何“整理、封装、模块化”,并为了今后的各种意外,做好准备呢?这些都是 值得⻓期思考并改进的领域。 作为⼀份⼒图完整、客观、全⾯、丰富的报告,值得探讨的问题当然不⽌上述这些,也欢迎朋 友们阅读下⾯的报告,并随时与我们交流。 庄表伟,开源社理事⻓ 2021 年 1 ⽉ 16 ⽇ 特邀点评专家: 吴晟,Apache 品牌和整个社区免于受到伤害。 3.3 数据分析 我们计算了所有源⾃中国的共计 21 个 ASF 项⽬仓库的活动情况,数据如下。 我们统计了所有源⾃中国的 ASF 项⽬仓库的⼯作时间情况,并为每个仓库绘制了⼯作时间分 布图。在此,我们选择三个⼯作时间分布有明显特征的项⽬进⾏简单分析。 apache/carbondata,Apache CarbonData 是⼀种新的融合存储解决⽅案,利⽤先进 的列式存储、索引、 是⼀组组件,可以组成具有⻓期存储功能的⾼可⽤性 Prometheus 设置。其主要⽬标是简化操作,保留 Prometheus 的可靠性。 kubeedge/kubeedge 上述三个项⽬的开发者⼯作时间分布图,都具有明显的时区聚集性。其中,kubernetes 的开 发者⼤部分位于 UTC-5 时区附近,即美洲地区,⽽ thanos 的开发者中则⼤部分是欧 洲的开发者,kubeedge 的开发者则以亚太地区开发者为主。在0 码力 | 46 页 | 4.09 MB | 1 年前3
共 10 条
- 1