2023 中国开源开发者报告
能力,使其智能化,但 它的智能只充当了“辅助”角色;在 AI 原生的语境下, LLM 从一开始就是应用的中枢,应用本身的架构、功能、 交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最 经典的“AI 原生”应用。此概念目前还处在萌芽期,明确 的概念、应用场景、架构、技术栈细节等尚未完成自洽。 换一种视角来看,这个概念的提出其实都没技术什么事, 有人称之为“造商业概念”,这里按下不表。 放宽到 Apache 2.0。 华为云重磅发布盘古大模型 3.0 2023 年 7 月,华为云正式发布盘古大模型 3.0。盘古大模型 3.0 是一个面向行 业的大模型系列,包括“5+N+X”三层架构。 盘古为行业而生,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路 等诸多行业发挥着巨大价值。 9 / 87 1 1 开源开发者事件回顾 蚂蚁集团开源 CodeFuse 代码大模型 电视机的上传速度马上变为零。 对此,爱奇艺客服给出的回应是,这是加速手段,对使用没有影响,并提供 了关闭 HCDN 开关的操作。HCDN (Hybrid CDN)是爱奇艺技术团队研发的大 规模混合架构在线视频数据分发技术。 有网友指出,这是爱奇艺客户端将电视机当成了自己的 PCDN 服务器,因此 会在后台持续执行上传任务。这种白嫖电费、流量、存储空间的操作,爱奇 艺要给用户打钱才对。 20230 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 最优竞争力。 那么,把 transformer“焊死”到板子上就是最佳方案吗?我知道你很急,但你先别急。大 模型底层框架还存在底层路线之争。 32 / 111 我们知道,Transformer 架构呈现了 O(n²)的理论计算复杂度,这里的 n 指的是大模型输入 序列的 token 数量,但其前任语言模型担当 RNN 只有 O(n)的理论计算复杂度。 最近,以 Mamba、RWKV 为代表的类 流和行业知识将转化为 行业应用和行业数据,传统行业数字化转型中的定制化开发难题有望解决。 对程序员而言,需求表达能力、沟通能力等软技能和系统架构设计等硬核能力将越来越重要, 因为 AI 就像今天的基层程序员,需要人表达清楚需求才能做好,复杂系统的架构设计和问题解 决也还是要靠人。 专业模型是通向 AGI 的必经之路。Anthropic CEO 预测,未来 5 年专业模型将达到人类顶 尖专家水平,将人类科研进展加速0 码力 | 111 页 | 11.44 MB | 8 月前3Gitea v1.21.1 中文文档
密钥管理 Multi-factor Authentication (MFA) 开发 玩转 Gitea API 使用指南 OAuth2 提供者 迁移界面 集成 贡献 后端开发指南 前端开发指南 重构指南 本地化 帮助 常见问题 需要帮助 - 4 - 本文档使用 书栈网 · BookStack.CN 构建 致谢 当前文档 《Gitea v1.21.1 中文文档》 由 的自建 Git 服务。 采用Go作为后端语言,只需生成一个可执行程序即可。 支持 Linux, macOS 和 Windows等多平台, 支持主流的 x86,amd64、 ARM 和 PowerPC等架构。 代码托管:Gitea⽀持创建和管理仓库、浏览提交历史和代码⽂件、审查和合并代码提交、管理协作者、管理分 ⽀等。它还⽀持许多常见的Git特性,⽐如标签、Cherry-pick、hook、集成协作⼯具等。 入到可执行程序中,这一点和曾经的 Gogs 有所不同。 你可以从 下载页面 选择对应平台的二进制文件。 对于 Linux, linux-amd64 适用于 64-bit 的 Intel/AMD 平台。更多架构包含 arm64 (Raspberry PI 4), 386 (32-bit), arm-5 以及 arm-6 。 对于 Windows, windows-4.0-amd640 码力 | 303 页 | 3.88 MB | 1 年前3Moonshot AI 介绍
限的条件下,还能实现登⽉吗? 杨植麟:“登⽉”有⼏个不同的⽣产要素,算⼒肯定是⼀个核⼼,但还有其他的。 你需要⼀个同时满⾜scalability和generality这两点的架构,但今天其实很多架构已经不满⾜这两条 了。transformer在已知的tokenspace符合这两条,但放⼤到⼀个更通⽤的场景,也不太符合。数据 也是⼀个⽣产要素,包括整个世界的数字化,和来⾃⽤⼾的数据。 章、甚 ⾄⼀个视频,但表⽰⼀个更⼤的3D世界或你硬盘上的所有⽂件还有难度,没做到token-in-token- out,离所谓的unifiedrepresentation其实有差距。架构其实解决的是这个问题。 通过AI⾃我进化克服数据稀缺性的瓶颈是第⼆层的另⼀个问题。今天的AI其实像⼀个⿊盒,这个⿊盒 有两个输⼊:电源线和数据线,输⼊这两个东西后,盒⼦就能产出智能。随后⼤家意识到,数据线的 ⼤量的熵,抓住确 定性的东西,让本⾝是混沌的东西继续混沌。 通往AGI的话,long-context会是⼀个很重要的点。所有问题都是long-context的问题⸺历史上所 有的架构演进本质上都是在提升有效的contextlength。word2vec最近拿了NeurIPS的Testof Time奖。它在10年前⽤⼀个词去预测周围的词,相当于conte0 码力 | 74 页 | 1.64 MB | 1 年前32023年中国基础软件开源产业研究白皮书
不允许二次闭源发 行 常见许可证: • GPL ( 其 2.0 版 本不允许闭源发 行,3.0版本在 此之上设置了更 严格的开源要求) • AGPL ( 由 GPLv3修改而来, 开源要求进一步 涉及到了前端、 后端等衍生作品 生态) • 木兰公共许可证 开源许可证类别 6 ©2023.11 iResearch Inc. 直 接 企业倾向在自身技术实力较强、产品能 力较扎实的领域选择开源 社区运营是开源人力投入的焦点,头部 企业社区人员投入量超过千名 为方便各职能开源人员交流和开源业务 整合,企业针对性调整组织架构 基础软件是底层技术投入较多的领域之 一,需要企业持续供给技术资源 开源项目的研发、运营、激励都需要 “真金白银”的投入 企业作为开源发起者,应主导开源生态 的建设,努力引入战略合作伙伴 12 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 操 作 系 统 开 源 社 区 常 见 小 组 分 布 操 作 系 统 适 配 生 态 概 览 技术类 语言 基础功能 中间件 图形/桌面 架构/内核 云原生基础设施 安全 测试 行业解决方案 治理类 职能组织 社区基础设施 版本发行 社区生态管理 服务器 云计算 边缘计算 智能终端 桌面 … 操作系统应用场景 处理器0 码力 | 43 页 | 4.69 MB | 1 年前32020 中国开源年度报告
参与者中学⽣和开发者占绝⼤多数,相⽐于 2019年,学⽣占⽐⼤⼤增加,约 37%,开发者 占⽐约 36%。 3.4 所从事的技术⽅向 参与者所从事的技术⽅向以后端开发为主,占⽐约 31%,其次是 Web 前端、AI 以及⼤数据 分析⽅向,占⽐分别为10%、9%、9%,⾮技术⼈员以及其他⾏业的从业者占⽐均为 7%,说 明开源已经越来越受到社会各界的关注。 【专家点评】 陈阳:开源早期的时候, 开源 操作系统、 桌⾯办公软件(GNOME, OpenOffice)和浏览器(Mozilla)掀起了第⼀波开源的浪 潮;近年来随着互联⽹的兴起,开源的项⽬和技术越来越百花⻬放,从数据库到中间 件,从前端到后端,从编程语⾔到编译器,从物联⽹到微服务,从⼤数据到⼈⼯智能, 开源的技术和项⽬越来越丰富和多样化。 4、开源⼯作现状 4.1 接触开源的时间 有近三成参与者接触开源的时间在 1-2 万,总活跃开发者数量 约 1,446万,相较 2019 年的约 1,19 万 增加了约 21.2%。 1.2 指标解释 2、主要内容与发现 2.1 世界开源 Top10 项⽬ 活跃度最⾼的项⽬是来⾃⾕歌的前端跨平台开发框架 flutter/flutter,此外,源于⾕歌的深度 学习框架 tensorflow/tensorflow,容器编排系统 kubernetes/kubernetes 也分别位于第 50 码力 | 46 页 | 4.09 MB | 1 年前3中国开源软件产业研究报告
测 实 • 需求收集、整理是开源社区的最大功能之一,市场上的开发者和用户在 接触项目的过程中自然会产生进一步产品需求,并反馈给社区 • 软件设计主要涉及项目整体架构规划,开源社区开发者主要贡献 为小范围的补丁和功能开发,对整体架构的关注度一般不高 • 软件构建主要指的是核心代码的编写流程,开源社区的贡献者 以编写代码的形式向项目提交创新和改良,能够帮助项目降低 代码编写成本 • 开源社区主 开源之于云计算(一) 开源的虚拟化架构促进了云服务的普及和产业发展 随着用户对于敏捷高效的IT资源的需求不断提升,云服务正在逐步成为数字化时代企业级IT基础设施的标配,而传统意义 上的不同层次的云服务中,IaaS、PaaS和虚拟机等基础云服务产品中不乏开源产品的身影——这也和传统IT架构中底层操 作系统和中间件所处的位置相似。本报告第一章已经提到,传统IT架构中,处于底层的操作系统、数据库管理系统等软件 技术、扩大市场影响力的战略手段。同样的,在整个云服务 架构中,云基础软件也更有可能以开源的形式发布,作为厂商向市场推广这一当时被认为是IT创新的系统架构的方式。事 实上,尽管闭源云服务软件在商业化市场占据重要地位,开源的云基础软件的确为云计算在全球的推广贡献了重要力量, 云计算开源社区也促进了各类云服务软件的不断创新和演进。 云服务基础架构开源技术典型代表 我国企业云计算开源应用规模 基础云服务0 码力 | 68 页 | 3.63 MB | 1 年前3普通人学AI指南
18 3.3 总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 4 零代码搭建本地 AI 前端 19 4.1 LobeChat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 步骤一安装 docker 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 GPT(Generative Pre-trained Transformer)架构。这种模型通过分析大量的文本数据来学习语 言结构和信息,使其能够生成连贯的文本、回答问题、撰写文章、进行对话等。 6 Figure 3: AI 问答工具 ChatGPT 经过特别训练,可以理解和生成人类语言,从而在多种应用场景中提 界面简洁但因表情符出现又不失枯燥 4 零代码搭建本地 AI 前端 到目前,我们使用大模型的界面还是一个终端窗口,黑乎乎的,交互不友好。 这章教你搭建一个美观炫酷的前端网页,如图 20所示,让你使用本地大模 型,更方便!更舒心!关键搭建简单,顺利的话,三五分钟搞定。后面完全免费 畅享使用大模型! Figure 20: 使用开源 LobeChat 搭建美观的大模型前端界面 19 4.1 LobeChat 开源框架,经过我的调研,发现0 码力 | 42 页 | 8.39 MB | 8 月前3202402 DataEase 嵌入式版介绍
⻜书) OEM ⽩标嵌⼊ 其他 嵌⼊ DataEase 嵌⼊式 BI 功能架构 应⽤功能层 仪表板 / 数据⼤屏 ⻚⾯嵌⼊ 仪表板 / 数据⼤屏 图表嵌⼊ 仪表板 / 数据⼤屏 设计器嵌⼊ BI 功能模块嵌⼊ ⻔户嵌⼊ OEM ⽩标 结果嵌⼊ 设计器嵌⼊ 整体嵌⼊ DIV URL Iframe 前端技术层 DataEase 开源数据可视化分析平台 RESTful API API JavaScript API 仪表板管理 数据⼤屏管理 数据集管理 数据源管理 ⽤户管理 组织管理 ⻆⾊管理 权限管理 前端事件交互 平台 API 层 注:JavaScript API 当前尚不⽀持,后续根据需求情况再进⾏开发。 图表嵌⼊ 将单个图表 / 表格嵌⼊到系统中,辅助⽤户进⾏决策。 仪表板图表嵌⼊ 数据⼤屏图表嵌⼊ 仪表板 / 数据⼤屏嵌⼊ 将设计好的仪表板 / Secret DataEase 嵌⼊式版嵌⼊流程 提供⽤户名、 APP ID 、APP Secret ⽣成 Token 前端引⼊ DataEase 提供 的前端 JavaScript 获取仪表板 /数 据⼤屏 / 图表 ID 编写前端代 码,完成嵌⼊ DataEase 嵌⼊流程 I 获取嵌⼊式应⽤的 APP ID、APP Secret 注:跨域是指两个域名不同0 码力 | 30 页 | 11.06 MB | 1 年前3Weblate 4.6 用户文档
Weblate 做贡献 开始为 Weblate 贡献代码 Weblate 源代码 调试 Weblate Weblate 内部 开发附加组件 Weblate 前端 在 Weblate 中汇报问题 Weblate 测试套件与连续集成 数据架构 发布 Weblate 安全和隐私 关于 Weblate 许可协议 Change history Weblate 4.6 Weblate 4.5.3 Weblate Weblate 1.x 系列 Weblate 0.x 系列 Indices and tables 索引 HTTP Routing Table Python 模块索引 Weblate 基础知识 项目和组件架构 在 Weblate 中, 翻译组织成为项目和组件。每个项目可以包含几个组件,并 且组件包含各个语言的翻译。组件相应于一个翻译文件(例如 GNU gettext 或 安卓字符串资源)。项目帮助您将组件组织为逻辑的组(例如,将一个应用中 translatehouse.org/projects/translate- toolkit/en/latest/formats/android.html] 注解 当前不支持安卓的 string-array 架构。为了解决这个问题,可以将字符串数组 分开:- First string
- Second
0 码力 | 760 页 | 9.22 MB | 1 年前3
共 140 条
- 1
- 2
- 3
- 4
- 5
- 6
- 14