Moonshot AI 介绍
ormer-XL和XLNet两篇重要 论⽂的第⼀作者;两位联合创始⼈周昕宇和吴育昕都有10000+的GoogleScholar引⽤。 b. 团队成员囊括NLP,CV,RL(强化学习),Infra⽅⾯新⽣代⼈才,主导了很多有世界影响⼒的⼯ 作,吸引了来⾃Google、Meta、Amazon等全球领先科技公司的海外⼈才加⼊: i. ⼤模型⽅⾯。团队成员发明了RoPE相对位 本性能逼近全监督学习的⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强0 码力 | 74 页 | 1.64 MB | 1 年前32023 中国开源开发者报告
发展的新阶段。LLM Agent 是一种基于 LLM 的智能代 理,它能够自主学习和执行任务,具有一定的“认知能力 和决策能力”。LLM Agent 的出现,标志着 LLM 从传 统的模型训练和应用模式,转向以 Agent 为中心的智能 化模式。LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用 范围和价值;它为 LLM 的智能化发展提供了新的方向, 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 AI 模型,速度相比传统 数值预报提速 10000 倍以上,能够提供全球气象秒级预 报。盘古大模 西。它需 要你不断完善自己的输入,甚至有时候可能要求在你自身都不 知道“可以想要一个什么东西”的情况下去输入。 这样的话其实就是你在输入与输出:整个事情我都想通了,方 案我其实也就都出来了,机器给到我的都只是一个个独立性 的、小而窄的、解决掉一点一点问题的东西。 举个例子,我说我肚子疼,它会直接告诉我肚子疼可能是因为 什么,怎样做可以缓解或者解决,但它不会一点一点进行“望 闻问切”0 码力 | 87 页 | 31.99 MB | 1 年前32024 中国开源开发者报告
TypeScript连续两年成为了 Gitee年度增长最快编程语言 (2023年增长率为49.04%), 同样持续强势的还有Rust以及 C语言家族。 此外,Dart及Arduino首次上榜, 符合2024年跨平台开发及机器 人开发的潮流。 12 / 111 本年度最常用开源许可证 MIT 33.91% Apache-2.0 27.28% MulanPSL-2.0 11.70% GPL-3.0 8.55% Insight 2024 中国开源开发者报告重点聚焦大模型,本章节以大模 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 通个人用户。OpenAI 在 ChatGPT 上一个重要且成功的操作就是把大模型从学术界、工业界直接推向了普通个体,让 C 端用户切 实感受到了大模型的可能性与魅力。这一点被国内的大模型厂商广泛学习。在 B 站刷视频,国 内知名的那几个大模型厂商的广告,你一个也不会落下。 受到大家的认可与喜爱固然重要,但对于 C 端用户,有两个需要时刻牢记的问题:一是 C 端用户是没有忠诚度的,谁免费就0 码力 | 111 页 | 11.44 MB | 8 月前32020 中国开源年度报告
特邀点评专家: 吴晟,Apache 软件基⾦会 Member,Apache Local Community 联合创始⼈ ⻩东旭,PingCAP 联合创始⼈兼 CTO ⻢艳军,百度深度学习技术平台部⾼级总监 蒋涛,CSDN 创始⼈ & 董事⻓,极客帮创投创始合伙⼈ ⾼阳,SegmentFault 思否创始⼈ & CEO 红薯,开源中国创始⼈ & CTO 庄表伟,开源社理事⻓ 在参与者眼中,GitHub 对于开源软件的贡献最⼤,其次是 Google,⽽在国内企业中, Alibaba、Huawei 和 Baidu 分别占据前三名。 4.9 机器⼈流程⾃动化 对于开源项⽬是否继承了 RPA,即机器⼈流程⾃动化⼯具,有四成参与者表示⼀部分项⽬集 成了 RPA,16% 的参与者表示⼏乎所有项⽬都有集成 RPA,同时也有 24% 的参与者表示从 来没有在开源项⽬中集成过 蒋涛:在全球科技竞争和中国开源核心技术发展态势下,从开源生态制高点着眼,建设和发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 会力量合力共建开源创新生态环境;同时,通过学习借鉴更完善的基金会运行模式、组织机制 和法律制度,建设可持续发展的中国开源创新力量。此外,在当前全球开源商业模式越来越成 熟的市场环境下,建设开源基金会,还可以引导国内外基金和投资机构孵化支持开源,培育中0 码力 | 46 页 | 4.09 MB | 1 年前32021 中国开源年度报告
…………………………………………………………………………… 34 4.8 一个项目的哪些特征对于您留下成为项目贡献者的重要度评级 ……………………………… 35 4.9 开源项目是否集成 RPA(机器人流程自动化) ………………………………………………… 36 4.10 开源活动 ………………………………………………………………………………………… 37 4.11 聊天运维工具 ……………… 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养 , 越来越多的学生参与到开 源开发中,开源人才培养周期前置,越来越多的学校开设开源课程,希望后续可以实现在学习计算机、编译原 理、软件工程等理论知识的同时,让学生学习掌握开源开发模式、理解认同开源文化。 参与者职位分布 产品经理,9,2% CTO/CEO 公司负责人,26,5% CTO/CEO 公司负责人 产品经理 教师 开发者 39% 和 25%。 专家点评 段夕华: 科技型初创公司用开源来实现技术能力展现,吸引潜在合作伙伴,这个趋势不容忽视。这其中国内 最为抢眼的就是 PingCAP/TiDB,其开源策略、战术均值得大家学习借鉴。 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和 政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认可。尤其是开源与数据(数据库0 码力 | 132 页 | 14.24 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
据、零售大数据、制造业智慧供应链等行业解决方案。 发布轻舟低代码平台 2.0 。 大数据开源项目 Kyuubi 全票进入 Apache 软件基金会孵化器。 有数 BI 个人版永久免费;发布机器学习平台、消费者运营平台、标签画像、流量分析等产品。 2020 2021 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 实时数据传输 运维中心 离线开发平台 实时计算平台 集群运维 任务运维 文件管理 任务开发 租户管理 自助分析 权限管理 可视化调度 数据开发及管理平台 标签画像 消费者运营平台 机器学习平台 BI 有数优势 有数全链路数据生产力平台2.0能力全景图 易用 覆盖企业数据全链路的大数 据产品,全面降低数据使用门 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 基于 Apache Flink 构建的高性能、一站式实时大数据处理方案,广泛适用于流式数据处理场景。 有数实时计算平台 一站式、低门槛分析建模平台,帮助客户更快、更便捷、更智能地挖掘数据价值。 有数机器学习平台 19 产品能力 产品能力 全渠道数据融合 支持多渠道数据整合,可灵活 对接主流社交平台、品牌内部 系统等数据源,为消费者运营 平台奠定数据资产基础。 消费者精准洞察 基于敏捷标签应用体系及业0 码力 | 43 页 | 884.64 KB | 1 年前32021 中国开源年度报告
杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养,越来 越多的学生参与到开源开发中,开源人才培养周期前置,越来越多的学校开设开源课程, 希望后续可以实现在学习计算机、编译原理、软件工程等理论知识的同时,让学生学习掌 握开源开发模式、理解认同开源文化。 Yang Liyun: China's open source talent reserve is sufficient; the [Expert Comment] 段夕华: 科技型初创公司用开源来实现技术能力展现,吸引潜在合作伙伴,这个趋势不 容忽视。这其中国内最为抢眼的就是 PingCAP/TiDB,其开源策略、战术均值得大家学习 借鉴。 Duan Xihua: Technology startups use open source to show their technical capabilities and Comment] 堵俊平:在欧美,邮件列表和 Issue 是开源开发者交流的主要方式,这样既可以公开、 透明,又可以把讨论的过程沉淀下来,降低后加入者的学习成本。国内开发者当前习惯在 微信群中讨论问题,但受限于微信群的规模以及非公开的讨论问题的方式,需要聊天机器 人等辅助工具才能达成开源社区的沟通需要。 Du Junping: In Europe and the United States, mailing0 码力 | 199 页 | 9.63 MB | 1 年前32023年中国基础软件开源产业研究白皮书
含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 开源内容传播应用与 迭代升级,达到社会 实现互惠互利、共建共享 获得职业发展机会 提高自我认同 提升自身知识技术水平 占比(%) 56.6% 53.9% 参与开源贡献的原因 开源代码仓、开源社区公开课程、讲座、技术指南已 成为开发者在工作学习外的重要行业知识来源 知识技术 水平提升 实现自我 价值认同 开发者多以兴趣为导向选择开源项目,在帮助项目逐 渐完善的过程中,完成自身的价值认同 获得职业 发展机会 对开源社区的贡献能够很好的反应开发者的技术素 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 两类开源开发者行为差异 参与开源目的 代码贡献特征 付费意愿 平台权益 个人开发者 企业开发者 出于兴趣或求知欲进入 开源社区,希望学习社 区内优秀代码,并与 “大神”交流 以商业视角出发,希望 通过对开源项目的二次 开发形成开源软件的行 业发行版,实现商业收 益 代码贡献多针对于某一 单一模块的能力优化或 Bug修补,商业化潜力0 码力 | 43 页 | 4.69 MB | 1 年前3中国开源软件产业研究报告
www.iresearch.com.cn 云计算、容 器和虚拟化 22.7% 网络和边缘计算 15.0% web和应用程序开发 13.6% 人工智能、机器学习、数 据和分析 10.8% 隐私与安全 5.1% cross-technology 4.8% 物联网与嵌入式 4.6% 区块链 4.3% DevOps, CI/CD & Site Gitee上的代码仓库总数超过1500万个。开源软件在不同行业领域中的渗透率不断加深,新兴领域对开源的态度更加开放, 行业代码库中开源软件占比最高的前三个行业分别是物联网、网络安全以及制造业、工业与机器人行业,几乎所有行业代 码库中开源软件的占比均达到半数。 Top 01 Java Top 02 Top 03 JavaScript PHP Top 04 Python Top 05 C# 适应各类智能设备;OpenGauss是华为于2019年开源的数据库产品,内核源自PostgreSQL,采用木兰宽松许可证v2,具 备高性能、高可用、高安全、易运维、全开放的特点,深度融合华为在数据库领域多年的研发经验,并构建起了多个学习 交流平台。 华为OpenHarmony开源分布式操作系统架构 华为OpenGauss开源数据库架构 应用层 内核层 框 架 层 系 统 服 务 层 内核子系统 驱动子系统 系 统 基0 码力 | 68 页 | 3.63 MB | 1 年前3Gitea,新一代的代码托管平台
遵循典型的 Git flow 工作流程 编写代码 01 创建仓库 管理员创建仓库,分支保护策略 、合并方式等,并进行初始化 02 clone 仓库 开发人员将仓库 clone 到本地开发机器 03 创建分支,代码编写, 提交代码至个人开发分支 04 创建合并请求 提交 pull request 到分支 05 . 审查与合并 Team Lead 对提交的 PR 进行代 码审查,通过后进行合并 工作流程/操作语法兼容:与 GitHub Actions 工作流程、操作语 法高度兼容。 生态兼容 • 类 Github 的使用体验,使用习惯无缝衔接; • 完全兼容 Git 命令,无额外学习成本; • 提供 Tea 命令,操作方便、快捷、高效。 使用简单 • 支持多种部署方式,几条命令快速安装和升级 Gitea; • 兼容多种架构(x86、arm64)和操作系统(Linux、Windows、macOS、 与其他系统或工具集成,实现高效的工作流程。 集成简单 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 简单易用 采用 Go 编写,资源占用为 GitLab的 1/4,运行速度为 GitLab 的 3 倍 相同机器配置:2C4G • 无负载时内存占用:GitLab 约 3GB,Gitea 约 200MB; • 启动时间(从启动到可以接收请求):GitLab 约 2 分 钟,Gitea 约 5 秒; •0 码力 | 30 页 | 14.34 MB | 1 年前3
共 11 条
- 1
- 2