Moonshot AI 介绍
S的Testof Time奖。它在10年前⽤⼀个词去预测周围的词,相当于contextlength是5。RNN把有效的 contextlength提升到了20。LSTM涨到⼤⼏⼗。transformer到了⼏千。现在我们能做到⼏⼗万。 如果你有10亿的contextlength,今天看到的问题都不是问题。 此外,其实⽆损压缩就是在⼀⽚混沌中学 杨植麟:核⼼是两点,⼀个是抓⼤放⼩,⼀个是终局思维。我跟很多researcher合作过,容易出现的 ⼀个问题就是过分雕花,容易在局部⾥看到有很多可以优化的东西,⽐如我们发现transformer解决 了LSTM的contextlength问题,但如果再跳出来⼀层,就会发现本质上每⼀代技术都是在提升 contextlength。 海外独⻆兽:你觉得⽉之暗⾯还需要多少这样的⼈才? 杨0 码力 | 74 页 | 1.64 MB | 1 年前32023年中国基础软件开源产业研究白皮书
完备的AI开发工具,高效支持大模型 开发及训练 AI+科学计算 手机电磁仿真、化合物预训练模型、 飞机气动仿真 MindSpore Lite 简化部署 AI实验室一站式开发 Build-in套件 BERT LSTM Vit ResNet 模型库 图像分类 目标检测 文本分类 … 数据集 在线加载 快速上手官方样例仓库 完备使用教程 代码管理 在线训练 界面启动 Jupyter Notebook0 码力 | 43 页 | 4.69 MB | 1 年前3
共 2 条
- 1