Mapper 作业 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

说起 13.结业典礼：总结所学知识与优秀作业点评 I 硬件要求： 64 位（ 32 位时代过去了）至少 2 核 4 线程（并行课…）英伟达家显卡（ GPU 专题）软件要求： Visual Studio 2019 （ Windows 用户） GCC 9 及以上（ Linux 用户） CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit 如果感兴趣，我可以增添一节专门讲动态多态。回家作业！ • 已经发布到： https://github.com/parallel101/hw02 • 仓库的 README.md 里有详细的作业要求和说明。请按要求修改其中的代码，使得双向链表类 List 的拷贝构造函数能正常工作，且内存能够安全释放。 • 通过 pull request 提交你的作业，这样我可以通过 diff 页面清楚地看到你的改动。页面清楚地看到你的改动。 • 什么事 pull request ？还是善用搜索引擎，这是作业的一部分（ x 感谢观看！ by 彭于斌（ github@archibate ）录播： https://space.bilibili.com/ 263032155 课件： https://github.com/parallel101/ course 作业： https://github.com/parallel101/ hw02

0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

说起 13.结业典礼：总结所学知识与优秀作业点评 I 硬件要求： 64 位（ 32 位时代过去了）至少 2 核 4 线程（并行课…）英伟达家显卡（ GPU 专题）软件要求： Visual Studio 2019 （ Windows 用户） GCC 9 及以上（ Linux 用户） CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit 函数一样，同样会有惰性、多次编译的特性。 C++20 前瞻：函数也可以 auto ， lambda 也可以 • 如右图，两者的用法可以互换，更方便了。 • 老师也欢迎同学们在作业中尝试 C++20 新特性，如果你们有相应的编译环境的话。 • auto wrap(auto f) { • return [=] (auto ...args) { • return https://space.bilibili.com/ 263032155 课件： https://github.com/parallel101/ course 作业： https://github.com/parallel101/ hw03 作业还在准备中，等做完了会在动态中放出！

0 码力 | 82 页 | 12.15 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

说起 13.结业典礼：总结所学知识与优秀作业点评 I 硬件要求： 64 位（ 32 位时代过去了）至少 2 核 4 线程（并行课…）英伟达家显卡（ GPU 专题）软件要求： Visual Studio 2019 （ Windows 用户） GCC 9 及以上（ Linux 用户） CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit https://space.bilibili.com/ 263032155 课件： https://github.com/parallel101/ course 作业： https://github.com/parallel101/ hw04 作业还在准备中，等做完了会在动态中放出！

0 码力 | 108 页 | 9.47 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

说起 13.结业典礼：总结所学知识与优秀作业点评 I 硬件要求： 64 位（ 32 位时代过去了）至少 2 核 4 线程（并行课…）英伟达家显卡（ GPU 专题）软件要求： Visual Studio 2019 （ Windows 用户） GCC 9 及以上（ Linux 用户） CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit https://space.bilibili.com/ 263032155 课件： https://github.com/parallel101/ course 作业： https://github.com/parallel101/ hw06 作业还在准备中，等做完了会在动态中放出！

0 码力 | 116 页 | 15.85 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

说起 13.结业典礼：总结所学知识与优秀作业点评 I 硬件要求： 64 位（ 32 位时代过去了）至少 2 核 4 线程（并行课…）英伟达家显卡（ GPU 专题）软件要求： Visual Studio 2019 （ Windows 用户） GCC 9 及以上（ Linux 用户） CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit https://space.bilibili.com/ 263032155 课件： https://github.com/parallel101/ course 作业： https://github.com/parallel101/ hw05 作业还在准备中，等做完了会在动态中放出！

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

说起 13.结业典礼：总结所学知识与优秀作业点评 I 硬件要求： 64 位（ 32 位时代过去了）至少 2 核 4 线程（并行课…）英伟达家显卡（ GPU 专题）软件要求： Visual Studio 2019 （ Windows 用户） GCC 9 及以上（ Linux 用户） CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit

0 码力 | 32 页 | 11.40 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

GPU 的页大小是 2MB ，王鑫磊最近研究过这个，因为太繁琐而放弃了。 http://pages.cs.wisc.edu/~sifakis/papers/SPGrid.pdf 今天的回家作业 • 用稀疏数据结构改良康威生命游戏 (conway’s game of life) 的代码。 • 要求：自动扩展边界，按需分配内存，垃圾回收及时释放全零的块，用量化的 bit 压缩空间，使用 https://space.bilibili.com/ 263032155 课件： https://github.com/parallel101/ course 作业： https://github.com/parallel101/ hw10 作业还在准备中，等做完了会在动态中放出！

0 码力 | 102 页 | 9.50 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

const char *s, size_t slen); replace 批量替换字符串不是最高效的写法，最坏情况可达 O(mn) ，其中 m 是 “ pyb” 出现次数，如何优化？留作课后作业！官方文档对 replace 的描述 https://en.cppreference.com/w/cpp/string/basic_string/replace 小彭老师表示：边界情况总结实验代码（ course/15/09/a.cpp ）实验代码（ course/15/09/b.cpp ） Linux 命令行实验 Linux 命令行实验字符串应用实战（作业）第 10 章课后作业 • 输入是一个文本文件 a.txt ： • 1 xxx • 4 yyyyyyy • 3 zzzz • 2 wwwww • 要求按照前面的数字排序，输出到另一个文本文件 b.txt

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

std::function 则是擦除 operator() 函数。 • 你甚至可以擦除 push_back() ，让 std::string 和 std::vector 等价（留做回家作业）。 • https://www.boost.org/doc/libs/1_55_0/doc/html/ boost_typeerasure.html 类型擦除利用的是 C++ 模板的惰性实例化，只是一个例子，其实不一定是成员函数，完全可以是 std::sort(m_inner.begin(), m_inner.end()) 之类的任意表达式，只要语义上通过，就可以实例化。 • （把 sort 封装成虚函数，留作回家作业） Zeno 中对 OpenVDB 的类型擦除 • 结合类型擦除技术，自动虚克隆技术。 • VDBGrid 作为所有网格类的基类提供各个操作做为虚函数， VDBGridWrapper 则是

0 码力 | 54 页 | 3.94 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

相差了 20 倍。其中一部分是因为每个缓存行只用到了 1/16 造成的，一部分是因为跳跃的访存让 CPU 没有办法自动预取造成的。封装成 ndarray 类 ndarray.h ，同学们可以在作业或是自己的项目里随意使用。不要再用 Java 式的二层三层指针了，用 ndarray<2, float> 声明一个二维浮点数组， ndarray<3, int> 声明一个三维整型数组。这里的

0 码力 | 147 页 | 18.88 MB | 1 年前
3

共 10 条前往

页

C++高性性能高性能并行编程优化课件 02 03 04 06 05 01 10 15 07

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化