变量 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

里构建，即： make -C build -j4 // 调用本地的构建系统执行 install 这个目标，即安装 -D 选项：指定配置变量（又称缓存变量） • 可见 CMake 项目的构建分为两步： • 第一步是 cmake -B build ，称为配置阶段（ configure ），这时只检测环境并生成构建规则 • 会在 build Makefile 或是 .sln ） • 第二步是 cmake --build build ，称为构建阶段（ build ），这时才实际调用编译器来编译代码 • 在配置阶段可以通过 -D 设置缓存变量。第二次配置时，之前的 -D 添加仍然会被保留。 • cmake -B build -DCMAKE_INSTALL_PREFIX=/opt/openvdb-8.0 • ↑ 设置安装路径为 /opt/openvdb-8 -DCMAKE_BUILD_TYPE=Release • ↑ 设置构建模式为发布模式（开启全部优化） • cmake -B build ← 第二次配置时没有 -D 参数，但是之前的 -D 设置的变量都会被保留 • （此时缓存里仍有你之前定义的 CMAKE_BUILD_TYPE 和 CMAKE_INSTALL_PREFIX ） -G 选项：指定要用的生成器 • 众所周知， CMake 是一个跨平台的构建系统，可以从

0 码力 | 166 页 | 6.54 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

模板的难题：编译期常量的限制 • 编译期常量的限制就在于他不能通过运行时变量组成的表达式来指定。比如： • 这里在 if constexpr 的表达式里用到了运行时变量，从而无法作为编译期分支的条件。模板的难题：编译期常量的限制（续） • 除了 if constexpr 的表达式不能用运行时变量，模板尖括号内的参数也不能： • 可以在 bool debug 变量的定义前面加上 constexpr 来解决： • 没有 auto 的话，需要声明一个变量，必须重复一遍他的类型，非常麻烦：自动类型推导：定义变量因此 C++11 引入了 auto ，使用 auto 定义的变量，其类型会自动根据等号右边的值来确定：自动类型推导：一些局限性 • 不过 auto 也并非万能，他也有很多限制。 • 因为需要等号右边的类型信息，所以没有 = 单独声明一个 auto 变量是不行的： • 而且，类成员也不可以定义为而且，类成员也不可以定义为 auto ：自动类型推导：函数返回值 • 除了可以用于定义变量，还可以用作函数的返回类型： • 使用 auto 以后，会自动被推导为 return 右边的类型。 • 不过也有三点注意事项： 1. 当函数有多条 return 语句时，所有语句的返回类型必须一致，否则 auto 会报错。 2. 当函数没有 return 语句时， auto 会被推导为 void 。 3. 如果声明和实现分离了，则不能声明为

0 码力 | 82 页 | 12.15 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

刚刚说过，计算机的位数决定了内存地址的大小。 • 而指针的本质就是内存地址，所以指针的大小在 32 位系统上就 32 位， 64 位系统上就 64 位。 • 稍后我们再来详细讲解一下指针，有时候我们需要把指针的地址值存在整型变量里。 • 而 32 位平台上的指针是 32 位， 64 位平台上的指针是 64 位。 • 所以是不是需要根据当前平台来判断要使用哪一种代码了？ • 不需要，可以用自动随系统位数变化的 intptr_t 而刚刚的例子中我们的 abs 返回类型其实始终是 int ，被送到 printf 里却以 “ %f” 的方式去读出，所以出错了。 • 因此我们先把 abs 的返回值写入到一个 float 类型变量里试试看，果然有了变化。 • 但还是不对，按理说 abs(-3.14) 应该是 3.14 的，怎么会变成 3.00 呢？ abs 函数：取出整数的绝对值 • 这就是第二个 bug 了， C 1048576 个房子。变量在内存中的存储方式（大端字节序）地址字节刚刚说过一个 int 由四个字节组成，因此一个 int 类型要占据四栋房子。而对于 int 类型的四个字节要按照什么顺序放入四栋房子，有两种方式。其中大端字节序（ big-endian ）就是先从高地址开始存字节的方式。比如假设 x=1 的话，那么大端字节序的存储方式是：变量在内存中的存储方式（小端字节序）

0 码力 | 128 页 | 2.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

build 才能更新。 • 加了，则每次 cmake --build 时自动检测目录是否更新，如果目录有新文件了， CMake 会自动帮你重新运行 cmake -B build 更新 myvar 变量。六、头文件和源文件的一一对应关系 • 通常每个头文件都有一个对应的源文件，两个文件名字应当相同（方便我们理解，也方便 IDE 跳转），只有后缀名不一样。 • 如果是一个类，则文件名应和类名相同，方便查找里写一些你常用的函数，宏，变量等。十三、你知道吗？ CMake 也有 include 功能 • 和 C/C++ 的 #include 一样， CMake 也有一个 include 命令。 • 你写 include(XXX) ，则他会在 CMAKE_MODULE_PATH 这个列表中的所有路径下查找 XXX.cmake 这个文件。 • 这样你可以在 XXX.cmake 里写一些你常用的函数，宏，变量等。 include 相当于直接把代码粘贴过去，直接访问调用者的作用域。这里创建的变量和外面共享，直接 set(key val) 则调用者也有 ${key} 这个变量了。 • function 中则是基于定义者所在路径，优先访问定义者的作用域。这里需要 set(key val PARENT_SCOPE) 才能修改到外面的变量。第二章：第三方库 / 依赖项配置用 find_package 寻找系统中安装的第三方库并链接他们

0 码力 | 56 页 | 6.87 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

等待所有子线程执行完毕。所以另一种解法是把 t1 对象移动到一个全局变量去，从而延长其生命周期到 myfunc 函数体外。 • 这样就可以等下载完再退出了。 main 函数退出后自动 join 全部线程 • 但是需要在 main 里面手动 join 全部线程还是有点麻烦，我们可以自定义一个类 ThreadPool ，并用他创建一个全局变量，其解构函数会在 main 退出后自动调用。 std::jthread ，独立地上锁，可以避免不必要的锁定，提升高并发时的性能。 • 还用了一个 {} 包住 std::lock_guard ，限制其变量的作用域，从而可以让他在 } 之前解构并调用 unlock() ，也避免了和下面一个 lock_guard 变量名冲突。如果上锁失败，不要等待： try_lock() • 我们说过 lock() 如果发现 mutex 已经上锁的话，会等待他直到他解锁。 const ？第 6 章：条件变量条件变量：等待被唤醒 • cv.wait(lck) 将会让当前线程陷入等待。 • 在其他线程中调用 cv.notify_one() 则会唤醒那个陷入等待的线程。 • 可以发现 std::condition_variable 必须和 std::unique_lock 一起用，稍后会解释原因。条件变量：等待某一条件成真 •

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

函数是 C/C++ 程序中第一个执行的函数，是程序的入口点。 • 但，他真的是第一个执行的吗？全局变量初始化的妙用 • 我们可以定义一个 int 类型全局变量 helper ，然后他的右边其实是可以写一个表达式的，这个表达式实际上会在 main 函数之前执行！ • 全局变量的初始化会在 main 之前执行，这实际上是 C++ 标准的一部分，我们完全可以放心利用这一点来执行任意表达式。在函数体内也可以这样： • [&]{ xxx; yyy; return zzz; }() • 来在语句块内使用外部的局部变量。带有构造函数和解构函数的类 • 实际上，只需定义一个带有构造函数和解构函数的类（这里的 Helper ），然后一个声明该类的全局变量（ helper ），就可以保证： • 1. 该类的构造函数一定在 main 之前执行 • 2. 该类的解构函数一定在 main 为了寻找思路，我们把眼光挪开全局的 static 变量，来看看函数的 static 变量吧！ • 众所周知，函数体内声明为 static 的变量即使函数退出后依然存在。 • 实际上函数的 static 变量也可以指定初始化表达式，这个表达式会在第一次进入函数时执行。注意：是第一次进入的时候执行而不是单纯的在 main 函数之前执行哦！如果函数体内的 static 变量是一个类呢？ • 如果函数体内的

0 码力 | 54 页 | 3.94 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

/index.html#extended-notation 针对不同的架构，使用不同的代码通过 CMake 设置架构版本号 • 可以用 CMAKE_CUDA_ARCHITECTURES 这个变量，设置要针对哪个架构生成 GPU 指令码。 • 小彭老师的显卡是 RTX2080 ，他的版本号是 75 ，因此最适合他用的指令码版本是 75 。 • 如果不指定，编译器默认的版本号是 52 是为并行而生的，可以开启很大数量的线程，用于处理大吞吐量的数据。获取线程编号 • 可以通过 threadIdx.x 获取当前线程的编号，我们打印一下试试看。 • 这是 CUDA 中的特殊变量之一，只有在核函数里才可以访问。 • 可以看到线程编号从 0 开始计数，打印出了 0 ， 1 ， 2 。这也是我们指定了线程数量为 3 的缘故。 • 等等，为什么后面有个 .x ？稍后再说明。小彭老师也这么觉得，可能是历史遗留下来的问题，就不追究了。线程之上：板块 • CUDA 中还有一个比线程更大的概念，那就是板块（ block ），一个板块可以有多个线程组成。这就是为什么刚刚获取线程数量的变量用的是 blockDim ，实际上 blockDim 的含义是每个板块有多少个线程。 • 要指定板块的数量，只需调节三重尖括号里第一个参数即可。我们这里调成 2 。总之： • <<<

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

堆空间执行你这段代码的栈空间已释放已释放 v2 要写入的数执行中的代码 for (auto [k, v]: m) { v = v2; } 纹丝不动 ~ • 如果你想让你对局部变量 v 的修改，能对原本 map 中的 v 生效，就要得到 v 的指针，因为只有指针是浅拷贝的，是可以远程修改另一个对象的。 • 这里说的指针，不光是 T * 指针，还包括 T & 引用， iterator map 中的堆空间执行你这段代码的栈空间 v2 要写入的数执行中的代码 for (auto &[k, v]: m) { v = v2; } 未初始化 • 如果你想让你对局部变量 v 的修改，能对原本 map 中的 v 生效，就要得到 v 的指针，因为只有指针是浅拷贝的，是可以远程修改另一个对象的。 • 这里说的指针，不光是 T * 指针，还包括 T & 引用， iterator 堆空间执行你这段代码的栈空间 v2 要写入的数执行中的代码 for (auto &[k, v]: m) { v = v2; } & & ( 建立引用 ) • 如果你想让你对局部变量 v 的修改，能对原本 map 中的 v 生效，就要得到 v 的指针，因为只有指针是浅拷贝的，是可以远程修改另一个对象的。 • 这里说的指针，不光是 T * 指针，还包括 T & 引用， iterator

0 码力 | 90 页 | 8.76 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

stoi 略去了呢？或者说，数字部分从哪里结束？ • 这就要用到 stoi 的第二参数，他是一个 size_t 的指针，默认为 nullptr 。 • 若该指针不为 nullptr ，则会往他指向的变量写入一个整数，表示数字部分结束的那个字符所在的位置，很绕口？来看个例子就懂了。 • 例如 stoi(“42yuan”, &pos) 会返回 42 ，并把 pos 设为 2 。因为 ‘ y’ 是数字 rust 原创的，也不是 C++20 以后才出现的。 • 为了表示动态长度的数组， C++ 中的 vector 和 string 其实都是胖指针。 • string 和 vector 内部都有三个成员变量： ptr, len, capacity 。 • 前两个 [ptr, len] 其实就是表示实际有效范围（存储了字符的）的胖指针。 • 而 [ptr, capacity] 就是表示实际已分配内存（操作系统认为的）的胖指针。字符串和原字符串共享一片内存，实现了零拷贝零分配嘛！ • 于是就有了接口和 string 很相似，但是只保留胖指针，而不掌管他所指向内存生命周期的 string_view 类。 • 因为不论子字符串多大，真正改变的只有两个变量，所以 string_view 的 substr 函数复杂度为 O(1) 。 remove_prefix 、 remove_suffix • sv.remove_prefix(n) 等价于 sv

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

测一下，不要脑内模拟 inline 在现代 C++ 中有其他含义，但和内联没有关系，他是一个迷惑性的名字 “ 大厂面试官”笑话 • 同样沦为笑柄的还有 register 关键字，号称：可以让一个变量使用寄存器存储，更高效。 • 都能把等差数列求和优化成 5050 的编译器笑着看着你，说道：还要你提醒吗？ • 所以，如果某“面试官”试图“考考”你 register 和 inline 的所谓“优化技巧”，你直接把小彭反而变慢。第 3 章：指针编译器傻了吗？为什么编译器不优化掉 *c = *a ？指针别名现象（ pointer aliasing ）考虑这种调用方式： b 和 c 指向同一个变量。优化前相当于： b = a; b = b; 最后 b 变成了 a 。如果优化了： b = b; 最后 b 没有改变。导致优化后结果不一样，这就是编译器放弃优化的原因。告诉编译器别怕指针别名：由地使用 SIMD 指令啦循环中的不变量：挪到外面来 dt * dt 和当前 i 无关，因此可以移到循环体外，提前计算，避免重复计算。提前算好 dt * dt 优化前：优化后：挪到外面来：优化失败然而只要去掉 (dt * dt) 的括号就会优化失败：因为乘法是左结合的，就相当于 (b[i] * dt) * dt 编译器识别不到不变量，从而优化失败。因此，要么帮编译器打上括号帮助他识别，要

0 码力 | 108 页 | 9.47 MB | 1 年前
3

共 22 条前往

页

C++高性性能高性能并行编程优化课件 11 03 12 16 05 08 17 15 04

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化