命令行选项 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

CMake 。 • 现代 CMake 和古代 CMake 相比，使用更方便，功能更强大。为什么要学习现代 CMake ？现代 CMake ：古代 CMake ：第 0 章：命令行小技巧传统的 CMake 软件构建 / 安装方式 • mkdir build • cd build • cmake .. • make -j4 • sudo make install 目录再切换进去再指定源码目录的麻烦。 • cmake --build build 统一了不同平台（ Linux 上会调用 make ， Windows 上调用 devenv.exe ） • 结论：从现在开始，如果在命令行操作 cmake ，请使用更方便的 -B 和 --build 命令。 // 在源码目录用 -B 直接创建 build 目录并生成 build/Makefile // 自动调用本地的构建系统在 build build 里构建，即： make -C build -j4 // 调用本地的构建系统执行 install 这个目标，即安装 -D 选项：指定配置变量（又称缓存变量） • 可见 CMake 项目的构建分为两步： • 第一步是 cmake -B build ，称为配置阶段（ configure ），这时只检测环境并生成构建规则 • 会在 build

0 码力 | 166 页 | 6.54 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

CMakeLists.txt 。二、根项目的 CMakeLists.txt 配置 • 在根项目的 CMakeLists.txt 中，设置了默认的构建模式，设置了统一的 C++ 版本等各种选项。然后通过 project 命令初始化了根项目。 • 随后通过 add_subdirectory 把两个子项目 pybmain 和 biology 添加进来（顺序无关紧要），这会调用 src/main.cpp （√） src/test/main.cpp （√） • 区别在于 GLOB_RECURSE 允许 * 匹配嵌套的目录。 • 疑问 2 ：加了 CONFIGURE_DEPENDS 这个选项有什么区别？ • 如果不加，在你创建新文件时， myvar 不会自动更新，还是旧的那几个文件，可能出现 undefined symbol ，需要重新运行 cmake -B build 才能更新。 libQt5Core.so ）。 • 而是去找包配置文件（例如 Qt5Config.cmake ），这个配置文件里包含了包的具体信息，包括动态库文件的位置，头文件的目录，链接时需要开启的编译选项等等。而且某些库都具有多个子动态库，例如 Qt 就有 libQt5Core.so 、 libQt5Widgets.so 、 libQt5Network.so 。因此 CMake 要求所有第三方库作者统一包装成一个

0 码力 | 56 页 | 6.87 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

因此，我们提出多文件编译的概念，文件之间通过符号声明相互引用。 • > g++ -c hello.cpp -o hello.o • > g++ -c main.cpp -o main.o • 其中使用 -c 选项指定生成临时的对象文件 main.o ，之后再根据一系列对象文件进行链接，得到最终的 a.out ： • > g++ hello.o main.o -o a.out 为什么需要构建系统（ Makefile CMakeLists.txt 中指明 target_link_libraries(a.out OpenMP::OpenMP_CXX) 即可。输出的可执行文件输入的多个源文件 CMake 的命令行调用 • 读取当前目录的 CMakeLists.txt ，并在 build 文件夹下生成 build/Makefile ： • > cmake -B build • 让 make 读取 build/Makefile hellolib 的可执行文件自动添加这个路径，把 PUBLIC 改成 PRIVATE 即可。这就是他们的用途：决定一个属性要不要在被 link 的时候传播。目标的一些其他选项 • 除了头文件搜索目录以外，还有这些选项， PUBLIC 和 PRIVATE 对他们同理： • target_include_directories(myapp PUBLIC /usr/include/eigen3)

0 码力 | 32 页 | 11.40 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

\x1b’ ） • 127 表示 DEL 键（‘ \x7f’ ）等 • 0~31 和 127 这些整数，就构成了 ASCII 码中控制字符的部分。关于控制字符的一个冷知识 • 在 Linux 命令行中启动 cat 。 • 试试按 Ctrl+R ， Ctrl+E ， Ctrl+C 等一系列组合键，看到出现了什么？ • 可以看到显示的字符变成了 ^R ^E ^C 等… … • 这是 Unix • cout 这么方便，能不能让他不要直接输出到控制台，而是把结果存到一个字符串呢？这正是字符串流 stringstream 的作用。 • 和 cout 完全一样，同样的 << 和 hex 选项。 • 但是他的输出会保存到一个字符串里。 • 调用成员函数 .str() 就能取出这个字符串了。 • 之后这个字符串就可以用作其他用途，比如 printf 打印，或者用于查询数据库，都没问题。 cin ，用 >> 即可。 • 总结： • << 可以模仿 cout ，取代 to_string 。 • >> 可以模仿 cin ，取代 stoi/stof/stod 。 • 最重要的是他支持各种控制选项（如 hex ），功能性比 to_string 和 stoi 更强大。 • 要导入他，只需 #include 即可。字符串常用操作第 6 章 at 获取指定位置的字符

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

通常都是一些可以内联的函数，数学计算表达式之类的，一个个加上太累了，所以产生了这个需求。 • 不过必须指定 --expt-relaxed-constexpr 这个选项才能用这个特性，我们可以用 CMake 的生成器表达式来实现只对 .cu 文件开启此选项（不然给到 gcc 就出错了）。 • 当然， constexpr 里没办法调用 printf ，也不能用 __syncthreads 之类的多遍，每次针对不同的架构，所以编译会变得非常慢，生成的可执行文件也会变大。 • 通常在自己的电脑上用时，同学们只要根据自己显卡的指定一个版本号即可。如果 CMakeLists.txt 里没有指定，也可以从命令行参数指定：版本号和商品名对照表 • 版本 52 ： Quadro M6000 , GeForce 900, GTX-970, GTX-980, GTX Titan X • 版本 53 ： Tegra __fdividef(x, y) 提供更快的浮点除法，和一般的除法有相同的精确度，但是在 2^216 < y < 2^218 时会得到错误的结果。编译器选项： --use_fast_math • 如果开启了 --use_fast_math 选项，那么所有对 sinf 的调用都会自动被替换成 __sinf 。 • --ftz=true 会把极小数 (denormal) 退化为 0 。 • --prec-div=false

0 码力 | 142 页 | 13.52 MB | 1 年前
3
现代C++ 教程：高速上手C++11/14/17/20

辑器中，制表符可能会被自动替换掉，请自行确保在 Makefile 中的缩进是由制表符完成的。如果你还不知道 Makefile 的使用也没有关系，本教程中不会构建过于复杂的代码，简单的在命令行中使用 clang++ -std=c++2a 也可以阅读本书。如果你是首次接触现代 C++，那么你很可能还看不懂上面的那一小段代码，即： [out = std::ref(std::cout << 但未来某个时间点上一定能观察到 x 为 4 的情况内存顺序为了追求极致的性能，实现各种强度要求的一致性，C++11 为原子操作定义了六种不同的内存顺序 std::memory_order 的选项，表达了四种多线程间的同步模型： 1. 宽松模型：在此模型下，单个线程内的原子操作都是顺序执行的，不允许指令重排，但不同线程间原子操作的顺序是任意的。类型通过 std::memory_order_relaxed x 的写操作，线程 B 仅依赖其中第三次 x 的写操作，与 x 的前两次写行为无关，则当 A 主动 x.release() 时候（即使用 std::memory_order_release），选项 std::memory_order_consume 能够确保 B 在调用 x.load() 时候观察到 A 中第三次对 x 的写操作。我们来看一个例子： // 初始化为 nullptr 防止

0 码力 | 83 页 | 2.42 MB | 1 年前
3
Hello 算法 1.0.0b4 C++版

元，则收银员需要给我们找 31 元。他会很自然地完成以下思考： 1. 可选项是比 31 元面值更小的货币，包括 1 , 5 , 10 , 20 元。 2. 从可选项中拿出最大的 20 元，剩余 31 − 20 = 11 元。 3. 从剩余可选项中拿出最大的 10 元，剩余 11 − 10 = 1 元。 4. 从剩余可选项中拿出最大的 1 元，剩余 1 − 1 = 0 元。 5. 完成找零，方案为 ‧ 子问题的解无需合并：二分查找旨在查找一个特定元素，因此不需要将子问题的解进行合并。当子问题得到解决时，原问题也会同时得到解决。分治能够提升搜索效率，本质上是因为暴力搜索每轮只能排除一个选项，而分治搜索每轮可以排除一半选项。 12. 分治 hello‑algo.com 233 基于分治实现二分在之前的章节中，二分查找是基于递推（迭代）实现的。现在我们基于分治（递归）来实现它。 Python 环境 1. 下载并安装 Miniconda3 。 2. 在 VSCode 的插件市场中搜索 python ，安装 Python Extension Pack 。 3.（可选）在命令行输入 pip install black ，安装代码格式化工具。 16.1.5. Go 环境 1. 下载并安装 go 。 2. 在 VSCode 的插件市场中搜索 go ，安装 Go 。 3.

0 码力 | 343 页 | 27.39 MB | 1 年前
3
Hello 算法 1.1.0 C++ 版

元，则收银员需要找我们 31 元。他会很自然地完成如图 1‑3 所示的思考。 1. 可选项是比 31 元面值更小的货币，包括 1 元、5 元、10 元、20 元。 2. 从可选项中拿出最大的 20 元，剩余 31 − 20 = 11 元。 3. 从剩余可选项中拿出最大的 10 元，剩余 11 − 10 = 1 元。 4. 从剩余可选项中拿出最大的 1 元，剩余 1 − 1 = 0 元。 5. 完成找零，方案为 ‧ 子问题的解无须合并：二分查找旨在查找一个特定元素，因此不需要将子问题的解进行合并。当子问题得到解决时，原问题也会同时得到解决。分治能够提升搜索效率，本质上是因为暴力搜索每轮只能排除一个选项，而分治搜索每轮可以排除一半选项。 1. 基于分治实现二分查找在之前的章节中，二分查找是基于递推（迭代）实现的。现在我们基于分治（递归）来实现它。第 12 章分治 hello‑algo Miniconda3 ，需要 Python 3.10 或更新版本。 2. 在 VS Code 的插件市场中搜索 python ，安装 Python Extension Pack 。 3.（可选）在命令行输入 pip install black ，安装代码格式化工具。 2. C/C++ 环境 1. Windows 系统需要安装 MinGW（配置教程）；MacOS 自带 Clang ，无须安装。

0 码力 | 379 页 | 18.47 MB | 1 年前
3
Hello 算法 1.0.0b5 C++版

元，则收银员需要找我们 31 元。他会很自然地完成如图 1‑3 所示的思考。 1. 可选项是比 31 元面值更小的货币，包括 1 元、5 元、10 元、20 元。 2. 从可选项中拿出最大的 20 元，剩余 31 − 20 = 11 元。 3. 从剩余可选项中拿出最大的 10 元，剩余 11 − 10 = 1 元。 4. 从剩余可选项中拿出最大的 1 元，剩余 1 − 1 = 0 元。 5. 完成找零，方案为 ‧ 子问题的解无须合并：二分查找旨在查找一个特定元素，因此不需要将子问题的解进行合并。当子问题得到解决时，原问题也会同时得到解决。分治能够提升搜索效率，本质上是因为暴力搜索每轮只能排除一个选项，而分治搜索每轮可以排除一半选项。 1. 基于分治实现二分在之前的章节中，二分查找是基于递推（迭代）实现的。现在我们基于分治（递归）来实现它。第 12 章分治 hello‑algo.com Python 环境 1. 下载并安装 Miniconda3 。 2. 在 VSCode 的插件市场中搜索 python ，安装 Python Extension Pack 。 3.（可选）在命令行输入 pip install black ，安装代码格式化工具。 5. Go 环境 1. 下载并安装 go 。 2. 在 VSCode 的插件市场中搜索 go ，安装 Go 。 3. 快捷键

0 码力 | 377 页 | 30.69 MB | 1 年前
3
Hello 算法 1.0.0 C++版

元，则收银员需要找我们 31 元。他会很自然地完成如图 1‑3 所示的思考。 1. 可选项是比 31 元面值更小的货币，包括 1 元、5 元、10 元、20 元。 2. 从可选项中拿出最大的 20 元，剩余 31 − 20 = 11 元。 3. 从剩余可选项中拿出最大的 10 元，剩余 11 − 10 = 1 元。 4. 从剩余可选项中拿出最大的 1 元，剩余 1 − 1 = 0 元。 5. 完成找零，方案为 ‧ 子问题的解无须合并：二分查找旨在查找一个特定元素，因此不需要将子问题的解进行合并。当子问题得到解决时，原问题也会同时得到解决。分治能够提升搜索效率，本质上是因为暴力搜索每轮只能排除一个选项，而分治搜索每轮可以排除一半选项。 1. 基于分治实现二分查找在之前的章节中，二分查找是基于递推（迭代）实现的。现在我们基于分治（递归）来实现它。第 12 章分治 hello‑algo Miniconda3 ，需要 Python 3.10 或更新版本。 2. 在 VS Code 的插件市场中搜索 python ，安装 Python Extension Pack 。 3.（可选）在命令行输入 pip install black ，安装代码格式化工具。 2. C/C++ 环境 1. Windows 系统需要安装 MinGW（配置教程）；MacOS 自带 Clang ，无须安装。

0 码力 | 378 页 | 17.59 MB | 1 年前
3

共 16 条前往

页

C++高性性能高性能并行编程优化课件 11 16 01 15 08 现代教程高速上手 14 17 20 Hello 算法 1.0 0b4 1.1 0b5

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

现代C++ 教程：高速上手C++11/14/17/20

Hello 算法 1.0.0b4 C++版

Hello 算法 1.1.0 C++ 版

Hello 算法 1.0.0b5 C++版

Hello 算法 1.0.0 C++版