文本格式符号 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

数据删除 ] 嘛。有符号整数 vs 无符号整数 • 有时候我们是需要表示负数的。而刚刚那种二进制的做法，只能表示正数和零。 • 怎么办？可能有的同学会想，不妨这样来设计：让二进制的最高位表示符号位。 • 比如 00000011 表示 3 ， 10000011 表示 -3 ，这样不就区分开来了吗？这叫做原码表示法。 • 的确可以，这种表示方式牺牲了一位作为符号位，剩下 7 位继续表示值。位继续表示值。 • 这样的设计下无符号可以表示 0 到 255 ，而有符号可以表示 -127 到 127 。 • 但是有一个问题，那 00000000 就表示 0 ， 10000000 就表示 -0 ，而 0 有没有负号其实无所谓， 0 和 -0 根本是同一个数，却有着不同的表示，这显然不对吧？ • 因此，可以如 10000000 实际上表示 -1 ， 11111111 则表示 -128 ，让负数部分整体“平 -0 这种奇怪的东西了，而且表示范围也扩大了一位，虽然是扩大在负数部分。有符号整数 vs 无符号整数 • 刚刚说的让 10000000 表示 -1 ， 11111111 表示 -128 的方法就叫做反码表示法。 • 但是这样还有一个问题，那就是硬件电路上，需要完全重新设计，对符号位做一些特殊判断，才能支持有符号整数的加减法，因此如今的计算机都采用了一种更聪明的表示法： • 他们让 11111111

0 码力 | 128 页 | 2.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

org/wiki/ASCII 计算机如何表达字符 • 众所周知，计算机只能处理二进制整数，字符要怎么办呢？ • 于是就有了 ASCII 码表，他规定，每个英文字符（包括大小写字母、数字、特殊符号）都对应着一个整数。在计算机里只要存储这个的整数，就能代表这个字符了。 • 例如 32 代表空格， 48 代表 ‘ 0’ ， 65 代表 ‘ A’ ， 97 代表 ‘ a’…… • 32~126 char 是无符号 8 位整数， signed char 是有符号 8 位整数，而 char 类型只需是 8 位整数即可，可以是有符号也可以是无符号，任凭编译器决定（ C 标准委员会传统异能， khronos 直呼内行）。 • 以 GCC 为例，他规定 char 在 x86 架构是有符号的 (char = signed char) ，而在 arm 架构上则认为是无符号的 (char = = unsigned char) ，因为他认为“ arm 的指令集处理无符号 8 位整数更高效”，所以擅自把 char 魔改成无符号的…… • 顺便一提， C++ 标准保证 char ， signed char ， unsigned char 是三个完全不同的类型， std::is_same_v 分别判断他们总会得到 false ，无论 x86 还是 arm 。 • 但是奇葩的 C 语言却规定

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 性能优化之无分支编程 Branchless Programming

含义英文全称 le 小于等于（有符号） less or equal ge 大于等于（有符号） greater or equal l 小于（有符号） less g 大于（有符号） greater be 小于等于（无符号） below or equal ae 大于等于（无符号） above or equal b 小于（无符号） below a 大于（无符号） above e 等于 equal

0 码力 | 47 页 | 8.45 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

如果 b 是常数且为 2 的幂次方，编译器会检测到，并替换为更高效的位运算，反而减少了计算量。 • 此外如果 b 一定是 2 的幂次方，那么 (unsigned)a % b 也可以（先转换成无符号的取模）。高效的解决：位运算 & • 如果 b 是 2 的幂次方，即： 2, 4, 8, 16, 32 等。 • 则： a % b = a & (b - 1) • 比如 a % 8 可以改成 Python 一样的始终向下取整除法。 >> 2 = unsigned 类型的位运算 >> 不一样而 unsigned 类型的 >> n 会不会复制最高位，只是单纯的位移，这会导致负数的符号位单独被位移，补码失效，造成结果不对。 unsigned 类型的 >> 会生成 shr 指令， signed 类型的 >> 会生成 sar 指令。我们需要负方向无限延伸的稀疏数据结果，那就只 pointer(11).dense(8) 开源的体素处理库： OpenVDB • OpenVDB 的稀疏体积，可以存储符号距离场 (SDF) ，也可以存储烟雾仿真的结果等。 • 据张心欣说， OpenVDB 赢得了奥斯卡奖。 • 因为他经常用在影视特效中，主要是符号距离场有时比 mesh 处理起来方便很多。 OpenVDB 的设计：如果用 SNode 来表示 • hash()

0 码力 | 102 页 | 9.50 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

namsepace ），避免符号冲突 • 在声明和定义外面都套一层名字空间，例如此处我的子项目名是 biology ，那我就 biology::Animal 。避免暴露全局的 Animal 。这是因为万一有个“不拘一格”的第三方库也暴露个全局的 Animal ，两个符号就会发生冲突，由于类符号都具有 weak 属性，链接器会随机选择一个覆盖掉，非常危险！ • （关于符号的 weak 属性，以后单独开一门

0 码力 | 56 页 | 6.87 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

MinSizeRel 最小体积发布，生成的文件比 Release 更小，不完全优化，减少二进制体积 • RelWithDebInfo 带调试信息发布，生成的文件比 Release 更大，因为带有调试的符号信息 • 默认情况下 CMAKE_BUILD_TYPE 为空字符串，这时相当于 Debug 。各种构建模式在编译器选项上的区别 • 在 Release 模式下，追求的是程序的最佳性能表现，在此情况下，编译器会对程序做最大 (OBJECT) 替代静态库 (STATIC) 避免跨平台的麻烦。对象库仅仅作为组织代码的方式，而实际生成的可执行文件只有一个，减轻了部署的困难。静态库的麻烦： GCC 编译器自作聪明，会自动剔除没有引用符号的那些对象对象库可以绕开编译器的不统一：保证不会自动剔除没引用到的对象文件虽然动态库也可以避免剔除没引用的对象文件，但引入了运行时链接的麻烦 add_library 无参数时，是静态库还是动态库 Windows 喜欢搞特殊。 cd /d C:\\Program\ Files\ \(x86\)\\Microsoft\ Visual\ Studio\\2019\\ 怎么路径里动不动夹杂几个转移符、空格、特殊符号？这谁顶得住啊。高情商： Windows 是最适合练习你 C 语言转移符使用水平的地方。更通用的方式： find_package 更好的做法是用 CMake 的 find_package

0 码力 | 166 页 | 6.54 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

*(int *)(rdi + rsi * 4) size_t 在 64 位系统上相当于 uint64_t size_t 在 32 位系统上相当于 uint32_t 从而不需要用 movslq 从 32 位符号扩展到 64 位，更高效。而且也能处理数组大小超过 INT_MAX 的情况，推荐始终用 size_t 表示数组大小和索引。浮点作为参数和返回： xmm 系列寄存器 xmm0 = xmm0 章：内联调用外部函数： call 指令 @PLT 是 Procedure Linkage Table 的缩写，即函数链接表。链接器会查找其他 .o 文件中是否定义了 _Z5otheri 这个符号，如果定义了则把这个 @PLT 替换为他的地址。对 PLT 感兴趣？看 https://www.cnblogs.com/pannengzhi/p/2018-04-09-about-got-plt

0 码力 | 108 页 | 9.47 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

global ； global 可以调用 device ； device 可以调用 device 。声明为内联函数 • 注意， inline 在现代 C++ 中的效果是声明一个函数为 weak 符号，和性能优化意义上的内联无关。 • 优化意义上的内联指把函数体直接放到调用者那里去。 • 因此 CUDA 编译器提供了一个“私货”关键字： __inline__ 来声明一个函数为内联。不论是 + threadIdx 三维的板块和线程编号 • CUDA 也支持三维的板块和线程区间。 • 只要在三重尖括号内指定的参数改成 dim3 类型即可。 dim3 的构造函数就是接受三个无符号整数（ unsigned int ）非常简单。 • dim3(x, y, z) • 这样在核函数里就可以通过 threadIdx.y 获取 y 方向的线程编号，以此类推。那二维呢？

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

里面就可以仅通过函数名从 functab 访问到他们，从而 catFunc 和 dogFunc 甚至不需要在头文件里声明（只需要他们的函数签名一样即可放入 function 容器）。静态初始化的顺序是符号定义的顺序决定的，若在不同文件则顺序可能打乱 • 你可能已经兴冲冲地把 dogFunc 和 catFunc 挪到另一个文件，然后把 functab 声明为 extern std::map<

0 码力 | 54 页 | 3.94 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

单文件编译虽然方便，但也有如下缺点： 1. 所有的代码都堆在一起，不利于模块化和理解。 2. 工程变大时，编译时间变得很长，改动一个地方就得全部重新编译。 • 因此，我们提出多文件编译的概念，文件之间通过符号声明相互引用。 • > g++ -c hello.cpp -o hello.o • > g++ -c main.cpp -o main.o • 其中使用 -c 选项指定生成临时的对象文件 main

0 码力 | 32 页 | 11.40 MB | 1 年前
3

共 12 条前往

页

C++高性性能高性能并行编程优化课件 12 15 10 16 11 04 08 01

分类

语言

格式