# 第二章 语言可用性的强化 > 内容修订中 ## 一、本节内容 本节内容包括: - 语言可用性的强化 + `nullptr` 与 `constexpr` + 类型推导 + `auto` + `decltype` + 尾返回类型、`auto` 与 `decltype` 配合 + 区间迭代 + 基于范围的 for 循环 + 初始化列表 + `std::initializer_list` + 统一初始化语法 + 模板增强 + 外部模板 + 尖括号 `>` + 类型别名模板 + 变长参数模板 + 面向对象增强 + 委托构造 + 继承构造 + 显式虚函数重载 + `override` + `final` + 显式禁用默认函数 + 强类型枚举 + 总结 ## 二、nullptr 与 constexpr ### nullptr `nullptr` 出现的目的是为了替代 `NULL`。在某种意义上来说,传统 C++ 会把 `NULL`、`0` 视为同一种东西,这取决于编译器如何定义 NULL,有些编译器会将 NULL 定义为 `((void*)0)`,有些则会直接将其定义为 `0`。 C++ 不允许直接将 `void *` 隐式转换到其他类型,但如果 `NULL` 被定义为 `((void*)0)`,那么当编译 ```cpp char *ch = NULL; ``` 时,`NULL` 只好被定义为 `0`。而这依然会产生问题,将导致了 `C++` 中重载特性会发生混乱,考虑: ```cpp void foo(char *); void foo(int); ``` 对于这两个函数来说,如果 `NULL` 又被定义为了 `0` 那么 `foo(NULL);` 这个语句将会去调用 `foo(int)`,从而导致代码违反直观。 为了解决这个问题,C++11 引入了 `nullptr` 关键字,专门用来区分空指针、0。`nullptr` 的类型为 `nullptr_t`,能够隐式的转换为任何指针或成员指针的类型,也能和他们进行相等或者不等的比较。 你可以尝试使用 gcc 和 g++ 两个编译器同时编译下面的代码: ```cpp #include void foo(char *); void foo(int); int main() { if(NULL == (void *)0) std::cout << "NULL == 0" << std::endl; else std::cout << "NULL != 0" << std::endl; foo(0); // foo(NULL); // 编译无法通过 foo(nullptr); return 0; } void foo(char *ch) { std::cout << "call foo(char*)" << std::endl; } void foo(int i) { std::cout << "call foo(int)" << std::endl; } ``` 将输出: ```bash NULL == 0 call foo(int) call foo(char*) ``` 所以,当需要使用 `NULL` 时候,请养成直接使用 `nullptr`的习惯。 ### constexpr C++ 本身已经具备了常数表达式的概念,比如 1+2, 3*4 这种表达式总是会产生相同的结果并且没有任何副作用。如果编译器能够在编译时就把这些表达式直接优化并植入到程序运行时,将能增加程序的性能。一个非常显著的例子就是在数组的定义阶段: ```cpp #define LEN 10 int len_foo() { return 5; } int main() { char arr_1[10]; char arr_2[LEN]; int len = 5; char arr_3[len]; // 非法 const int len_2 = 10; char arr_4[len_2]; // 合法 char arr_5[len_foo()+5]; // 非法 return 0; } ``` 在 C++11 之前,可以在常量表达式中使用的变量必须被声明为 `const`,在上面代码中,`len_2` 被定义成了常量,因此 `len_2` 是一个常量表达式,所以能够合法的分配一个数组; 而对于 `arr_5` 来说,C++98 之前的编译器无法得知 `len_foo()` 在运行期实际上是返回一个常数,这也就导致了非法的产生。 C++11 提供了 `constexpr` 让用户显式的声明函数或对象构造函数在编译器会成为常数,这个关键字明确的告诉编译器应该去验证 `len_foo` 在编译器就应该是一个常数。 此外,`constexpr` 的函数可以使用递归: ```cpp constexpr int fibonacci(const int n) { return n == 1 || n == 2 ? 1 : fibonacci(n-1)+fibonacci(n-2); } ``` 从 C++14 开始,constexptr 函数可以在内部使用局部变量、循环和分支等简单语句,例如下面的代码在 C++11 的标准下是不能够通过编译的: ```cpp constexpr int fibonacci(const int n) { if(n == 1) return 1; if(n == 2) return 1; return fibonacci(n-1)+fibonacci(n-2); } ``` ## 三、类型推导 在传统 C 和 C++中,参数的类型都必须明确定义,这其实对我们快速进行编码没有任何帮助,尤其是当我们面对一大堆复杂的模板类型时,必须明确的指出变量的类型才能进行后续的编码,这不仅拖慢我们的开发效率,也让代码变得又臭又长。 C++11 引入了 `auto` 和 `decltype` 这两个关键字实现了类型推导,让编译器来操心变量的类型。这使得 C++ 也具有了和其他现代编程语言一样,某种意义上提供了无需操心变量类型的使用习惯。 ### auto `auto` 在很早以前就已经进入了 C++,但是他始终作为一个存储类型的指示符存在,与 `register` 并存。在传统 C++ 中,如果一个变量没有声明为 `register` 变量,将自动被视为一个 `auto` 变量。而随着 `register` 被弃用,对 `auto` 的语义变更也就非常自然了。 使用 `auto` 进行类型推导的一个最为常见而且显著的例子就是迭代器。在以前我们需要这样来书写一个迭代器: ```cpp for(vector::const_iterator itr = vec.cbegin(); itr != vec.cend(); ++itr) ``` 而有了 `auto` 之后可以: ```cpp // 由于 cbegin() 将返回 vector::const_iterator // 所以 itr 也应该是 vector::const_iterator 类型 for(auto itr = vec.cbegin(); itr != vec.cend(); ++itr); ``` 一些其他的常见用法: ```cpp auto i = 5; // i 被推导为 int auto arr = new auto(10) // arr 被推导为 int * ``` > **注意**:`auto` 不能用于函数传参,因此下面的做法是无法通过编译的(考虑重载的问题,我们应该使用模板): ```cpp int add(auto x, auto y); ``` > 此外,`auto` 还不能用于推导数组类型: ```cpp #include int main() { auto i = 5; int arr[10] = {0}; auto auto_arr = arr; auto auto_arr2[10] = arr; return 0; } ``` ### decltype `decltype` 关键字是为了解决 auto 关键字只能对变量进行类型推导的缺陷而出现的。它的用法和 `sizeof` 很相似: ```cpp decltype(表达式) ``` 有时候,我们可能需要计算某个表达式的类型,例如: ```cpp auto x = 1; auto y = 2; decltype(x+y) z; ``` ### 尾返回类型、auto 与 decltype 配合 你可能会思考,`auto` 能不能用于推导函数的返回类型。考虑这样一个例子加法函数的例子,在传统 C++ 中我们必须这么写: ```cpp template R add(T x, U y) { return x+y } ``` > typename 和 class 在模板中没有区别,在 typename 这个关键字出现之前,都是使用 class 来定义模板参数的 这样的代码其实变得很丑陋,因为程序员在使用这个模板函数的时候,必须明确指出返回类型。但事实上我们并不知道 `add()` 这个函数会做什么样的操作,获得一个什么样的返回类型。 在 C++11 中这个问题得到解决。虽然你可能马上会反应出来使用 `decltype` 推导 `x+y` 的类型,写出这样的代码: ```cpp decltype(x+y) add(T x, U y) ``` 但事实上这样的写法并不能通过编译。这是因为在编译器读到 decltype(x+y) 时,`x` 和 `y` 尚未被定义。为了解决这个问题,C++11 还引入了一个叫做尾返回类型(trailing return type),利用 auto 关键字将返回类型后置: ```cpp template auto add(T x, U y) -> decltype(x+y) { return x+y; } ``` 令人欣慰的是从 C++14 开始是可以直接让普通函数具备返回值推导,因此下面的写法变得合法: ```cpp template auto add(T x, U y) { return x+y } ``` ## 四、区间迭代 ### 基于范围的 for 循环 终于,C++11 引入了基于范围的迭代写法,我们拥有了能够写出像 Python 一样简洁的循环语句: ```cpp int array[] = {1,2,3,4,5}; for(auto &x : array) { std::cout << x << std::endl; } ``` 最常用的 `std::vector` 遍历将从原来的样子: ```cpp std::vector arr(5, 100); for(std::vector::iterator i = arr.begin(); i != arr.end(); ++i) { std::cout << *i << std::endl; } ``` 变得非常的简单: ```cpp // & 启用了引用, 如果没有则对 arr 中的元素只能读取不能修改 for(auto &i : arr) { std::cout << i << std::endl; } ``` ## 五、初始化列表 初始化是一个非常重要的语言特性,最常见的就是对对象进行初始化。在传统 C++ 中,不同的对象有着不同的初始化方法,例如普通数组、POD (plain old data,没有构造、析构和虚函数的类或结构体)类型都可以使用 `{}` 进行初始化,也就是我们所说的初始化列表。而对于类对象的初始化,要么需要通过拷贝构造、要么就需要使用 `()` 进行。这些不同方法都针对各自对象,不能通用。 ```cpp int arr[3] = {1,2,3}; // 列表初始化 class Foo { private: int value; public: Foo(int) {} }; Foo foo(1); // 普通构造初始化 ``` 为了解决这个问题,C++11 首先把初始化列表的概念绑定到了类型上,并将其称之为 `std::initializer_list`,允许构造函数或其他函数像参数一样使用初始化列表,这就为类对象的初始化与普通数组和 POD 的初始化方法提供了统一的桥梁,例如: ```cpp #include class Magic { public: Magic(std::initializer_list list); }; Magic magic = {1,2,3,4,5}; std::vector v = {1, 2, 3, 4}; ``` 这种构造函数被叫做初始化列表构造函数,具有这种构造函数的类型将在初始化时被特殊关照。 初始化列表除了用在对象构造上,还能将其作为普通函数的形参,例如: ``` void foo(std::initializer_list list); foo({1,2,3}); ``` 其次,C++11 提供了统一的语法来初始化任意的对象,例如: ```cpp struct A { int a; float b; }; struct B { B(int _a, float _b): a(_a), b(_b) {} private: int a; float b; }; A a {1, 1.1}; // 统一的初始化语法 B b {2, 2.2}; ``` ## 六、模板增强 ### 外部模板 传统 C++ 中,模板只有在使用时才会被编译器实例化。换句话说,只要在每个编译单元(文件)中编译的代码中遇到了被完整定义的模板,都会实例化。这就产生了重复实例化而导致的编译时间的增加。并且,我们没有办法通知编译器不要出发模板实例化。 C++11 引入了外部模板,扩充了原来的强制编译器在特定位置实例化模板的语法,使得能够显式的告诉编译器何时进行模板的实例化: ```cpp template class std::vector; // 强行实例化 extern template class std::vector; // 不在该编译文件中实例化模板 ``` ### 尖括号 ">" 在传统 C++ 的编译器中,`>>`一律被当做右移运算符来进行处理。但实际上我们很容易就写出了嵌套模板的代码: ```cpp std::vector> mtx; ``` 这在传统C++编译器下是不能够被编译的,而 C++11 开始,连续的右尖括号将变得合法,并且能够顺利通过编译。甚至于下下面这种写法都能够通过编译: ```cpp template SuckType; std::vector2)>> v; // 合法, 但不建议写出这样的代码 ``` ### 类型别名模板 在了解类型别名模板之前,需要理解『模板』和『类型』之间的不同。仔细体会这句话:**模板是用来产生类型的。**在传统 C++中,`typedef` 可以为类型定义一个新的名称,但是却没有办法为模板定义一个新的名称。因为,模板不是类型。例如: ```cpp template class SuckType; typedef SuckType NewType; // 不合法 ``` C++11 使用 `using` 引入了下面这种形式的写法,并且同时支持对传统 `typedef` 相同的功效: > 通常我们使用 `typedef` 定义别名的语法是:`typedef 原名称 新名称;`,但是对函数指针等别名的定义语法却不相同,这通常给直接阅读造成了一定程度的困难。 ```cpp typedef int (*process)(void *); // 定义了一个返回类型为 int,参数为 void* 的函数指针类型,名字叫做 process using process = int(*)(void *); // 同上, 更加直观 using NewType = SuckType; ``` ### 默认模板参数 我们可能定义了一个加法函数: ```cpp template auto add(T x, U y) -> decltype(x+y) { return x+y } ``` 但在使用时发现,要使用 add,就必须每次都指定其模板参数的类型。 在 C++11 中提供了一种便利,可以指定模板的默认参数: ```cpp template auto add(T x, U y) -> decltype(x+y) { return x+y } ``` ### 变长参数模板 模板一直是 C++ 所独有的黑魔法(一起念:**Dark Magic**)之一。在 C++11 之前,无论是类模板还是函数模板,都只能按其指定的样子,接受一组固定数量的模板参数;而 C++11 加入了新的表示方法,允许任意个数、任意类别的模板参数,同时也不需要再定义时将参数的个数固定。 ```cpp template class Magic; ``` 模板类 Magic 的对象,能够接受不受限制个数的 typename 作为模板的形式参数,例如下面的定义: ```cpp class Magic, std::map>> darkMagic; ``` 既然是任意形式,所以个数为0的模板参数也是可以的:`class Magic<> nothing;`。 如果不希望产生的模板参数个数为0,可以手动的定义至少一个模板参数: ```cpp template class Magic; ``` 变长参数模板也能被直接调整到到模板函数上。传统 C 中的 printf 函数,虽然也能达成不定个数的形参的调用,但其并非类别安全。而 C++11 除了能定义类别安全的变长参数函数外,还可以使类似 printf 的函数能自然地处理非自带类别的对象。除了在模板参数中能使用 `...` 表示不定长模板参数外,函数参数也使用同样的表示法代表不定长参数,这也就为我们简单编写变长参数函数提供了便捷的手段,例如: ```cpp template void printf(const std::string &str, Args... args); ``` 那么我们定义了变长的模板参数,如何对参数进行解包呢? 首先,我们可以使用 `sizeof...` 来计算参数的个数,: ```cpp template void magic(Args... args) { std::cout << sizeof...(args) << std::endl; } ``` 我们可以传递任意个参数给 `magic` 函数: ```cpp magic(); // 输出0 magic(1); // 输出1 magic(1, ""); // 输出2 ``` 其次,对参数进行解包,到目前为止还没有一种简单的方法能够处理参数包,但有两种经典的处理手法: **1. 递归模板函数** 递归是非常容易想到的一种手段,也是最经典的处理方法。这种方法不断递归地向函数传递模板参数,进而达到递归遍历所有模板参数的目的: ```cpp #include template void printf(T value) { std::cout << value << std::endl; } template void printf(T value, Args... args) { std::cout << value << std::endl; printf(args...); } int main() { printf(1, 2, "123", 1.1); return 0; } ``` **2. 初始化列表展开** > 这个方法需要之后介绍的知识,读者可以简单阅读以下,将这个代码段保存,在后面的内容了解过了之后再回过头来阅读此处方法会大有收获。 递归模板函数是一种标准的做法,但缺点显而易见的在于必须定义一个终止递归的函数。 这里介绍一种使用初始化列表展开的黑魔法: ```cpp // 编译这个代码需要开启 -std=c++14 template auto print(T value, Args... args) { std::cout << value << std::endl; return std::initializer_list{([&] { std::cout << args << std::endl; }(), value)...}; } int main() { print(1, 2.1, "123"); return 0; } ``` 在这个代码中,额外使用了 C++11 中提供的初始化列表以及 Lambda 表达式的特性(下一节中将提到),而 std::initializer_list 也是 C++11 新引入的容器(以后会介绍到)。 通过初始化列表,`(lambda 表达式, value)...` 将会被展开。由于逗号表达式的出现,首先会执行前面的 lambda 表达式,完成参数的输出。唯一不美观的地方在于如果不使用 `return` 编译器会给出未使用的变量作为警告。 > 事实上,有时候我们虽然使用了变参模板,却不一定需要对参数做逐个遍历,我们可以利用 `std::bind` 及完美转发等特性实现对函数和参数的绑定,从而达到成功调用的目的。 > 关于这方面的使用技巧,可以通过项目课:[100 行 C++ 代码实现线程池](https://www.shiyanlou.com/teacher/courses/565) 进行进一步巩固学习。 ## 七、面向对象增强 ### 委托构造 C++11 引入了委托构造的概念,这使得构造函数可以在同一个类中一个构造函数调用另一个构造函数,从而达到简化代码的目的: ```cpp class Base { public: int value1; int value2; Base() { value1 = 1; } Base(int value) : Base() { // 委托 Base() 构造函数 value2 = 2; } }; int main() { Base b(2); std::cout << b.value1 << std::endl; std::cout << b.value2 << std::endl; } ``` ### 继承构造 在传统 C++ 中,构造函数如果需要继承是需要将参数一一传递的,这将导致效率低下。C++11 利用关键字 using 引入了继承构造函数的概念: ```cpp class Base { public: int value1; int value2; Base() { value1 = 1; } Base(int value) : Base() { // 委托 Base() 构造函数 value2 = 2; } }; class Subclass : public Base { public: using Base::Base; // 继承构造 }; int main() { Subclass s(3); std::cout << s.value1 << std::endl; std::cout << s.value2 << std::endl; } ``` ### 显式虚函数重载 在传统 C++中,经常容易发生意外重载虚函数的事情。例如: ```cpp struct Base { virtual void foo(); }; struct SubClass: Base { void foo(); }; ``` `SubClass::foo` 可能并不是程序员尝试重载虚函数,只是恰好加入了一个具有相同名字的函数。另一个可能的情形是,当基类的虚函数被删除后,子类拥有旧的函数就不再重载该虚拟函数并摇身一变成为了一个普通的类方法,这将造成灾难性的后果。 C++11 引入了 `override` 和 `final` 这两个关键字来防止上述情形的发生。 #### override 当重载虚函数时,引入 `override` 关键字将显式的告知编译器进行重载,编译器将检查基函数是否存在这样的虚函数,否则将无法通过编译: ```cpp struct Base { virtual void foo(int); }; struct SubClass: Base { virtual void foo(int) override; // 合法 virtual void foo(float) override; // 非法, 父类没有此虚函数 }; ``` #### final `final` 则是为了防止类被继续继承以及终止虚函数继续重载引入的。 ```cpp struct Base { virtual void foo() final; }; struct SubClass1 final: Base { }; // 合法 struct SubClass2 : SubClass1 { }; // 非法, SubClass1 已 final struct SubClass3: Base { void foo(); // 非法, foo 已 final }; ``` ### 显式禁用默认函数 在传统 C++ 中,如果程序员没有提供,编译器会默认为对象生成默认构造函数、复制构造、赋值算符以及析构函数。另外,C++ 也为所有类定义了诸如 `new` `delete` 这样的运算符。当程序员有需要时,可以重载这部分函数。 这就引发了一些需求:无法精确控制默认函数的生成行为。例如禁止类的拷贝时,必须将赋值构造函数与赋值算符声明为 `private`。尝试使用这些未定义的函数将导致编译或链接错误,则是一种非常不优雅的方式。 并且,编译器产生的默认构造函数与用户定义的构造函数无法同时存在。若用户定义了任何构造函数,编译器将不再生成默认构造函数,但有时候我们却希望同时拥有这两种构造函数,这就造成了尴尬。 C++11 提供了上述需求的解决方案,允许显式的声明采用或拒绝编译器自带的函数。例如: ```cpp class Magic { public: Magic() = default; // 显式声明使用编译器生成的构造 Magic& operator=(const Magic&) = delete; // 显式声明拒绝编译器生成构造 Magic(int magic_number); } ``` ## 八、强类型枚举 在传统 C++中,枚举类型并非类型安全,枚举类型会被视作整数,则会让两种完全不同的枚举类型可以进行直接的比较(虽然编译器给出了检查,但并非所有),**甚至枚举类型的枚举值名字不能相同**,这不是我们希望看到的结果。 C++11 引入了枚举类(enumaration class),并使用 `enum class` 的语法进行声明: ```cpp enum class new_enum : unsigned int { value1, value2, value3 = 100, value4 = 100 }; ``` 这样定义的枚举实现了类型安全,首先他不能够被隐式的转换为整数,同时也不能够将其与整数数字进行比较,更不可能对不同的枚举类型的枚举值进行比较。但相同枚举值之间如果指定的值相同,那么可以进行比较: ```cpp if (new_enum::value3 == new_enum::value4) { // 会输出 std::cout << "new_enum::value3 == new_enum::value4" << std::endl; } ``` 在这个语法中,枚举类型后面使用了冒号及类型关键字来指定枚举中枚举值的类型,这使得我们能够为枚举赋值(未指定时将默认使用 int)。 而我们希望获得枚举值的值时,将必须显式的进行类型转换,不过我们可以通过重载 `<<` 这个算符来进行输出,可以收藏下面这个代码段: ```cpp #include template std::ostream& operator<<(typename std::enable_if::value, std::ostream>::type& stream, const T& e) { return stream << static_cast::type>(e); } ``` 这时,下面的代码将能够被编译: ```cpp std::cout << new_enum::value3 << std::endl ``` ## 总结 本节介绍了 C++11/14 中对语言可用性的增强,其中笔者认为最为重要的几个特性是几乎所有人都需要了解并熟练使用的: 1. auto 类型推导 2. 范围 for 迭代 3. 初始化列表 4. 变参模板 ## 进一步阅读的参考资料 1. 深入理解 C++11: C++11 新特性解析与应用. Michael Wong, IBM XL 编译器中国开发团队著 2. 深入应用 C++11: 代码优化与工程级应用. 祁宇著 ## 许可 知识共享许可协议 本教程由[欧长坤](https://github.com/changkun)撰写,采用[知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议](http://creativecommons.org/licenses/by-nc-nd/4.0/)许可。项目中代码使用 MIT 协议开源,参见[许可](../LICENSE)。