C++手稿：静态和全局变量的作用域

09/30 2015

全局变量和静态变量的存储方式是一样的，只是作用域不同。如果它们未初始化或初始化为0则会存储在BSS段，如果初始化为非0值则会存储在DATA段，见进程的地址空间分配一文。静态变量的作用域是当前源文件，全局变量的作用域是整个可执行程序。值得注意的是：

如果在头文件定义全局变量，在预编译期间#include的头文件会被拷贝进源文件中，编译器是不知道头文件的。
虽然全局变量是全局作用域，但需要extern关键字来声明以通过编译。因为C++是强类型语言，编译时需要根据变量声明做类型检查。

全局变量的引用

C++源文件中引用外部定义的全局变量和引用外部函数是一样的语法，通过extern来声明：

// file: a.cpp
#include<iostream>
extern int a;
int main() {
    std::cout<<b<<std::endl;
    return 0;
}

// file: b.cpp
#include<iostream>
int a = 2;

然后分别编译这两个文件，链接生成a.out并执行它：

$ g++ a.cpp b.cpp
$ ./a.out
b.cpp
2

extern只是在当前文件中声明有这样一个外部变量而已，并不指定它来自哪个外部文件。所以即使extern变量名错误当前源文件也能通过编译，但链接会出错。

头文件中定义

因为头文件可能会被多次引用，在预编译时被引用的头文件会被直接拷贝到源文件中再进行编译。一个常见的错误便是把变量定义放在头文件中，例如下面的变量int a：

// file: a.cpp
#include <iostream>
#include "b.h"
int main() {
    std::cout<<a<<std::endl;
    return 0;
}

// file: b.cpp
#include<iostream>
#include"b.h"
void f(){}

// file: b.h
int a = 2;

头文件b.h中定义了int a，它被a.cpp和b.cpp同时引入。我们将a.cpp和b.cpp分别编译是没有问题的，然后链接时会抛出错误：

duplicate symbol _a in:
    /tmp/ccqpfU5e.o
    /tmp/ccCRi9nO.o
ld: 1 duplicate symbol for architecture x86_64
collect2: error: ld returned 1 exit status

两个.o文件中的_a名称发生了冗余，这是变量重定义错误。

头文件中声明

因为声明操作是幂等的，而多次定义会引发重定义错误。所以 头文件中不应包含任何形式的定义，只应该包含声明，正确的办法是变量定义总是在源文件中进行，而声明放在头文件中：

#include <iostream>
#include "b.h"
int main() {
    std::cout<<a<<std::endl;
    return 0;
}

// file: b.cpp
#include<iostream>
#include"b.h"
int a = 2;

// file: b.h
extern a;

然后编译链接执行都会通过，输出2：

$ g++ a.cpp b.cpp
$ ./a.out
2

编译器看到g++ a.cpp b.cpp时会自动去查找b.h并进行预编译操作，因此不需要显式指定b.h。

静态全局变量

非静态全局变量是外部可链接的（external linkage），目标文件中会为它生产一个名称供链接器使用；而静态全局变量是内部可链接的（internal linkage），目标文件中没有为链接器提供名称。因此无法链接到其他文件中，因此静态变量的作用域在当前源文件（目标文件）。虽然静态和非静态全局变量可能存储在同一内存块，但它们的作用域是不同的。来看例子：

// file: a.cpp
#include <iostream>
extern int a;
int main() {
    std::cout<<a<<std::endl;
    return 0;
}

// file: b.cpp
static int a = 2;

然后g++ a.cpp b.cpp时发生链接错：

Undefined symbols for architecture x86_64:
  "_a", referenced from:
      _main in ccPLYjyx.o
ld: symbol(s) not found for architecture x86_64
collect2: error: ld returned 1 exit status

链接时未找到名称_a，因此静态变量在编译得到的目标文件中没有为链接器提供名称。所以其他目标文件无法访问该变量，静态全局变量的作用域是当前源文件（或目标文件）。

全局变量初始化

全局变量比较特殊，初始化有两种方式：

静态初始化（static initialization）：对于定义时给出初始化参数的全局变量，其初始化在程序加载时完成。根据是否被初始化、是否被初始化为0会把它存储在BSS或者DATA段中，参见进程的地址空间分配。
动态初始化（dynamic initialization）：定义变量时可以不给出初始化参数，而是在某个函数中进行全局变量初始化。

对于静态初始化，看这个例子：

class C{
public:
    C(){ std::cout<<"init "; }
};
C c;
int main() { std::cout<<"main"; return 0; }

在main()进入之前，程序加载时动态初始化，程序输出为一行init main。

关于全局变量的初始化顺序，同一源文件中的全局变量初始化顺序按照定义顺序，不同源文件（编译单元）的全局变量初始化顺序并未规定。因此软件设计时不要依赖于其他编译单元的静态变量，可以通过单例模式来避免这一点。

本文采用知识共享署名 4.0 国际许可协议（CC-BY 4.0）进行许可，转载注明来源即可： https://harttle.land/2015/09/30/cpp-static-and-global.html。如有疏漏、谬误、侵权请通过评论或邮件指出。