全局变量和静态变量的存储方式是一样的,只是作用域不同。如果它们未初始化或初始化为0则会存储在BSS段,如果初始化为非0值则会存储在DATA段,见进程的地址空间分配一文。 静态变量的作用域是当前源文件,全局变量的作用域是整个可执行程序。 值得注意的是:

  • 如果在头文件定义全局变量,在预编译期间#include的头文件会被拷贝进源文件中,编译器是不知道头文件的。
  • 虽然全局变量是全局作用域,但需要extern关键字来声明以通过编译。因为C++是强类型语言,编译时需要根据变量声明做类型检查。

全局变量的引用

C++源文件中引用外部定义的全局变量和引用外部函数是一样的语法,通过extern来声明:

// file: a.cpp
#include<iostream>
extern int a;
int main() {
    std::cout<<b<<std::endl;
    return 0;
}

// file: b.cpp
#include<iostream>
int a = 2;

然后分别编译这两个文件,链接生成a.out并执行它:

$ g++ a.cpp b.cpp
$ ./a.out
b.cpp
2

extern只是在当前文件中声明有这样一个外部变量而已,并不指定它来自哪个外部文件。所以即使extern变量名错误当前源文件也能通过编译,但链接会出错。

头文件中定义

因为头文件可能会被多次引用,在预编译时被引用的头文件会被直接拷贝到源文件中再进行编译。一个常见的错误便是把变量定义放在头文件中,例如下面的变量int a

// file: a.cpp
#include <iostream>
#include "b.h"
int main() {
    std::cout<<a<<std::endl;
    return 0;
}

// file: b.cpp
#include<iostream>
#include"b.h"
void f(){}

// file: b.h
int a = 2;

头文件b.h中定义了int a,它被a.cppb.cpp同时引入。我们将a.cppb.cpp分别编译是没有问题的,然后链接时会抛出错误:

duplicate symbol _a in:
    /tmp/ccqpfU5e.o
    /tmp/ccCRi9nO.o
ld: 1 duplicate symbol for architecture x86_64
collect2: error: ld returned 1 exit status

两个.o文件中的_a名称发生了冗余,这是变量重定义错误。

头文件中声明

因为声明操作是幂等的,而多次定义会引发重定义错误。所以 头文件中不应包含任何形式的定义,只应该包含声明, 正确的办法是变量定义总是在源文件中进行,而声明放在头文件中:

#include <iostream>
#include "b.h"
int main() {
    std::cout<<a<<std::endl;
    return 0;
}

// file: b.cpp
#include<iostream>
#include"b.h"
int a = 2;

// file: b.h
extern a;

然后编译链接执行都会通过,输出2

$ g++ a.cpp b.cpp
$ ./a.out
2

编译器看到g++ a.cpp b.cpp时会自动去查找b.h并进行预编译操作,因此不需要显式指定b.h

静态全局变量

非静态全局变量是外部可链接的(external linkage),目标文件中会为它生产一个名称供链接器使用; 而静态全局变量是内部可链接的(internal linkage),目标文件中没有为链接器提供名称。因此无法链接到其他文件中,因此静态变量的作用域在当前源文件(目标文件)。 虽然静态和非静态全局变量可能存储在同一内存块,但它们的作用域是不同的。 来看例子:

// file: a.cpp
#include <iostream>
extern int a;
int main() {
    std::cout<<a<<std::endl;
    return 0;
}

// file: b.cpp
static int a = 2;

然后g++ a.cpp b.cpp时发生链接错:

Undefined symbols for architecture x86_64:
  "_a", referenced from:
      _main in ccPLYjyx.o
ld: symbol(s) not found for architecture x86_64
collect2: error: ld returned 1 exit status

链接时未找到名称_a,因此静态变量在编译得到的目标文件中没有为链接器提供名称。所以其他目标文件无法访问该变量,静态全局变量的作用域是当前源文件(或目标文件)。

全局变量初始化

全局变量比较特殊,初始化有两种方式:

  • 静态初始化(static initialization):对于定义时给出初始化参数的全局变量,其初始化在程序加载时完成。根据是否被初始化、是否被初始化为0会把它存储在BSS或者DATA段中,参见进程的地址空间分配
  • 动态初始化(dynamic initialization):定义变量时可以不给出初始化参数,而是在某个函数中进行全局变量初始化。

对于静态初始化,看这个例子:

class C{
public:
    C(){ std::cout<<"init "; }
};
C c;
int main() { std::cout<<"main"; return 0; }

main()进入之前,程序加载时动态初始化,程序输出为一行init main

关于全局变量的初始化顺序,同一源文件中的全局变量初始化顺序按照定义顺序,不同源文件(编译单元)的全局变量初始化顺序并未规定。 因此软件设计时不要依赖于其他编译单元的静态变量,可以通过单例模式来避免这一点。

本文采用 知识共享署名 4.0 国际许可协议(CC-BY 4.0)进行许可,转载注明来源即可: https://harttle.land/2015/09/30/cpp-static-and-global.html。如有疏漏、谬误、侵权请通过评论或 邮件 指出。