《Go 语言第一课》课程学习笔记（八）

 
  
   
  
 基本数据类型 
 Go 原生支持的数值类型有哪些？ 
 Go 语言的类型大体可分为基本数据类型、复合数据类型和接口类型这三种。 
   其中，我们日常 Go 编码中使用最多的就是基本数据类型，而基本数据类型中使用占比最大的又是数值类型。
 
 
 整型 
 Go 语言的整型，主要用来表示现实世界中整型数量等。它可以分为平台无关整型和平台相关整型这两种，它们的区别主要就在，这些整数类型在不同 CPU 架构或操作系统下面，它们的长度是否是一致的。 
   平台无关整型 
     它们在任何 CPU 架构或任何操作系统下面，长度都是固定不变的。
 
有符号整型（int8-int64）和无符号整型（uint8-uint64）的本质差别在于最高二进制位（bit 位）是否被解释为符号位，这点会影响到无符号整型与有符号整型的取值范围。
Go 采用 2 的补码（Two’s Complement）作为整型的比特位编码方法。因此，我们不能简单地将最高比特位看成负号，把其余比特位表示的值看成负号后面的数值。Go 的补码是通过原码逐位取反后再加 1 得到的。
 
平台相关整型 
     与平台无关整型对应的就是平台相关整型，它们的长度会根据运行平台的改变而改变。
Go 语言原生提供了三个平台相关整型，它们是 int、uint 与 uintptr。
 
由于这三个类型的长度是平台相关的，所以我们在编写有移植性要求的代码时，千万不要强依赖这些类型的长度。
如果不知道这三个类型在目标运行平台上的长度，可以通过 unsafe 包提供的 SizeOf 函数来获取。
 
 
整型的溢出问题 
   如果这个整型因为参与某个运算，导致结果超出了这个整型的值边界，我们就说发生了整型溢出的问题。
由于整型无法表示它溢出后的那个“结果”，所以出现溢出情况后，对应的整型变量的值依然会落到它的取值范围内，只是结果值与我们的预期不符，导致程序逻辑出错。
 
字面值与格式化输出 
   Go 语言在设计开始，就继承了 C 语言关于数值字面值（Number Literal）的语法形式。
早期 Go 版本支持十进制、八进制、十六进制的数值字面值形式。
Go 1.13 版本中，Go 又增加了对二进制字面值的支持和两种八进制字面值的形式。
为提升字面值的可读性，Go 1.13 版本还支持在字面值中增加数字分隔符“_”，分隔符可以用来将数字分组以提高可读性。
反过来，我们也可以通过标准库 fmt 包的格式化输出函数，将一个整型变量输出为不同进制的形式。
 
 
 浮点型 
 浮点型的二进制表示 
   Go 语言提供了 float32 与 float64 两种浮点类型，它们分别对应单精度与双精度浮点数值类型。 
     不过，Go 语言中没有提供 float 类型。
换句话说，Go 提供的浮点类型都是平台无关的。
无论是 float32 还是 float64，它们的变量的默认值都为 0.0，不同的是它们占用的内存空间大小是不一样的，可以表示的浮点数的范围与精度也不同。
 
浮点数在内存中的二进制表示（Bit Representation）要比整型复杂得多： 
     浮点数在内存中的二进制表示分三个部分：符号位、阶码（即经过换算的指数），以及尾数。这样表示的一个浮点数，它的值等于： ( − 1 ) s ∗ 1. M ∗ 2 E − o f f s e t (-1)^s * 1.M * 2 ^{E-offset} (−1)s∗1.M∗2E−offset。 
       当符号位为 1 时，浮点值为负值；
当符号位为 0 时，浮点值为正值。
公式中 offset 被称为阶码偏移值。
 
单精度（float32）与双精度（float64）浮点数在阶码和尾数上的不同：
  
       单精度浮点类型（float32）为符号位分配了 1 个 bit，为阶码分配了 8 个 bit，剩下的 23 个 bit 分给了尾数。
而双精度浮点类型，除了符号位的长度与单精度一样之外，其余两个部分的长度都要远大于单精度浮点型，阶码可用的 bit 位数量为 11，尾数则更是拥有了 52 个 bit 位。
 
 
 
字面值与格式化输出 
   Go 浮点类型字面值大体可分为两类，一类是直白地用十进制表示的浮点值形式。这一类，我们通过字面值就可直接确定它的浮点值。
另一类则是科学计数法形式。采用科学计数法表示的浮点字面值，我们需要通过一定的换算才能确定其浮点值。而且在这里，科学计数法形式又分为十进制形式表示的，和十六进制形式表示的两种。6674.28e-2 // 6674.28 * 10^(-2) = 66.742800
.12345E+5 // 0.12345 * 10^5 = 12345.000000
0x2.p10 // 2.0 * 2^10 = 2048.000000
0x1.Fp+0 // 1.9375 * 2^0 = 1.937500
 
 
 
 复数类型 
 Go 提供两种复数类型，它们分别是 complex64 和 complex128，complex64 的实部与虚部都是 float32 类型，而 complex128 的实部与虚部都是 float64 类型。如果一个复数没有显示赋予类型，那么它的默认类型为 complex128。
关于复数字面值的表示，我们其实有三种方法： 
   第一种，我们可以通过复数字面值直接初始化一个复数类型变量：var c = 5 + 6i。
第二种，Go 还提供了 complex 函数，方便我们创建一个 complex128 类型值：var c = complex(5, 6) // 5 + 6i。
第三种，你还可以通过 Go 提供的预定义的函数 real 和 imag，来获取一个复数的实部与虚部，返回值为一个浮点类型：var c = complex(5, 6) // 5 + 6i
r := real(c) // 5.000000
i := imag(c) // 6.000000
 
 
 
 字符串类型 
 在 Go 中，字符串类型为 string。 
   Go 语言通过 string 类型统一了对“字符串”的抽象。
这样无论是字符串常量、字符串变量或是代码中出现的字符串字面值，它们的类型都被统一设置为 string。
string 类型的数据是不可变的，提高了字符串的并发安全性和存储利用率。
 
Go 字符串的组成 
   Go 语言中的字符串值也是一个可空的字节序列，字节序列中的字节个数称为该字符串的长度。一个个的字节只是孤立数据，不表意。
字符串是由一个可空的字符序列构成。
 
rune 类型与字符字面值 
   Go 使用 rune 这个类型来表示一个 Unicode 码点。rune 本质上是 int32 类型的别名类型，它与 int32 类型是完全等价的。
一个 rune 实例就是一个 Unicode 字符，一个 Go 字符串也可以被视为 rune 实例的集合。我们可以通过字符字面值来初始化一个 rune 变量。
在 Go 中，字符字面值有多种表示法，最常见的是通过单引号括起的字符字面值。
我们还可以使用 Unicode 专用的转义字符\u 或\U 作为前缀，来表示一个 Unicode 字符。
由于表示码点的 rune 本质上就是一个整型数，所以我们还可用整型值来直接作为字符字面值给 rune 变量赋值。
 
字符串字面值 
   字符串是字符的集合，我们需要把表示单个字符的单引号，换为表示多个字符组成的字符串的双引号。
string 类型其实是一个“描述符”，它本身并不真正存储字符串数据，而仅是由一个指向底层存储的指针和字符串的长度字段组成的。
我们直接将 string 类型通过函数 / 方法参数传入也不会带来太多的开销。因为传入的仅仅是一个“描述符”，而不是真正的字符串数据。
 
Go 字符串类型的常见操作 
   下标 
     在字符串的实现中，真正存储数据的是底层的数组。
字符串的下标操作本质上等价于底层数组的下标操作。var s = "中国人"
fmt.Printf("0x%x\n", s[0]) // 0xe4：字符“中” utf-8编码的第一个字节
 
通过下标操作，我们获取的是字符串中特定下标上的字节，而不是字符。
 
字符迭代 
     Go 有两种迭代形式：常规 for 迭代与 for range 迭代。
通过这两种形式的迭代对字符串进行操作得到的结果是不同的。
通过常规 for 迭代对字符串进行的操作是一种字节视角的迭代，每轮迭代得到的的结果都是组成字符串内容的一个字节，以及该字节所在的下标值，这也等价于对字符串底层数组的迭代。
通过 for range 迭代，我们每轮迭代得到的是字符串中 Unicode 字符的码点值，以及该字符在字符串中的偏移值。
我们可以通过这样的迭代，获取字符串中的字符个数，而通过 Go 提供的内置函数 len，我们只能获取字符串内容的长度（字节个数）。
获取字符串中字符个数更专业的方法，是调用标准库 UTF-8 包中的 RuneCountInString 函数。
 
字符串连接 
     Go 原生支持通过 +/+= 操作符进行字符串连接。
虽然通过 +/+= 进行字符串连接的开发体验是最好的，但连接性能就未必是最快的了。
除了这个方法外，Go 还提供了 strings.Builder、strings.Join、fmt.Sprintf 等函数来进行字符串连接操作。
 
字符串比较 
     Go 字符串类型支持各种比较关系操作符，包括 = =、!= 、>=、<=、> 和 <。
在字符串的比较上，Go 采用字典序的比较策略，分别从每个字符串的起始处，开始逐个字节地对两个字符串类型变量进行比较。 
       当两个字符串之间出现了第一个不相同的元素，比较就结束了，这两个元素的比较结果就会做为串最终的比较结果。
如果出现两个字符串长度不同的情况，长度比较小的字符串会用空元素补齐，空元素比其他非空元素都小。
 
鉴于 Go string 类型是不可变的，所以说如果两个字符串的长度不相同，那么我们不需要比较具体字符串数据，也可以断定两个字符串是不同的。但是如果两个字符串长度相同，就要进一步判断，数据指针是否指向同一块底层存储数据。如果还相同，那么我们可以说两个字符串是等价的，如果不同，那就还需要进一步去比对实际的数据内容。
 
字符串转换 
     Go 支持字符串与字节切片、字符串与 rune 切片的双向转换，并且这种转换无需调用任何函数，只需使用显式类型转换就可以了。
 
 
 
《Go 语言第一课》课程学习笔记（八）

基本数据类型

Go 原生支持的数值类型有哪些？

整型

浮点型

复数类型

字符串类型

猜你喜欢