第二章 Java基本语法
2.1 关键字与保留字
2.1.1 关键字(keyword)的定义与特点
定义:被Java语言赋予了特殊含义,用做专门用途的字符串(单词)
特点:关键字中的所有字母都为小写
2.1.2 保留字(reserved word)
Java保留字:现有Java版本尚未使用,但以后版本可能会最为关键字使用。自己命名标识符时要避免使用这些保留字:goto,const。
2.2 标识符
2.2.1 标识符
Java对各种变量,方法和类等要数命名时使用的字符序列称为标识符
技巧:凡是自己可以起名字的地方都叫标识符
2.2.2 合法标识符定义规则
①.由26个英文字母大小写,0-9,_或$组成
②.数字不可以开头
③.不可以使用关键字和保留字,但能包含关键字和保留字
④.Java中严格区分大小写,长度无限制
⑤.标识符不能包含空格
2.2.3 Java中的名称命名规范
包名:多单词组成时所有字幕都小写:xxyyzz
类名,接口名:多单词组成时,所有单词的首字母大写:XxYyZz
变量名,方法名:多单词组成时,第一个单词首字母小写,第二个单词开始每个单词首字母大写:xxYyZz
常量名:所有字母都大写。多单词时每个单词用下划线连接:XX_YY_ZZ
命名最好要做到“见名知意”
2.3 变量
2.3.1 变量的概念
内存中的一个存储区域;该区域的数据可以在同一类型范围内不断变化
变量是程序中最基本的存储单元;包含变量类型,变量名和存储的值
2.3.2 变量的作用
用于在内存中保存数据
2.3.3 使用变量注意
Java中每个变量必须先声明,后使用
使用变量名来访问这块区域的数据
变量的作用域:其定义所在的一对{}内
变量只有在其作用域内才有效
在同一个作用域内,不能定义重名的变量
2.3.4 变量的分类
按照数据类型分类:对于每一种数据都定义了明确的具体数据类型(强类型语言),在内存中配了不同大小的内存空间
数据类型分为基本数据类型(primitive type)和引用数据类型(reference type)
基本数据类型:
①.数值型:整数类型(byte,short,int,long)和 浮点类型(float,double)
②.字符型(char)
③.布尔型(boolean)
引用数据类型:
①.类(class)
②.接口(interface)
③.数组([ ])
2.3.5 变量类型的介绍
①.整数类型:byte,short,int,long:
Java各整数类型有固定的表数范围和字段长度,不受具体OS的影响,以保证java程序的可移植性。
Java的整型常量默认为 int 型,声明 long 型常量须后加 ‘l’ 或 ‘L’
Java程序中变量通常声明为 int 型,除非不足以表示较大的数,才使用 long
bit:计算机中的最小存储单位。byte:计算机中基本存储单元。
②.浮点类型:float,double:
与整数类型类似,Java浮点类型也有固定的表数范围和字段长度,不受具体操作系统的影响。
浮点型常量有两种表示形式:
十进制数形式:如:5.12 512.0f .512(必须有小数点)
科学计数法形式:如:5.12e2 512E2 100E-2
float:单精度,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。
double:双精度,精度是 float 的两倍。通常采用此类型。
Java的浮点型常量默认为 double 型,声明 float 类型常量,需后加 ‘f’ 或 ‘F’。
③.字符类型 :char:
char 型数据用来表示通常意义上“字符”(2字节)
Java中的所有字符都使用 Unicode 编码,故一个字符可以存储一个字母,一个汉字,或其他书面语的一个字符。
字符型变量的三种表现形式:
字符常量是用单引号(' ')括起来的单个字符。
例如:char c1 = 'a'; char c2 = '中'; char c3 = '9';
Java中还允许使用转义字符 ‘\’ 来将其后的字符转变为特殊字符型常量。
例如:char c3 = ‘\n’;// '\n' 表示换行符
直接使用 Unicode 值来表示字符常量:‘\uXXXX’。其中,XXXX代表一个十六进制整数。如:\u000a 表示 \n。
char类型是可以进行运算的。因为它们都对应有 Unicode 码。
④.布尔类型:boolean:
⑤.字符串类型:String:
String不是基本数据类型,属于引用数据类型,翻译为:字符串,使用方式与基本数据类型一致。例如:String str = "abcd";
声明String类型变量时,使用一对 " ",一个字符串可以串接另一个字符串,也可以直接串接其他类型的数据。例如:str = str+"xyz"; int n = 100; str = str + n; 则 str 的值为 "abcxyz100" 。
2.3.6 变量的简单练习
2.4 了解编码类型
2.4.1 了解 ASCII 编码
在计算机内部,所有数据都使用二进制表示。每一个二进制位(bit)有 0 和 1 两种状态,因此 8个二进制位就可以组合出 256 种状态,这称为一个字节(byte)。一个字节一共可以用来表示 256 种不同的状态,每一个状态对应一个符号,就是 256 个符号,从 0000000 到 1111111。
ASCII码:上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,比如空格 “SPACE”是32(二进制00100000),大写字母A是 65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。
缺点:不能表示所有字符。相同的编码表示的字符不一样。
2.4.2 了解 Unicode 编码
乱码:世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,想要打开一个文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。
Unicode:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用 Unicode 没有乱码的问题。
Unicode的缺点:Unicode只规定了符号的二进制代码,却没有规定这个二进制代码如何存储:无法区别Unicode 和 ASCII:计算机无法区别三个字节表示一个符号还是分别表示三个符号。另外,我们知道,英文字母只用一个字节表示就够了,如果 unicode 统一规定,每个字符用三个或四个字节表示,那么每个英文字母前都必须有二到三个字节是0,对于存储空间说是极大的浪费。
2.4.3 了解 UTF-8 编码
UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。
UTF-8 是一种变长的编码方式。它可以使用 1-6 个字节表示一个符号,根据不同的符号而变化字节长度。
UTF-8 的编码规则:
对于单字节的 UTF-8 编码,该字节的最高位为0,其余7位用来表示对字符进行编码(等同于ASCII码)。
对于多字节的 UTF-8 编码,如果编码包含n个字节,那么第一个字节的前n位为1,第一个字节的第 n+1位为0,该字节的剩余各位用来对字符进行编码。在第一个字符之后的所有字节,都是最高两位为“10”,其余6为用来对字符进行编码。
2.5 基本类型数据之间的转换规则
2.5.1 自动类型转换
2.5.2 强制类型转换
自动类型转换的逆过程,将容量大的数据类型转换为容量小的数据类型。使用时要加上强制类型转换符:(),但可能造成精度降低或溢出,格外要注意。
通常,字符串不能直接转换为基本类型,但通过基本类型对应的包装类则可以实现把字符串转换成基本类型。boolean 类型不能转换为其他的数据类型。
2.5.3 变量运算规则的两个特殊情况