php与ASCII码的关系

首先 简单说一下历史,ascii码最开始是美国人搞出来的,用来干什么呢?我们知道,计算机只知道0和1,如果我们要计算机识别除了01之外的字符,例如 'a',我们要先告诉计算机‘1100001’就是'a'。跟摩斯密码一样,敲几下三长两短就是代表sos(开玩笑)。所谓的字符编码,就是跟计算机打交 道,跟计算机约定一连串的0101到底代表了什么字符。

ascii编码是鼻祖了,不过由于ascii只有8bits,而且实际上用到的是7位,所以能表示的只有128个字符(00000000~01111111)。这128个字符包括了可打印的普通字符,也包括了不可打印的命令字符。看下表。

这128个字符,对于美国人来说,应该是足够了。但对于一些使用非英文字符的国家地区,例如拉丁文,发文,俄文,中文,这就绝对不够。

所以后来就有人搞了扩展的ascii,也有人搞了新的字符编码,在原来的8位基础上扩展到16位,32位。我们常见的ISOxxxx,GB2312,GBK,BIG 5,unicode....都是后来发展起来的。

虽然这 些字符编码有些之间是不兼容,例如就中文而言,gb2312是不兼容unicode的,就是说,同一个汉字,底层约定的二进制是不一样的。网页上的乱码就 是出于此。但是这些后来发展的字符编码都向下兼容了ascii。这就是为什么utf-8(unicode)和gbk/gb2312显示英文是不会有乱码, 而显示中文会容易乱码。因为他们都兼容ascii,所以52个字母的显示都是按ascii标准。但ascii是没中文的,所以unicode,gbk都按 各自标准解释了。

从简单入手,我们先来看ascii标准的编码。弄清楚PHP里面的二进制,十进制,八进制,十六进制,字符的表示与转化。

先来说一下一些表示法:

Dec:十进制

Hex:十六进制

Oct:八进制

Bin:二进制

所以数字16表示为:16D = 01H = 018O = 1000 0000B

上面这些都是一些表示法而已。方便给人看的。

=================================================================================================

现在有一个需求,在程序中输入一个十六进制数,让计算机显示对应的ascii字符。例如就41H就对应A。

方法一:

用转义字符:转义字符里提供\xdd和\ddd,\xdd表示十六进制,\ddd表示八进制

所以我们可以:

  1. <?php  
  2. echo "\x41";                    //十六进制,\x开头  
  3. echo "\101";                    //八进制,随便几位  
  4. ?>  

注意:转义字符只提供了十六进制和八进制转换到字符,没有提供二进制、十进制转换到字符。所以要用另外一种方法。

方法二:

用php里面的chr()函数。这个函数参数很简单,就是ascii码对应的十进制,十六进制,八进制。

十进制:直接写整数

八进制:第一位肯定是0,后面随便几位

十六进制:0xdd

二进制:字符串

注意:一定要记清楚十六进制是0xdd

  1. <?php  
  2. echo chr(65);                    //十进制,由于都输数,所以没必要加双引号了  
  3. echo chr(0x41);                 //十六进制  
  4. echo chr(0101);                 //八进制,三位,最高位补零  
  5. echo chr('01000001');         //二进制,注意,这里的二进制一定要看做字符串,加引号!上面三个都不用加  
  6. ?>  

方法三

用php里面的printf/sprintf()函数格式化输出

  1. <?php  
  2. printf("%c", 0x41);               //第二个参数一定不能用单/双引号  
  3. printf("%c", 0101);               //第二个参数一定不能用单/双引号  
  4. printf("%c", 65);                    //第二个参数一定不能用单/双引号  
  5. printf("%c", '01000001');  
  6. ?>  

第二个参数格式基本跟chr()的一样,8进制,10进制,16进制都不加引号,二进制就要加引号。8进制首位为0,16进制首位为0x。

====================================================================================

现在是根据一个字符提取ascii表中的对应值

方法一:

ord()函数

  1. <?php  
  2. echo ord('A');  
  3. ?>  

输出结果是65。因而这个函数只能从字符转化到十进制。

注意:这个方法只提取第一个字符。如果是一个字符串,那就没办法处理后面的字符了。

方法二:

bin2hex()函数:将字符[串]转换为16进制

  1. <?php  
  2. echo bin2hex('A');  
  3. ?>  

输出结果是41。

注意,这个41只是字面数值,没有16进制的意义。

这个函数不能用一个二进制‘01101...’直接转到16进制,只能由字符串转到16进制,真怪

这个函数可以处理字符串  

printf/sprintf()函数

.....发现都不行

所以,只能先用ord()转化为十进制,再转为二进制,八进制。(以后再看看pack这个函数)

====================================================================================

各种进制 的转换:

bindec():二进制转十进制

  1. <?php  
  2. echo bindec(1100);           //输出12,可以加引号,也可以不加                 
  3. ?>   

decbin():十进制转二进制,一样用

dechex() :十进制转16进制

hexdec():16进制转10进制(参数直接写值,不用写0x)

octdec():八进制转10进制

decoct():10进制转8进制

base_convert(要转换的数,原进制,目标进制):任意进制转换

<?php

echo base_convert(123, 6, 2);

?>

注意:上面的这些转换函数,由于都是数学处理函数,所以参数都不需要是字符串形式(不需要加引号),直接写数值就行了。

echo -e -n '\240\000\001{"cuid":8909723,"skey":"abcdef","ckey":"V1cxR2NGcElWblJaV0VKb1dXYzlQV05rZWY=","app":"1","os":"android","l":"1","n":"1","v":"5.2","t":"1234","mid":"0","lv":"2"}' | nc 10.67.16.12 8000 

-e :处理转义字符,此处是八进制ascii  

\d\d\d 8进制

\x\d\d 16进制 

-n :不输入换行符

 抓包能发现服务端收到的data为(16进制
):

a000017b2263756964223a383930393732332c22736b6579223a22616263646566222c22636b6579223a225631637852324e4763456c57626c4a615630564b62316458597a6c51563035725a57593d222c22617070223a2231222c226f73223a22616e64726f6964222c226c223a2231222c226e223a2231222c2276223a22352e32222c2274223a2231323334222c226d6964223a2230222c226c76223a2232227d

猜你喜欢

转载自blog.csdn.net/qq_39131177/article/details/81196575