pcm介绍
pcm也被称为 脉码编码调制,是音频中没经过压缩的原始数据。
在声音采集中经过抽样,量化,最后编码。
采样:对声音进行一定频率的采集,频率越高,间隔时间越小,声音更接近真实。常用的采样率有8khz,16khz,22.05KHz、44.1KHz、48KHz等。
量化就是对每个采集的数据用数字信号来表示声音的振幅。如我可以用-10表示波谷,10表示波峰。也就是20个量化值来表示一段音乐。当然也可以用100个值表示,这样分得更细,数据更精确。通常量化用一个char 8位表示(0-255),也有short16位(-32767-32767),32位等。
音频数据在存储中就是通过一个个量化数据存储8/16位,8/16位,8/16位等
音频数据还有单声道和双声道的区别,其实就是同一时间采集一次还是两次的区别
各种格式数据存储如下
采集率的转换
由上面知道,采集率就是单位时间采集数据次数的不同,如8khz和16khz。一秒采集了8k次和16k次。这样16k转换为8k,就是将16k降为8k,也就是每采集的两次数据变为1次。(我采用两个数据求平均除以2)
同理,8k变为16k升频。将8k的每个数据变为两个(后一个数据减去前一个数据除以2,加上前一个数据)
其他8k转32k,32k转换为8k那些同理。
/* @breaf 用于pcm音频采集率的转换
@param bit[in],输入文件和输出文件的采样位数
@param sourcefile[in],源文件名
@param sou_rate[in],源文件的采集率
@param disfile[out],目标文件名
@param dis_rate[in],目标文件的采集率
@return 0成功,-1出错
*/
void pcm_rate_trans(int bit,char * sourcefile,int sou_rate,char *disfile,int dis_rate )
{
FILE *fp_sou;
FILE *fp_dis;
fopen_s(&fp_sou, sourcefile, "rb+");
fopen_s(&fp_dis,disfile, "wb+");
if (fp_sou==NULL|| fp_dis==NULL)
{
printf("error open!\n");
}
int rate_len = sou_rate / dis_rate;
//减小采样率
if (rate_len > 0)
{
short tempRead = 0;
short tempSum = 0;
int flag = 0;
while (!feof(fp_sou))
{
if (fread(&tempRead, bit/8, 1, fp_sou) > 0)
{
tempSum = tempSum + tempRead; // 求和
flag++;
if (flag == rate_len)
{
flag = 0;
tempSum = tempSum / rate_len;
fwrite(&tempSum,bit/8, 1, fp_dis);
tempSum = 0;
}
}
}
}
//增大采样率
else
{
rate_len = dis_rate/ sou_rate ;
int tempRead1;
int tempRead2;
int tempSum;
int tempWrite;
int flag;
while (!feof(fp_sou))
{
if (fread(&tempRead1,bit/8, 1, fp_sou) >0&& fread(&tempRead2, bit / 8, 1, fp_sou) >0)
{
// tempSum = *((short *)&tempRead +1)-*(short *)&tempRead;//波距离
tempSum = tempRead2 - tempRead1;
flag = rate_len;
tempWrite =tempRead1;
do
{
tempWrite += tempSum / rate_len;
fwrite(&tempWrite, bit/8, 1, fp_dis);
} while (--flag!=0);
fseek(fp_sou, -1L*bit/8, SEEK_CUR);
}
}
}
fclose(fp_sou);
fclose(fp_dis);
}