【Pythonのサウンド操作について】初めてのPyAudio入門

Pyaudio は Python の非常に人気のあるオーディオ処理ライブラリであり、オーディオ データの録音、再生、処理などに使用できます。Windows に Pyaudio をインストールして使用するには、次の手順が必要です。

  1. Pythonをインストールする

Python をまだインストールしていない場合は、公式 Web サイト (https://www.python.org/downloads/windows/) からダウンロードしてインストールできます。

  1. Pyaudio をインストールする

Windows に Pyaudio をインストールするには、pip コマンドを使用し、コマンド ライン ウィンドウを開いて、次のコマンドを入力します。

pip install pyaudio

インストールに失敗した場合は、次のコマンドを試してください。

pip install pipwin
pipwin install pyaudio
  1. ピアオーディオをテストする

インストールが完了したら、Pyaudio が適切に動作しているかどうかをテストできます。コマンド ライン ウィンドウに次のコードを入力します。

import pyaudio

p = pyaudio.PyAudio()
print(p.get_device_count())

デバイスの数が出力されれば、Pyaudio は正常にインストールされています。

  1. レコードオーディオ

Pyaudio で音声を録音するには、次の手順が必要です。

import pyaudio
import wave

# 设置录音参数
'''
在音频处理中,chunk(也称为帧)是指音频信号中的一小段连续采样数据。每个chunk通常包含几毫秒到几百毫秒的音频数据,具体取决于采
样率和帧率。在数字音频中,chunk是数字信号的基本单位,它们被用于压缩、存储、传输和处理音频数据。在音频处理中,通常需要对每个
chunk进行分析、处理或转换,以实现各种音频效果和功能。
'''
CHUNK = 1024
'''
`pyaudio.paInt16` 是 PyAudio 库中的一个常量,表示采样格式为 16 位整型的音频数据。在 PyAudio 中,采样格式是指每个采样点的编
码方式,常见的采样格式还有 `pyaudio.paFloat32`(32 位浮点型)和 `pyaudio.paInt32`(32 位整型)等。采样格式的选择取决于应用
场景和硬件设备的支持情况
'''
FORMAT = pyaudio.paInt16

CHANNELS = 1
RATE = 44100
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

# 初始化Pyaudio
p = pyaudio.PyAudio()

# 打开音频流
stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=RATE,
                input=True,
                frames_per_buffer=CHUNK)

print("* recording")

# 录制音频
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)

print("* done recording")

# 关闭音频流
stream.stop_stream()
stream.close()
p.terminate()

# 保存录音结果
wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()

このコードは 5 秒間の音声を録音し、output.wav ファイルに保存します。

  1. オーディオを再生する

Pyaudio を使用してオーディオを再生するには、次の手順が必要です。

import pyaudio
import wave

# 打开音频文件
wf = wave.open("output.wav", 'rb')

# 初始化Pyaudio
p = pyaudio.PyAudio()

# 打开音频流
stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
                channels=wf.getnchannels(),
                rate=wf.getframerate(),
                output=True)

# 播放音频
data = wf.readframes(1024)
while data != b'':
    stream.write(data)
    data = wf.readframes(1024)

# 关闭音频流
stream.stop_stream()
stream.close()
p.terminate()

このコードは、output.wav ファイル内のオーディオを再生します。

  1. 延長使用

Pyaudio は、オーディオ処理、リアルタイムオーディオ分析などにも使用できます。Pyaudio の使用法について詳しく知りたい場合は、公式ドキュメントを参照してください: https://people.csail.mit.edu/hubert/pyaudio/docs/

おすすめ

転載: blog.csdn.net/weixin_43958438/article/details/130626645