コストを90%削減、OpenAIが正式にChatGPTをオープン

今朝早く、OpenAI は ChαtGPTT と Whisper の間のインターフェースを正式にリリースし、開発者は API を介して最新のテキスト生成と音声テキスト変換機能を使用できるようになりました。OpenAI によると、一連のシステム レベルの最適化により、ChαtGPT のコストは昨年 12 月から 90% 削減されました。現在、OpenAI はこれらの節約されたコストを開発者の利益のために使用しています。開発者は、API を介して Whisper v2 の大規模モデルを使用できるようになり、速度と費用対効果が向上しました。ChαtGPT モデルは継続的にアップグレードおよび改善され、モデルをより詳細に制御するための専用の容量が提供されます。

ここに画像の説明を挿入

ChatGPTインターフェース

モデル

OpenAI が公開している ChαtGPT モデルの名前はgpt-3.5-turbo、ChαtGPT 製品で使用されているモデルと同じです。価格は 0.002 ドル/1000 トークンで、以前のtext-davinci-00310 分の 1です。gpt-3.5-turboチャット シナリオでの経験を表現し、多くの非チャット シナリオ アプリケーションも適切に動作し、開発者は最小限の調整でモデルからモデルにtext-davinci-003切り替えることができますgpt-3.5-turbo

ここに画像の説明を挿入

OpenAIはChatGPTモデルを改良し続けますので、gpt-3.5-turboモデルは継続的に更新されます(4月に最新の安定版にアップグレードされます)。また、OpenAIもgpt-3.5-turboモデルを使用することを推奨します。特定のモデル バージョンに対する開発者のニーズを満たすために、OpenAI は特定のスナップショット バージョンも提供します。現在利用可能な特定のスナップショット バージョンは、gpt-3.5-turbo-0301今後 3 か月間は更新されず、2023 年 6 月 1 日まで有効です。

モデル名 説明 最大リクエスト 訓練データ
gpt-3.5-ターボ 最も強力な GPT-3.5 モデルで、チャット シナリオ向けに特別に最適化されており、コストtext-davinci-003は。繰り返し更新されます。 4,096トークン 2021年6月現在
gpt-3.5-ターボ-0301 gpt-3.5-turboの 2023 年 3 月 1 日のスナップショット バージョン。このモデルは今後 3 か月間更新されず、有効期間は 2023 年 6 月 1 日に終了します。 4,096トークン 2019年10月現在

インターフェース

チャットのシーンのデザインに伴いgpt-3.5-turbo、インターフェースのデザインが少し変更されました。GPT-3 インターフェイスでは、質問はpromptフィールドを介して渡されます。フィールドgpt-3.5-turboはなく、代わりに配列です。以下は、典型的なインターフェイス呼び出しの例です。promptmessages

import openai

completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {
    
    "role": "system", "content": "你是一个聪明的助理"},
        {
    
    "role": "user", "content": "哪支球队赢得了2018世界杯?"},
        {
    
    "role": "assistant", "content": "法国国家男子足球队获得2018年俄罗斯世界杯。"},
        {
    
    "role": "user", "content": "决赛对手是谁?"}
    ]
)
print(completion)

messages上記のサンプル コードでは、複数回の会話を配列にカプセル化し、各メッセージにはrolesumがありますcontent,roleのオプションの値は、メッセージの内容ですsystemuserassistantcontent

通常、会話の形式はsystemメッセージが最初で、その後にuserメッセージとassistantメッセージが交互に続きます。

systemメッセージは、モデルの動作を設定するのに役立ちます。上記の例では、モデルは「あなたはスマート アシスタントです」と伝えられ、モデルはアシスタントの役割を果たし、出力はアシスタントと同じくらい簡潔で明確になります。

userメッセージはモデルのガイドに役立ちます。これは、ユーザーの質問 (通常は最後の質問)、または開発者のディレクティブ設定またはコンテキスト プロンプトのいずれかです。

assistantメッセージはコンテキストの保存に役立ちます。これは、モデルの以前の出力である場合もあれば、望ましい動作の例を示すために開発者が作成したものである場合もあります。

モデルには過去のリクエストの記憶がないため、すべての関連情報は対話を通じて提供する必要があります。したがって、履歴セッションを含めると、モデルが問題をよりよく理解するのに役立ちます。user上記の例では、中間メッセージやニュースがない場合assistant、「決勝戦の相手は誰?」と単独で尋ねられた場合、モデルが正解を出すのは困難です。

gpt-3.5-turbo返されるデータの形式もわずかに変更されました。GPT-3 インターフェイスの出力はtextフィールドにカプセル化され、gpt-3.5-turboGPT-3 インターフェイスの出力はmessageフィールドにカプセル化され、 と で構成されroleますcontentcompletion['choices'][0]['message']['content']単純に出力を取得できます。

ベストプラクティス

と同等のgpt-3.5-turbo性能ながら価格は10分の1なので、ほとんどのユースケースに公式に推奨されていますtext-davinci-003text-davinci-003gpt-3.5-turbo

開発者にとって、変更する必要がある場所はほとんどなく、フォーマットpromptを変更するだけで済みます。messages

"prompt": "哪支球队赢得了2018世界杯?"

への変更:

messages: [
    {
    
    "role": "system", "content": "你是一个聪明的助理"},
    {
    
    "role": "user", "content": "哪支球队赢得了2018世界杯?"}
]

またはもっと簡単に:

messages: [
    {
    
    "role": "user", "content": "哪支球队赢得了2018世界杯?"}
]

⚠注: gpt-3.5-turbo と gpt-3.5-turbo-0301 は微調整をサポートしていません。

ささやきインターフェース

Whisper は、2022 年 9 月に OpenAI によってオープン ソース化された音声テキスト変換モデルです。リリース後、開発者コミュニティから高い評価を受けました。これで、0.006 USD/分の料金で API を介して Whisper v2 モデルを呼び出すことができます。高度に最適化されたサービス スタックにより、Whisper は他のサービスよりも高速なパフォーマンスを実現します。

ここに画像の説明を挿入

Whisper API は複数のオーディオ形式 (m4a、mp3、mp4、mpeg、mpga、wav、webm) をサポートしtranscribetranslateインターフェース提供します。

転記する

import openai

audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)

翻訳

import openai

audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.translate("whisper-1", audio_file)

Whisper は現在、アフリカーンス語、アラビア語、アルメニア語、アゼルバイジャン語、ベラルーシ語、ボスニア語、ブルガリア語、カタロニア語、中国語、クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ガリシア語、ドイツ語、ギリシャ語、ヘブライ語、ヒンディー語、ハンガリー語、アイスランド語をサポートしています。 、インドネシア語、イタリア語、日本語、カンナダ語、カザフ語、韓国語、ラトビア語、リトアニア語、マケドニア語、マレー語、マラーティー語、マオリ語、ネパール語、ノルウェー語、ペルシャ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スロバキア語、スロベニア語、スペイン語、スワヒリ語、スウェーデン語、タガログ語、タミル語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語、ウェールズ語。

中国語をサポート!中国語をサポート!中国語をサポート!

おすすめ

転載: blog.csdn.net/jarodyv/article/details/129306183