うまい飯は遅刻を恐れず、Googleは人工知能AIビッグ言語対話モデルに基づくBardテストとAPI呼び出し(Python3.10)

Google (Google) は、有名な深層学習フレームワーク Tensorflow をオープンソース化した超巨人として、人工知能の分野で無視できないバックボーンの力です. その新製品 Bard がリリースされ、一定期間テストされました. Google の Bard と OpenAI の ChatGPT を比べると、Google Bard は ChatGPT にやや劣る印象があります。

実際、Google Bard は ChatGPT に一致する製品ではありません. Bard は、LaMDA モデルの対話に基づいて構築されています. Bard は、人間の言語をよりよく理解し、複数回の対話を行う能力を備えた会話型 AI システムの構築を目指しています. GPT の目標は、自然言語テキストを生成することです。

特徴データのレベルでは、Bard は Gmail や Meet などの Google のソーシャル プロダクト ラインからの対話データをトレーニングに使用しており、これらのデータには厳格なプライバシー保護対策が施されています。GPT は大規模な Web クローラーを介してデータを取得し、そのトレーニング データ量は LaMDA よりもはるかに大きくなります。

モデル構造レベルでは、Bard は「トランスフォーマー」と呼ばれるニューラル ネットワーク構造を使用します。これは、長いテキストを処理し、情報の一貫性を維持することができます。GPTもTransformer構造を採用していますが、時間刻みでテキストを1つずつ生成する「自己回帰」という手法も採用しています。

率直に言えば、アプリケーション レベルでは、Bard はスマート アシスタント、チャット ロボット、仮想顧客サービスなどのアプリケーションの開発に適しています。GPT は、記事の執筆や機械翻訳などの自然言語生成タスクにより適しています。

吟遊詩人対話テスト (英語/中国語)

bard.google.com にアクセスして、チャットに次のように入力します。

ダイアログの入力内容は英語のみ対応で、中国語は入力できないことが一目でわかります。

しかし実際には、ダイアログのロジックが少し変更されている限り、吟遊詩人は次のような中国語の情報を返すこともできます。

バードコード機能

Bard のコード能力は ChatGPT に劣らないと個人的には思います。

特に、独自の深層学習フレームワークである Tensorflow では非常にまれであり、生成されるコードは次のとおりです。

import tensorflow as tf  
  
def load_model():  
  """Loads the TensorFlow image recognition model."""  
  model = tf.keras.models.load_model('mobilenet_v2_1.0_224')  
  return model  
  
def recognize_objects(image):  
  """Recognizes objects in an image."""  
  # Convert the image to a tensor.  
  image = tf.image.convert_image_dtype(image, dtype=tf.float32)  
  
  # Resize the image to 224x224 pixels.  
  image = tf.image.resize(image, [224, 224])  
  
  # Normalize the image.  
  image = tf.image.normalize(image, mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  
  
  # Predict the labels of the objects in the image.  
  predictions = model.predict(image)  
  
  # Return the labels of the objects in the image.  
  return predictions  
  
def main():  
  # Load the image recognition model.  
  model = load_model()  
  
  # Load an image.  
  image = tf.io.read_file('image.jpg')  
  
  # Recognize objects in the image.  
  predictions = recognize_objects(image)  
  
  # Print the labels of the objects in the image.  
  for prediction in predictions:  
    print(prediction)  
  
if __name__ == '__main__':  
  main()

これは、Tensorflow の組み込みの小さなモデル mobilenet_v2_1.0_224 を使用した、簡潔で厳密なインテリジェント マップ認識ロジックです。

吟遊詩人のネットワーク アーキテクチャ

ブラウザ (B サイド) アーキテクチャでは、Google は ChatGPT に続く SSE プロトコルを使用する代わりに、通信に HTTP2 プロトコル インターフェースを使用することに非常に自信を持っています。

SSE プロトコルを使用する ChatGPT は、GPTモデルは推論に時間がかかるため、実際には次善の選択であることがわかっています。回答、ストリーム リターン、ChatGPT で使用されるサーバー送信イベント バックエンド リアルタイム プッシュ プロトコルは、Tornado6.1 に基づいて Python3.10 で実装されているため、ここでは繰り返しません。

そして Google の吟遊詩人は、すべての推論データを一度に返すことを選択します。

したがって、推論効率の点ではBardの方がChatGPTよりも優れていますが、無料の製品ラインに限定されます.この記事のリリース時点では、ChatGPTの有料製品であるgpt3-turboおよびgpt4の推論効率は、ChatGPTのそれよりもはるかに優れています.その無料の製品。

Bard のリモート インターフェイス API 呼び出し

無料版の ChatGPT と同様に、Bard は現在ブラウザ側 (B 側) の使用のみをサポートしていますが、ブラウザに保存されているトークンを介してリモートで呼び出すこともできます. まず、Bard オープン ソース ライブラリをインストールします。

pip3 install --upgrade GoogleBard

次に、ブラウザ側でトークン キーをコピーします。

次に、ターミナルでセッションを介して注入します。

python3 -m Bard --session UggPYghLzQdQTNx1kQiCRzbPBA1qhjC-dndTiIPCk3YPLR5TexmP7OQ7AfUdsfdsf1Q.

次に、ターミナルで対話シーンに入り、alt+enter 組み合わせキーまたは esc+enter 組み合わせキーを使用して情報を送信できます。

➜  work python3 -m Bard --session UggPYghLzQdQTNx1kQiCRzbPBA1qhjC-dndTiIPCk3YPLR5TexmP7OQdfgdfgdfUSg0UQ.  
  
        Bard - A command-line interface to Google's Bard (https://bard.google.com/)  
        Repo: github.com/acheong08/Bard  
  
        Enter `alt+enter` or `esc+enter` to send a message.  
          
You:  
hi  
   
   
  
Google Bard:  
Hi there! How can I help you today?

主に速度が非常に優れているため、非常に便利です。

エピローグ

無料版の製品力という点では、Google BardとChatGPTにはそれぞれ一長一短がありますが、個人的にはGoogle Bardの方が効率性や使い方のロジックが優れており、悪くはないと思います。ネットで噂されています。いわゆる独特の美しさは春ではなく、百花繚乱は春であり、Google Bard と Baidu の Wenxin の言葉はChatGPT に圧力をかけ、ChatGPT を光の速さで更新し続け、より良い自己になるようにします。 .

おすすめ

転載: blog.csdn.net/zcxey2911/article/details/129876074