Redução de custos em 90%, OpenAI abre oficialmente ChαtGPT

No início desta manhã, a OpenAI lançou oficialmente a interface entre o ChαtGPTT e o Whisper, e os desenvolvedores agora podem usar a geração de texto mais recente e as funções de fala para texto por meio da API. De acordo com a OpenAI, por meio de uma série de otimizações no nível do sistema, o custo do ChαtGPT foi reduzido em 90% desde dezembro do ano passado; agora a OpenAI usa esses custos economizados para beneficiar os desenvolvedores. Os desenvolvedores agora podem usar modelos grandes do Whisper v2 por meio da API, resultando em maior velocidade e economia. O modelo ChαtGPT será continuamente atualizado e aprimorado, e uma capacidade dedicada será fornecida para um controle mais profundo do modelo.

insira a descrição da imagem aqui

Diretório de artigos

Interface ChatGPT

Modelo

O nome do modelo ChαtGPT publicado pela OpenAI é gpt-3.5-turbo, que é o mesmo modelo usado no produto ChαtGPT. text-davinci-003O preço é de US$ 0,002/1.000 tokens, 10 vezes mais barato do que antes . gpt-3.5-turboA experiência expressa em cenários de bate-papo e muitos aplicativos de cenário sem bate-papo também podem ter um bom desempenho, e os desenvolvedores podem text-davinci-003mudar de modelo para modelo com ajustes mínimos gpt-3.5-turbo.

insira a descrição da imagem aqui

A OpenAI continuará a melhorar o modelo ChαtGPT, portanto, gpt-3.5-turboo modelo será atualizado continuamente (será atualizado para a versão estável mais recente em abril) e a OpenAI também recomenda que você use gpt-3.5-turboo modelo. A fim de atender às necessidades dos desenvolvedores de versões de modelo específicas, o OpenAI também fornece versões de instantâneo específicas. A versão específica do instantâneo atualmente disponível é gpt-3.5-turbo-0301que não será atualizada nos próximos três meses e será válida até 1º de junho de 2023.

nome do modelo	descrever	solicitação máxima	dados de treinamento
gpt-3.5-turbo	O modelo GPT-3.5 mais poderoso e especialmente otimizado para cenários de bate-papo, por apenas 1/10 `text-davinci-003`do . Ele será atualizado iterativamente.	4.096 fichas	Em junho de 2021
gpt-3.5-turbo-0301	`gpt-3.5-turbo`A versão instantânea de 1º de março de 2023 do . Este modelo não será atualizado nos próximos 3 meses, e o período de validade terminará em 1º de junho de 2023.	4.096 fichas	A partir de outubro de 2019

interface

Devido gpt-3.5-turboao design do cenário para bate-papo, uma pequena mudança ocorreu no design da interface. Na interface GPT-3, as questões são promptpassadas via campos, gpt-3.5-turbonão há promptcampos, e sim messagesum array. Veja a seguir um exemplo típico de chamada de interface:

import openai

completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {
    
    "role": "system", "content": "你是一个聪明的助理"},
        {
    
    "role": "user", "content": "哪支球队赢得了2018世界杯?"},
        {
    
    "role": "assistant", "content": "法国国家男子足球队获得2018年俄罗斯世界杯。"},
        {
    
    "role": "user", "content": "决赛对手是谁？"}
    ]
)
print(completion)

No código de exemplo acima, encapsulamos várias rodadas de conversas em messagesuma matriz e cada mensagem tem roleum sum content. roleO valor opcional de system, é o conteúdo userda mensagem .assistantcontent

Normalmente, o formato da conversa é systemmensagens primeiro, seguidas de usermensagens e assistantmensagens alternadas.

systemAs mensagens ajudam a definir o comportamento do modelo. No exemplo acima, o modelo é informado "você é um assistente inteligente", o modelo desempenhará o papel de assistente e a saída será tão concisa e clara quanto um assistente.

userAs mensagens ajudam a guiar o modelo. Pode ser uma pergunta do usuário (geralmente a última) ou uma configuração de diretiva do desenvolvedor ou prompt contextual.

assistantAs mensagens ajudam a armazenar o contexto. Pode ser a saída anterior do modelo ou pode ser escrita pelo desenvolvedor para dar um exemplo do comportamento desejado.

Como o modelo não possui memória de solicitações anteriores, todas as informações relevantes devem ser fornecidas por meio de diálogo. Portanto, incluir sessões históricas pode ajudar o modelo a entender melhor o problema. No exemplo acima, se não houver usermensagem intermediária e assistantnotícias, é difícil para o modelo dar uma resposta correta se for perguntado sozinho "Quem é o adversário na final?"

gpt-3.5-turboO formato dos dados retornados também mudou ligeiramente. A saída da interface GPT-3 é encapsulada em textcampos e gpt-3.5-turboa saída da interface GPT-3 é encapsulada em messagecampos e também é composta por rolee content. Podemos simplesmente completion['choices'][0]['message']['content']obter a saída.

Melhores Práticas

Como gpt-3.5-turboo desempenho é text-davinci-003semelhante ao do , mas o preço é text-davinci-0031/10, é oficialmente recomendado para a maioria dos casos de uso gpt-3.5-turbo.

Para os desenvolvedores, são poucos os locais que precisam ser alterados, basta promptalterar messageso formato.

"prompt": "哪支球队赢得了2018世界杯?"

Mudar para:

messages: [
    {
    
    "role": "system", "content": "你是一个聪明的助理"},
    {
    
    "role": "user", "content": "哪支球队赢得了2018世界杯?"}
]

ou mais simplesmente:

messages: [
    {
    
    "role": "user", "content": "哪支球队赢得了2018世界杯?"}
]

⚠Nota: gpt-3.5-turbo e gpt-3.5-turbo-0301 não suportam ajuste fino.

interface de sussurro

Whisper é um modelo de fala para texto de código aberto da OpenAI em setembro de 2022. Após seu lançamento, recebeu muitos elogios da comunidade de desenvolvedores. Agora podemos chamar o modelo Whisper v2 por meio da API a um preço de US$ 0,006/minuto. Uma pilha de serviços altamente otimizada garante que o Whisper tenha um desempenho mais rápido em comparação com outros serviços.

insira a descrição da imagem aqui

A API Whisper fornece transcribee translatefaz interface , suporta vários formatos de áudio (m4a, mp3, mp4, mpeg, mpga, wav, webm).

transcrever

import openai

audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)

traduzir

import openai

audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.translate("whisper-1", audio_file)

Atualmente, o Whisper suporta africâner, árabe, armênio, azeri, bielorrusso, bósnio, búlgaro, catalão, chinês, croata, tcheco, dinamarquês, holandês, inglês, estoniano, finlandês, francês, galego, alemão, grego, hebraico, hindi, húngaro , islandês , indonésio, italiano, japonês, kannada, cazaque, coreano, letão, lituano, macedônio, malaio, marathi, maori, nepalês, norueguês, persa, polonês, português, romeno, russo, sérvio, eslovaco, esloveno, espanhol suaíli, sueco, tagalo , Tamil, Tailandês, Turco, Ucraniano, Urdu, Vietnamita e Galês.

Apoie os chineses! Apoie os chineses! Apoie os chineses!