No início desta manhã, a OpenAI lançou oficialmente a interface entre o ChαtGPTT e o Whisper, e os desenvolvedores agora podem usar a geração de texto mais recente e as funções de fala para texto por meio da API. De acordo com a OpenAI, por meio de uma série de otimizações no nível do sistema, o custo do ChαtGPT foi reduzido em 90% desde dezembro do ano passado; agora a OpenAI usa esses custos economizados para beneficiar os desenvolvedores. Os desenvolvedores agora podem usar modelos grandes do Whisper v2 por meio da API, resultando em maior velocidade e economia. O modelo ChαtGPT será continuamente atualizado e aprimorado, e uma capacidade dedicada será fornecida para um controle mais profundo do modelo.
Diretório de artigos
Interface ChatGPT
Modelo
O nome do modelo ChαtGPT publicado pela OpenAI é gpt-3.5-turbo
, que é o mesmo modelo usado no produto ChαtGPT. text-davinci-003
O preço é de US$ 0,002/1.000 tokens, 10 vezes mais barato do que antes . gpt-3.5-turbo
A experiência expressa em cenários de bate-papo e muitos aplicativos de cenário sem bate-papo também podem ter um bom desempenho, e os desenvolvedores podem text-davinci-003
mudar de modelo para modelo com ajustes mínimos gpt-3.5-turbo
.
A OpenAI continuará a melhorar o modelo ChαtGPT, portanto, gpt-3.5-turbo
o modelo será atualizado continuamente (será atualizado para a versão estável mais recente em abril) e a OpenAI também recomenda que você use gpt-3.5-turbo
o modelo. A fim de atender às necessidades dos desenvolvedores de versões de modelo específicas, o OpenAI também fornece versões de instantâneo específicas. A versão específica do instantâneo atualmente disponível é gpt-3.5-turbo-0301
que não será atualizada nos próximos três meses e será válida até 1º de junho de 2023.
nome do modelo | descrever | solicitação máxima | dados de treinamento |
---|---|---|---|
gpt-3.5-turbo | O modelo GPT-3.5 mais poderoso e especialmente otimizado para cenários de bate-papo, por apenas 1/10 text-davinci-003 do . Ele será atualizado iterativamente. |
4.096 fichas | Em junho de 2021 |
gpt-3.5-turbo-0301 | gpt-3.5-turbo A versão instantânea de 1º de março de 2023 do . Este modelo não será atualizado nos próximos 3 meses, e o período de validade terminará em 1º de junho de 2023. |
4.096 fichas | A partir de outubro de 2019 |
interface
Devido gpt-3.5-turbo
ao design do cenário para bate-papo, uma pequena mudança ocorreu no design da interface. Na interface GPT-3, as questões são prompt
passadas via campos, gpt-3.5-turbo
não há prompt
campos, e sim messages
um array. Veja a seguir um exemplo típico de chamada de interface:
import openai
completion = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{
"role": "system", "content": "你是一个聪明的助理"},
{
"role": "user", "content": "哪支球队赢得了2018世界杯?"},
{
"role": "assistant", "content": "法国国家男子足球队获得2018年俄罗斯世界杯。"},
{
"role": "user", "content": "决赛对手是谁?"}
]
)
print(completion)
No código de exemplo acima, encapsulamos várias rodadas de conversas em messages
uma matriz e cada mensagem tem role
um sum content
. role
O valor opcional de system
, é o conteúdo user
da mensagem .assistant
content
Normalmente, o formato da conversa é system
mensagens primeiro, seguidas de user
mensagens e assistant
mensagens alternadas.
system
As mensagens ajudam a definir o comportamento do modelo. No exemplo acima, o modelo é informado "você é um assistente inteligente", o modelo desempenhará o papel de assistente e a saída será tão concisa e clara quanto um assistente.
user
As mensagens ajudam a guiar o modelo. Pode ser uma pergunta do usuário (geralmente a última) ou uma configuração de diretiva do desenvolvedor ou prompt contextual.
assistant
As mensagens ajudam a armazenar o contexto. Pode ser a saída anterior do modelo ou pode ser escrita pelo desenvolvedor para dar um exemplo do comportamento desejado.
Como o modelo não possui memória de solicitações anteriores, todas as informações relevantes devem ser fornecidas por meio de diálogo. Portanto, incluir sessões históricas pode ajudar o modelo a entender melhor o problema. No exemplo acima, se não houver user
mensagem intermediária e assistant
notícias, é difícil para o modelo dar uma resposta correta se for perguntado sozinho "Quem é o adversário na final?"
gpt-3.5-turbo
O formato dos dados retornados também mudou ligeiramente. A saída da interface GPT-3 é encapsulada em text
campos e gpt-3.5-turbo
a saída da interface GPT-3 é encapsulada em message
campos e também é composta por role
e content
. Podemos simplesmente completion['choices'][0]['message']['content']
obter a saída.
Melhores Práticas
Como gpt-3.5-turbo
o desempenho é text-davinci-003
semelhante ao do , mas o preço é text-davinci-003
1/10, é oficialmente recomendado para a maioria dos casos de uso gpt-3.5-turbo
.
Para os desenvolvedores, são poucos os locais que precisam ser alterados, basta prompt
alterar messages
o formato.
"prompt": "哪支球队赢得了2018世界杯?"
Mudar para:
messages: [
{
"role": "system", "content": "你是一个聪明的助理"},
{
"role": "user", "content": "哪支球队赢得了2018世界杯?"}
]
ou mais simplesmente:
messages: [
{
"role": "user", "content": "哪支球队赢得了2018世界杯?"}
]
⚠Nota: gpt-3.5-turbo e gpt-3.5-turbo-0301 não suportam ajuste fino.
interface de sussurro
Whisper é um modelo de fala para texto de código aberto da OpenAI em setembro de 2022. Após seu lançamento, recebeu muitos elogios da comunidade de desenvolvedores. Agora podemos chamar o modelo Whisper v2 por meio da API a um preço de US$ 0,006/minuto. Uma pilha de serviços altamente otimizada garante que o Whisper tenha um desempenho mais rápido em comparação com outros serviços.
A API Whisper fornece transcribe
e translate
faz interface , suporta vários formatos de áudio (m4a, mp3, mp4, mpeg, mpga, wav, webm).
transcrever
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
traduzir
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.translate("whisper-1", audio_file)
Atualmente, o Whisper suporta africâner, árabe, armênio, azeri, bielorrusso, bósnio, búlgaro, catalão, chinês, croata, tcheco, dinamarquês, holandês, inglês, estoniano, finlandês, francês, galego, alemão, grego, hebraico, hindi, húngaro , islandês , indonésio, italiano, japonês, kannada, cazaque, coreano, letão, lituano, macedônio, malaio, marathi, maori, nepalês, norueguês, persa, polonês, português, romeno, russo, sérvio, eslovaco, esloveno, espanhol suaíli, sueco, tagalo , Tamil, Tailandês, Turco, Ucraniano, Urdu, Vietnamita e Galês.
Apoie os chineses! Apoie os chineses! Apoie os chineses!