Histórico de desenvolvimento do ChatGpt

  • ChatGPT (nome completo em inglês: Chat Generative Pre-trained Transformer, Chat Generative Pre-trained Transformer) é um modelo de robô de bate-papo lançado pelo laboratório de pesquisa em inteligência artificial OpenAI (Open Artificial Intelligence Research Center) em 2022.
  • O ChatGPT é baseado na série GPT-3.5 e é treinado usando algoritmos de aprendizado por reforço. Ele interage com os usuários de maneira conversacional, gerando respostas por meio da imitação de padrões estatísticos na linguagem de um vasto banco de dados de textos coletados da Internet. No final de janeiro de 2023, o ChatGPT tinha 100 milhões de usuários ativos mensais, tornando-se o aplicativo de consumo de crescimento mais rápido até agora.
  • Em 7 de fevereiro de 2023, a Microsoft anunciou que a tecnologia de suporte ao ChatGPT foi integrada à versão mais recente do mecanismo de pesquisa Bing e do navegador Edge. Em março, a OpenAI anunciou o lançamento da função de plug-in, dando ao ChatGPT a capacidade de usar ferramentas, rede e executar cálculos.

 "História do Desenvolvimento"

  • A OpenAI foi fundada em San Francisco em 2015 por Sam Altman e outros. A empresa está empenhada em desenvolver inteligência artificial e ferramentas de linguagem natural. Em 2019, recebeu um investimento de US$ 1 bilhão da Microsoft. Em junho de 2020, a OpenAI lançou seu primeiro modelo de linguagem NLP, GPT-3 (Generative Pre-Trained Transformer 3), e disponibilizou o modelo em seu site na forma de uma API (Application Programming Interface) para uso externo. [13] No mesmo ano, OpenAI lançou a versão ajustada GPT-3.5, e em janeiro de 2022, a versão pré-afinada InstructGPT de GPT-3.5 foi lançada, mas não foi lançada ao público. [14]
  • Em 30 de novembro de 2022, a OpenAI lançou o ChatGPT, um modelo de robô de bate-papo baseado no GPT-3.5, que é muito mais inteligente do que produtos similares. Apenas 5 dias após o seu lançamento, o ChatGPT atraiu mais de 1 milhão de usuários. [2][6][15]
  • No final de janeiro de 2023, o ChatGPT tinha 100 milhões de usuários ativos mensais, tornando-se o aplicativo de consumo de crescimento mais rápido até agora. [9][10] Então, no início de fevereiro, devido à capacidade total, o site oficial do ChatGPT anunciou que estava temporariamente impossibilitado de fornecer serviços de acesso a todos os usuários. [16] Em 7 de fevereiro de 2023, a Microsoft anunciou a integração da tecnologia ChatGPT nas versões mais recentes do mecanismo de pesquisa Bing e do navegador Edge. [11]
  • Em março de 2023, a Nvidia lançou uma nova plataforma de inferência de GPU, fornecendo ao ChatGPT um desempenho de aceleração 10 vezes maior. [17] Em 14 de março, a OpenAI lançou o modelo GPT-4 e o integrou ao serviço avançado ChatGPT Plus. [18] Os usuários do serviço premium desfrutam de tempos de resposta mais rápidos, acesso prioritário a novos recursos e acesso durante os horários de pico. [19] O serviço ChatGPT Plus de US$ 20 por mês permite que os usuários experimentem uma versão baseada em GPT-4 do ChatGPT. [20]
  • Além disso, a OpenAI também forneceu APIs de modelo ChatGPT e Whisper para desenvolvedores de software em março de 2023, permitindo que os desenvolvedores adicionassem recursos de processamento de linguagem AI e reconhecimento de fala a seus aplicativos. [21] A API do ChatGPT custa US$ 0,002 por 1.000 tokens (cerca de 750 palavras), o que é 10 vezes mais barato que o modelo GPT-3. [vinte e dois]
  • Em termos de segurança, em março de 2023, uma vulnerabilidade fez com que alguns usuários vissem os títulos das conversas de outros usuários, mas o CEO da OpenAI, Sam Altman, disse que os usuários não podiam ver o conteúdo da conversa. [23][24] Depois que o problema foi resolvido, os usuários não conseguiam visualizar o histórico de conversas. [25] Relatórios subsequentes revelaram que a violação foi muito mais séria do que se acreditava inicialmente, resultando na divulgação de informações como nomes de usuários, endereços de e-mail, endereços de pagamento, os últimos quatro dígitos dos números de cartão de crédito e a data de validade do Cartão de crédito. [26][27]
  • Em maio de 2023, a OpenAI, uma organização de desenvolvimento de inteligência artificial, lançou um aplicativo ChatGPT gratuito para iPhone nos Estados Unidos, que inclui suporte de entrada de voz por meio de seu modelo de reconhecimento de fala Whisper AI, e o aplicativo também pode sincronizar registros de bate-papo com a versão da web do assistente de IA. Esta é a primeira vez que o ChatGPT lança uma aplicação cliente móvel oficial.

"Princípio da Realização"

  • O ChatGPT é uma versão irmã do InstructGPT [29]. Comparado com seu modelo predecessor GPT-3, o ChatGPT incorpora aprendizado por reforço baseado em feedback humano (RLHF) no processo de treinamento para tornar a saída do modelo melhor próxima à intenção das perguntas do usuário [29 ]. O aprendizado por reforço de feedback humano é uma tecnologia importante para ChatGPT e InstructGPT para alcançar o alinhamento com as intenções humanas, ou seja, gerar resultados sem efeitos negativos, tanto quanto possível, de acordo com as instruções humanas [30].
  • GPT-3 é um modelo matemático desenvolvido pela OpenAI, e também é a base para o desenvolvimento do ChatGPT[31] Treinamento, o modelo pode prever a próxima palavra da palavra anterior na frase. No entanto, GPT-3 usa uma quantidade muito maior de dados de treinamento e parâmetros de modelo do que GPT-1 e GPT-2 para melhorar o efeito do modelo. GPT-3 tem uma camada de decodificador de transformador de 96 camadas e cada camada tem 96 camadas de 128 dimensões atenção heads. , a dimensão da incorporação de palavras atingiu 12288 e o tamanho do conjunto de dados usado atingiu 45 TB. [30] Após o treinamento, o GPT-3 pode preencher automaticamente as palavras fornecidas de acordo com os resultados do treinamento, selecionar a palavra com a maior probabilidade de saída ou amostrar a próxima palavra para saída. Ao fazer uma pergunta ao GPT-3, ele pode selecionar a próxima palavra mais provável de acordo com a palavra da pergunta e anexá-la ao resultado de entrada e iterar repetidamente até que a resposta seja gerada. [30]
  • O GPT-3 só pode fornecer respostas plausíveis para as perguntas, não pode entender a semântica das perguntas e gerar respostas que atendam às necessidades do usuário para as perguntas do usuário e, ocasionalmente, produz saídas inúteis ou erradas [31]. Ao treinar o InstructGPT e o GPT-3.5, para resolver esse problema, o OpenAI opta por escrever manualmente um certo número de pares de perguntas e respostas, e os rotuladores escrevem as próprias perguntas e respostas e, ao mesmo tempo, respondem manualmente às perguntas de externos usuários e realizar o ajuste fino supervisionado (SFT) Treine o GPT-3 original para gerar melhores respostas. No entanto, devido ao alto custo da escrita manual, a OpenAI optou por deixar o modelo gerar várias respostas por vez, e os humanos as classificaram de acordo com sua utilidade. Um total de mais de 33.000 perguntas e suas respostas foram usadas, e uma certa recompensa mecanismo foi definido. O novo modelo de recompensa pontua cada combinação de pergunta e resposta. Os humanos não participam na criação de respostas, mas apenas na classificação. Ao mesmo tempo, mais de 31.000 perguntas de usuários externos são coletadas e o modelo de recompensa é usado para pontuar , e o modelo é ainda supervisionado e ajustado, e iteração repetida, ou "Aprendizado de Reforço de Feedback Humano". [32]
  • O ChatGPT é ajustado a partir de uma versão do GPT-3.5 que passou por treinamento de aprendizado por reforço de feedback humano. Com base no treinamento InstructGPT, treinamento intensivo adicional é realizado na forma de diálogo. Finalmente, um modelo mais forte do que o InstructGPT é obtido. [29]
  • Quando se trata de GPT-4, o formulário de entrada é aprimorado, não limitado a texto, a entrada pode ser de diferentes formas de conteúdo, como imagens, tabelas, etc., e a saída pode realizar aplicativos como programação gráfica e escrita gráfica . Através da aprendizagem comparativa entre texto e imagem, é estabelecida uma relação especial de mapeamento entre texto e imagem. Ao mesmo tempo, suporta entrada de texto longo e o volume de palavras é 8 vezes maior que o do ChatGPT. [33] O ChatGPT 4 concluiu e passou nos quatro principais exames de qualificação do setor contábil que a geração anterior do ChatGPT 3.5 não passou, incluindo contadores públicos certificados (CPA), contadores gerenciais certificados (CMA), auditores internos certificados (CIA) e fiscais certificados contabilistas (EA), com uma pontuação média de 85,1.

"Função e Status"

  • A função do ChatGPT é relativamente simples, usando um método de perguntas e respostas. Os usuários fazem perguntas e o ChatGPT dá as respostas. [7] A capacidade de aprendizado do ChatGPT é mais forte do que os produtos de inteligência artificial anteriores e pode responder a várias questões difíceis e complexas levantadas por humanos. [1] O ChatGPT participou do SAT de faculdades e universidades americanas e obteve notas de alunos de nível médio. Usou o tom do protagonista de "Friends" para criar um roteiro de diálogo e deu um plano de seis pontos para eliminar a desigualdade econômica [1] Ele até escreveu alguns dos discursos públicos para o presidente israelense Isaac Herzog. [35]
  • A OpenAI afirma que as limitações do ChatGPT se refletem principalmente nos seguintes aspectos:
  • Às vezes, o ChatGPT escreve respostas que parecem plausíveis, mas incorretas ou sem sentido. Resolver esse problema continua sendo um desafio porque: durante o treinamento de aprendizado por reforço, atualmente faltam fontes de informações corretas; para treinar o modelo com mais cuidado, ele se recusará a responder perguntas que poderia ter respondido corretamente; o treinamento supervisionado enganará o modelo porque a resposta ideal depende do que o modelo sabe, não do que os humanos sabem. [29]
  • O ChatGPT é muito sensível ao ajuste fino do texto de entrada ou a várias tentativas da mesma pergunta. Por exemplo, dada uma pergunta em uma frase, o modelo pode alegar não saber a resposta, mas com uma pequena modificação no texto, o modelo pode respondê-la corretamente. [29]
  • O modelo geralmente usa certas frases em excesso, resultando em frases detalhadas, como reiterar repetidamente que era um modelo de linguagem treinado pelo OpenAI. Esses problemas decorrem de vieses nos dados de treinamento (o instrutor acha que respostas longas parecem mais exaustivas) e problemas de otimização excessiva. [29]
  • Idealmente, quando um usuário fornece uma consulta ambígua, o modelo solicitará que o usuário esclareça a questão. No entanto, os modelos existentes geralmente adivinham a intenção do usuário. [29]
  • Embora o OpenAI espere que o modelo rejeite solicitações inapropriadas, às vezes ele responde a instruções prejudiciais ou exibe viés. O OpenAI usa a API de moderação para avisar ou bloquear certos tipos de conteúdo inseguro, mas ainda haverá alguns falsos positivos e falsos negativos. [29]
  • De acordo com relatos da mídia, a partir de fevereiro de 2023, é difícil para o ChatGPT realizar processamento lógico avançado. Depois de concluir a classificação básica de dados e integração de conteúdo "mais preciso e rápido", ele não pode fornecer julgamento, modificação e ajuste abrangentes e lógica pen. Em termos de pontualidade, os dados usados ​​para o treinamento do modelo de linguagem ChatGPT são dados anteriores a setembro de 2021, portanto, pode haver um atraso em alguns dos dados e eventos mais recentes, o que também pode fazer com que o ChatGPT tenha problemas em termos de precisão e conhecimento do conteúdo. deve ser uma pranchinha. [36] Depois que o OpenAI lançou a função de plug-in em março de 2023, o ChatGPT ganhou recursos de rede e resolveu o problema de pontualidade.

"Influência e controvérsia"

  • O ChatGPT teve um efeito sensacional no campo da inteligência artificial, que uma vez levou as ações do conceito AIGC[a] a disparar.[6][8] As instituições de investimento estão geralmente otimistas sobre as perspectivas de negócios do ChatGPT e da trilha AIGC. [9] Ao mesmo tempo, desafia os modelos tradicionais de educação e academia. [8] A fim de evitar fraude acadêmica e plágio, a Sciences Po, a Universidade de Hong Kong e outras universidades anunciaram que professores e alunos estão proibidos de usar ferramentas baseadas em IA, como ChatGPT, em atividades de ensino, [37][38] "Science ", "Nature", "Oncology" Muitas outras revistas científicas também emitiram uma declaração dizendo que não aceitam o artigo listando o ChatGPT como "co-autor". [8]
  • Além disso, o método de pré-treinamento do acesso não autorizado do ChatGPT a um total de cerca de 320 TB de informações de texto causou polêmica e insatisfação. O CEO do Twitter (Twitter), Elon Musk, anunciou publicamente que o ChatGPT foi impedido de acessar o banco de dados do Twitter para obter dados de treinamento. Afirma que "mais informações são necessárias sobre a estrutura de governança da OpenAI e planos de receitas futuras". [36] Thierry Breton, comissário europeu responsável pelo mercado interno, também comentou publicamente em fevereiro de 2023 que as tecnologias de inteligência artificial, como o ChatGPT, podem trazer grandes oportunidades para os negócios e a subsistência das pessoas, mas também são acompanhadas de riscos. considera estabelecer regras e regulamentos para regular seu uso e garantir que informações e dados valiosos e de alta qualidade sejam fornecidos aos usuários. [5] Em 24 de março de 2023, horário local, a OpenAI emitiu um comunicado pedindo desculpas aos usuários e a toda a comunidade ChatGPT, dizendo que reconstruiria a confiança. No início da semana, a empresa colocou o ChatGPT offline depois que um bug na biblioteca de código aberto permitiu que alguns usuários vissem os cabeçalhos de bate-papo de outro usuário, disse o comunicado. Este bug foi corrigido. [39] Em 31 de março, a agência italiana de proteção de dados lançou uma investigação sobre a coleta ilegal de informações do usuário pela OpenAI e anunciou que proibiria o uso do robô de bate-papo ChatGPT a partir de agora e restringiria o processamento de informações do usuário italiano. pela empresa americana de inteligência artificial OpenAI, que desenvolveu esta plataforma. [40] Depois que a Itália tomou medidas, o Conselho Europeu de Proteção de Dados anunciou a criação de um grupo de trabalho especial para promover a cooperação na investigação na Europa. Posteriormente, o Comitê Nacional de Liberdade de Informação da França e a Agência Nacional de Proteção de Dados da Espanha lançaram investigações sobre possíveis violações legais do ChatGPT.

Acho que você gosta

Origin blog.csdn.net/YN2000609/article/details/131710704
Recomendado
Clasificación