Vamos dar uma olhada no pôster promocional primeiro
Resumo da introdução da atividade
- Tema do evento: Explorando a Inteligência Artificial e o Salão de Práticas de Aplicação da Indústria
A Microsoft Power Platform une-se à GPT para se aprofundar no desenvolvimento de IA + low-code a partir do nível do aplicativo. Um banquete tecnológico que explora a inteligência artificial e as práticas de aplicativos do setor está chegando!
Em 16 de setembro, " Exploring Artificial Intelligence and Industry Application Practice Salon " , vários especialistas técnicos das áreas de IA e low-code explorarão em conjunto o potencial ilimitado do desenvolvimento de low-code por meio de **
技术分享
, **案例实操
e outras formas !带来 AI + 低代码开发的最新技术动态与实践技巧
学习如何利用GPT技术提升应用开发效率与用户体验
O evento está dividido em 2 locais:
- Das 10h às 17h30, no Espaço A , muitos grandes nomes falarão sobre tecnologia em forma de compartilhamento;
- O local B é um workshop prático da Microsoft e da NVIDIA das 13h30 às 17h30, onde dois especialistas conduzirão a experiência prática do AIGC;
Pós-participação
Como foi a primeira vez que fui para Xangai-Microsoft, acidentalmente segui a navegação até a porta dos fundos da Microsoft. Ainda estava me perguntando como entrar. Depois de esperar alguns minutos, uma faxineira se aproximou e eu a segui. ela entra.
Na verdade, há uma porta da frente e há inscrições e assim por diante na porta da frente.
A porta da frente é muito divertida, você pode abri-la para tirar fotos, entrar e distribuir coisas.
Siga as instruções da seta e caminhe até o local A.
Cheguei mais de meia hora mais cedo, mas a equipe ainda estava depurando.
Um recorde de local
Como há muito conteúdo para compartilhar e muitos pontos-chave, escreverei apenas algumas partes que pessoalmente considero fundamentais.
Era pós-GPT: o prompt é o código:
- GPT-1: GPT-1 é a primeira vez que usa métodos de pré-treinamento para obter um treinamento eficiente de compreensão do idioma;
- GPT-2: GPT-2 usa tecnologia de aprendizagem por transferência para aplicar informações pré-treinamento em uma variedade de tarefas para melhorar as capacidades de compreensão do idioma;
- DALL.E: DALL.E passa para outro modo;
- GPT-3: GPT-3 concentra-se principalmente na capacidade de generalização e generalização de poucos disparos (amostra pequena);
- GPT-3.5: Seguimento e ajuste das instruções do GPT-3.5 são os maiores avanços;
- GPT-4: A engenharia começou
- Plugin: O Plugin de março de 2023 é ecológico (primário);;
- Função: A chamada de função em junho de 2023 é ecológica (avançada) e Prompt é código;
Três paradigmas de colaboração homem-máquina:
- Incorporação Modo de incorporação: trabalho de escrita humana e de IA
- Modo copiloto: humanos fazem a maior parte do trabalho
- Modo de agente autônomo AI Agents: AI conclui a maior parte do trabalho
O maior problema do LLM:
pergunta:当前,LLM的最大问题就是缺乏最新的知识和特定领域的知识.
Solução: Para este problema, a indústria tem duas soluções principais: ajuste fino e geração de aprimoramento de recuperação.
Rota técnica de ajuste fino de modelo grande:
- Ajuste Fino Completo FFT (Ajuste Fino Completo)
- Ajuste fino de parâmetro eficaz PEFT (Ajuste fino com eficiência de parâmetro) [Este método é comumente usado]
Ajuste fino de parâmetro eficaz PEFT (ajuste fino com eficiência de parâmetro):
1. Ajuste rápido
Os parâmetros do modelo base permanecem inalterados. Para cada tarefa específica, um pequeno modelo com um pequeno número de parâmetros é treinado e chamado conforme necessário quando tarefas específicas são executadas;
2. Ajuste de prefixo
Sem alterar o modelo grande, adicionar condições apropriadas no contexto do Prompt pode orientar o modelo grande a ter um melhor desempenho.
3.LoRA
Hipótese: Os grandes modelos de linguagem que vemos agora são todos superparametrizados. Por trás da superparametrização, existe um modelo essencial de baixa dimensão. Para se adaptar a tarefas posteriores específicas, um modelo específico deve ser treinado.
4.QloRA
QLoRA é uma versão quantificada do LoRA. É ainda quantificado com base no LoRA, reduzindo os parâmetros originalmente expressos em 16 bits para 4 bits, o que pode garantir o efeito do modelo. É uma boa e grande redução de custos.
O que é mais interessante é a comparação entre RAG e FT:
-
RAG : Esta abordagem integra recursos de recuperação (ou pesquisa) na geração de texto LLM. Combina um sistema de recuperação (obtenção de fragmentos de documentos relevantes de um grande corpus) e LLM (utilização das informações contidas nesses fragmentos para gerar respostas). Essencialmente, o RAG ajuda o modelo a “encontrar” informações externas para melhorar sua resposta.
-
Ajuste fino : Este é o processo de pegar um LLM pré-treinado e treiná-lo ainda mais em um conjunto de dados específico menor para adaptá-lo a uma tarefa específica ou melhorar seu desempenho. Através do ajuste, ajustamos os pesos do modelo com base nos dados, tornando-o mais adequado às necessidades exclusivas da aplicação.
Também compartilhei uma dica de desenvolvimento, você pode definir a chave do OPENAI como uma variável de ambiente e depois chamá-la no código:
Isto também melhorará a eficiência do desenvolvimento
Classificação técnica AIGC
Classificação técnica AIGC:
- Texto: resumo, perguntas e respostas, conclusão do conteúdo;
- Imagem: edição de imagens, geração de imagens, principalmente desenho Al;
- Áudio: conversão de fala em texto, bem como imitação e geração automática;
- Vídeo: geração, imitação, edição, pós-processamento;
- Programação: gerar código, depurar bugs e responder prompts;
- Chatbot: atendimento automatizado e inteligente;
- Plataforma de aprendizagem: uma plataforma ou ecossistema que fornece poder computacional, ambiente e estrutura de modelo;
- Pesquisa: Refinamento adicional e lançamento automático de uma rede mais ampla;
- Jogos: O design de ilustração e a geração de protótipos de personagens reduzem a barreira de entrada;
- Dados: projeto estrutural, coleção original, resumo e refinamento e descoberta de padrões;
- Indústrias verticais: medicina, engenharia, direito, educação, empreendedorismo individual, etc.;
AIGC torna-se assistente especial em trabalhos de redação financeira:
- Prefácio ao novo livro
- Plano de cooperação
- Notificação comercial
- Esboço de pesquisa
- Promoção de eventos
- questões do exame
Que tipo de pessoa pode usá-lo melhor?
geração de conteúdo
- trabalho de redação bancária
- Chamadas e atendimento ao cliente e perguntas de outros clientes do centro, geram respostas automaticamente
- Gere UI personalizada para o site
Capacidade de resumo
- Atendimento ao cliente: resumo dos registros de conversas do cliente
- Relatórios financeiros, artigos de analistas, etc.
- Monitoramento da opinião pública, mídias sociais, resumo de tendências
geração de código
- Linguagem natural e intercâmbio SQL
- Comentários de código
- documento
- questão de lógica simples
- ERRO de sintaxe
Recuperação semântica
- Pesquise avaliações de um produto ou serviço específico
- Desenvolvimento de Informação e Mineração de Conhecimento