Excluir arquivos duplicados JSON com base em um dos atributos - Code World

Excluir arquivos duplicados JSON com base em um dos atributos

Others 2022-04-22 13:56:52 views: 0

Sibgha:

Eu tenho dois diretórios no meu sistema linux, /dire/dir2

Ambos têm mais de 4000 arquivos JSON. O conteúdo JSON de cada arquivo é como

{
   "someattribute":"someValue",
   "url":[
      "https://www.someUrl.com/xyz"
   ],
   "someattribute":"someValue"
}

Note-se que URL é uma matriz, mas sempre contém um elemento (URL).

O url torna o arquivo único. Se houver um arquivo com o mesmo URL no /dire /dir2, em seguida, que é uma duplicata e precisa ser eliminado.

Eu quero automatizar esta operação ou usando um comando de preferência. Qualquer opinião como eu deveria ir sobre ele?

oguz Ismail:

Use JQ para obter uma lista de duplicatas:

jq -nr 'foreach inputs.url[0] as $u (
  {}; .[$u] += 1; if .[$u] > 1
  then input_filename
  else empty end
)' dir/*.json dir2/*.json

E excluí-los, tubo acima de saída do comando para xargs:

xargs -d $'\n' rm --

ou, para compatibilidade com xargs não-GNU que tem -0, mas não -d:

tr '\n' '\0' | xargs -0 rm --

Note que os nomes de arquivos não devem conter avanços de linha.

Acho que você gosta

Origin http://43.154.161.224:23101/article/api/json?id=199481&siteId=1

Excluir arquivos duplicados JSON com base em um dos atributos

Sabe MongoDB [com base em um banco de dados de armazenamento de arquivos distribuídos]

Gere json em lotes com base em arquivos json futuros

Encontre os campos em uma tabela que são duplicados por meio de sql e exclua os dados duplicados e deixe aquele com o menor id. Use a sintaxe em para excluir os dados em um determinado intervalo.

[Habilidades Figma] Gere automaticamente legendas de escala de cores com base em arquivos JSON

Algoritmo para excluir caracteres duplicados em strings de linguagem C (com código-fonte completo)

campos duplicados em JSON Response

Algoritmo para excluir itens duplicados da lista vinculada não classificada em linguagem C (com código-fonte completo)

python alcançar todos os arquivos em lotes para excluir um caminho certo

Shell implementa correspondência nebulosa para excluir arquivos em um diretório

Excluir arquivos em lote mais antigos do que um tempo específico

Adicionar um objeto a outro objeto contido em um dos atributos da primeira classe, Java

Mapear um campo de JSON (para um valor) com base em outro campo (que é uma chave) usando Jackson

Combinando vários arquivos de texto em um com python

Como excluir com segurança os arquivos em um disco de estado sólido dispositivo de memória flash disco (SSD), U disco e outra tornando-se impossível recuperar?

Como julgar a dimensão dos dados com base em '[]'

Excluir um atributo em um objeto

lista de matriz tipo de objetos com base em atributos de objeto

Explicação detalhada das etapas e métodos de execução do programa C com base em um arquivo de projeto DSP (com arquivos de cabeçalho, arquivos de origem, etc.)

Uma ferramenta de linha de comando que pode gerar imagens de nuvem de palavras-chave com base em arquivos de remarcação de blog com um clique e suporta o upload de imagens com um clique

Sistema Windows encontra arquivos duplicados em várias pastas

Como posso recuperar arquivos que foram excluídos permanentemente em um computador Mac?

[101 principais entrevistas obrigatórias] Excluir elementos duplicados em uma lista vinculada ordenada-I e Excluir elementos duplicados em uma lista vinculada ordenada-II

Excluir arquivos em lote em um determinado formato de sufixo no ambiente do Windows (tome o arquivo de formato xml como exemplo)

Não é possível excluir arquivos em SDcard

3 maneiras de excluir arquivos/pastas em java

Como criar, modificar e excluir arquivos em c++

Como lidar com JSON objetos envolvidos em um objeto JSON com retrofit2?

Crie um novo objeto em React.js a partir dos valores em um objeto json em separado

SLF4J - Logging para diferentes arquivos com base em uma tag

Recomendado

Clasificación

Diario

Más

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)

2024-05-08(19)

2024-05-07(34)

2024-05-06(4)

2024-05-05(0)

2024-05-04(19)

2024-05-03(7)

2024-05-02(0)