CSV de ignição com vários delimitadores em DataSet - Code World

CSV de ignição com vários delimitadores em DataSet

Others 2022-04-22 20:26:45 views: 0

user10267781:

Eu tenho dois arquivos CSV que estou agregando usando ignição com Java. Esses arquivos têm diferentes delimitadores.

file1.dat:

011!345!Ireland

files2.dat:

022Ç486ÇBrazil

Código que eu uso:

Dataset<Row> people = spark.read().format("csv").option("header", "false").option("delimeter", "\u00C7").option("delimeter", "!").load(logFile);

Resultado:

Error:Cannot resolve column name

Se eu remover um delimitador:

Dataset<Row> people = spark.read().format("csv").option("header", "false").option("delimeter", "\u00C7").load(logFile);

Resultado:

Sno|code|Country
null|null|null 
022|486|Brazil

Existe uma maneira de realizar isso? Ambos os arquivos podem ser agregados no mesmo código faísca?

Shaido - Reintegrar Monica:

Você não pode usar vários delimitadores ao mesmo tempo.

Em vez disso, ler os arquivos separatly e uso union( doc ) para fundi-las. Por exemplo:

Dataset<Row> people1 = spark.read()
  .option("header", "false")
  .option("delimeter", "!")
  .csv(logFile1);
Dataset<Row> people2 = spark.read()
  .option("header", "false")
  .option("delimeter", "\u00C7")
  .csv(logFile2);

Dataset<Row> people = people1.union(people2);

Acho que você gosta

Origin http://43.154.161.224:23101/article/api/json?id=213766&siteId=1

CSV de ignição com vários delimitadores em DataSet

Como fazer o registro de faísca Dataset printSchema em nível info / depuração no projeto java ignição comandada

O PHP divide o arquivo csv grande em vários arquivos pequenos e os nomeia de acordo com o número de sequência.

Instrução SQL, corte um pedaço de dados no banco de dados em várias colunas por meio de delimitadores

253 【Cursos completos】 Projeto de ignição sincronizada com base em 51 Single Chip Computer-Boost

O uso de delimitadores Java

O nome de apresentação foi definido em vários fragmentos com valores diferentes includi

Python classifica vários arquivos em um documento txt de acordo com sua extensão

Compilação em tempo Parâmetros de tipo com vários Bounds

Identifique ameaças em pacotes pcap com base em vários mecanismos de detecção de tráfego

Combinando vários arquivos de texto em um com python

Como 'caminhada' vários diretórios, com várias extensões de arquivo, em java?

código de implementação com base em vários algoritmo de filtro de câmara eo GLSL OpenGL ES

Como ler linhas de um CSV para usar em vários segmentos

Use o tomcat para executar vários projetos java com diferentes nomes de domínio em um host

Java Regex decodificação tratar vários delimitadores como mesmos não funciona

Políticas implementadas com precisão em vários departamentos e regiões, a transformação digital das PMEs entrou em um período de ressonância política

Como filtrar os dados em uma lista de acordo com vários parâmetros em Java?

Como lidar com vários URLs em beautifultsoup e converter os dados em trama de dados?

Combine vários arquivos do Excel com várias planilhas em ordem de planilha

O Spring pode criar beans com nomes "duplicados"? —Solução de problemas de duplicação de vários nomes de bean em um projeto

Compartilhe uma estranha questão de algoritmo de programação que vi recentemente em Turing - gere vários pares de parênteses que estejam de acordo com as regras

Programação em vários níveis de processadores

Vários métodos de iteração em JavaScript

Demonstração de vários tipos em JAVA

Vários eventos de ligação incomuns em JavaScript

Vários métodos de carregamento de centelha csv para ir para o cabeçalho

Implementação de rastreamento de trajetória e movimento de vários veículos em tempo real com base no mapa vue + Baidu (jornada mental)

[Notas do artigo] Reparo de imagem MPRNet: Restauração de imagem progressiva em vários estágios com análise de código

ORACLE Um registro de um valor de campo é dividido em vários registros com ';'

Recomendado

Clasificación

Diario

Más

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)