DS & ML_Utilice Excel para ordenar por fila y luego por columna, y finalmente resalte el valor repetido

Registre un problema de limpieza y clasificación de datos que acaba de resolverse con este método 'tonto'

Recibí el correo electrónico hace unos días y tuve algunas preguntas al probar el método de un artículo anterior. Encontré los siguientes problemas al reproducir:

Ahora tengo tres resultados, res1, res2 y res3, su estructura es básicamente la misma, todas son dos columnas:

N8	N84
N18	N4
N22	N64
N10	N17
...
M0P1 M0P2
...

Si no usa Python y solo usa Excel, ¿cómo encontrar los valores duplicados en los tres resultados? (N2-N1 se considera equivalente a N1-N2)

Mi forma estúpida (sin VBA)

Primero, ordene por el tamaño del número, luego ordene por columna de pequeña a pequeña, y finalmente concatene las cadenas. Luego, busque los valores duplicados en los tres resultados y resáltelos.

Primero, limpie los datos. Debido a que los datos al comienzo de M0P son solo M0P1 y M0P2, reemplacé directamente todos M0P1 con 1001 y M0P2 con 1002 (1001 se debe a que no hay un valor mayor que 500 en N *, por lo que 1001 puede garantizar la unicidad).

Luego, movemos la segunda columna hacia la derecha una columna, porque la columna vacante debe dividirse en columnas. Dividimos todos los N * en N y números mediante el asistente de columna de texto (datos-> columna). Si elige dividir por el "separador" de los datos y establece N como separador, puede extraer directamente el número (esto se puede ver en la vista previa de la ventana. Para obtener más detalles, consulte este tutorial de Microsoft ). Dado que M0P * se ha convertido en números antes, estos 1001 y 1002 no se moverán después de la clasificación; para estas dos columnas, realizaremos la operación de clasificación por separado, luego todos los números en N * estarán en una nueva columna El formulario aparece junto a la columna. Después de eso, siempre que todos los datos procesados ​​se devuelvan en dos columnas completas, nuestra limpieza de datos estará completa.

(Copyright © https://blog.csdn.net/s_gy_zetrov. Todos los derechos reservados)

Los datos ahora se ven así:

8	84
18	4
22	64
10	17
...
1001 1002
...

Después de eso, necesitamos ordenar por fila. Si hice este paso directamente, probé algunas soluciones, pero no funcionaron. A menos que use VBA, no se puede automatizar. Como tengo dos números por línea, podemos usarlos LARGEpara lograr un efecto de clasificación similar. Suponiendo que nuestra primera columna es la columna A de Excel, y la segunda columna es la columna B, =LARGE(A1:B1,2)podemos usarla para encontrar el =LARGE(A1:B1,1)número menor de los dos y encontrar el número mayor de los dos (consulte este tutorial de Microsoft para obtener más detalles : "Si n es el número de puntos de datos en un rango, luego LARGE (matriz, 1) devuelve el valor más grande y LARGE (matriz, n) devuelve el valor más pequeño ”).

Una vez completado este paso, los datos aproximados se vuelven así:

A   B    	C    D
8	84   	8   84
18	4  		4  18
22	64 		 22  64
10	17  	10  17
...
1001 1002 	1001  1002
...

Después de eso, ordenamos directamente la columna C (el valor mínimo de cada fila) por columna, y Excel nos ayudará a expandirnos a las cuatro columnas (Copyright © https://blog.csdn.net/s_gy_zetrov. Todos los derechos reservados):

A   B    	C    D
18	4  		4  18
8	84   	8   84
10	17  	10  17
22	64 		 22  64
...
1001 1002 	1001  1002
...

En el último paso, para comparar valores duplicados, necesitamos comprimir la columna CD en una columna, aquí es para usar la función de empalme =CONCATENATE(C1,"_",D1)y luego tirar de ella hasta el final para aplicar a todas las filas:

A   B    	C    D		E
18	4  		4  18	4_18
8	84   	8   84	8_84
10	17  	10  17	10_17
22	64 		 22  64	22_64
...
1001 1002 	1001  1002	1001_1002
...

Pegue los tres resultados en un archivo de Excel. Suponiendo que las columnas de las cadenas concatenadas son E, J, O, seleccione las tres columnas, seleccione "Formato condicional" -> "Repetir valor", y todas las cadenas repetidas son ¡Se destacará! (Consulte este tutorial de Microsoft para obtener más detalles ).

En este punto, el problema está resuelto. El método debería ser el más estúpido, pero la ventaja es que no requiere VBA y es para usuarios sin conocimientos de programación (Copyright © https: // blo friendly g.csdn.net/s_gy_zetrov. Todos los derechos reservados).

lo anterior.

(Copyright © https://blog.csdn.net/s_gy_zetrov. Todos los derechos reservados)


rastreador de visitantes


Supongo que te gusta

Origin blog.csdn.net/S_gy_Zetrov/article/details/108907360
Recomendado
Clasificación