Como montar cadenas utilizando espacios, reduciendo al mínimo la distancia de edición?

Barney:

Estoy buscando un algoritmo que se adapte a dos cadenas, llenándolos con espacios si es necesario para minimizar la distancia de edición entre ellos:

fit('algorithm', 'lgrthm') == ' lg r thm'

Hay seguro debe haber algún algoritmo escrito previamente para ello. ¿Algunas ideas?

Dani Mesejo:

Se podría hacer algo como lo siguiente:

def fit(target, source):
    i, j = 0, 0
    result = []
    while i < len(source) and j < len(target):
        if source[i] == target[j]:
            result.append(source[i])
            i += 1
        else:
            result.append(' ')
        j += 1

    return ''.join(result)


test = [('algorithm', 'lgrthm'), ('pineapple', 'pine'), ('pineapple', 'apple'), ('pineapple', 'eale'),
        ('foo', 'fo'), ('stack', 'sak'), ('over', 'or'), ('flow', 'lw')]

for t, s in test:
    print(t)
    print(fit(t, s))
    print('---')

Salida

algorithm
 lg r thm
---
pineapple
pine
---
pineapple
    apple
---
pineapple
   ea  le
---
foo
fo
---
stack
s a k
---
over
o  r
---
flow
 l w
---

Una versión tal vez mejor, es la siguiente:

from collections import deque


def peak(q, default=' '):
    """Perform a safe peak, if the queue is empty return default"""
    return q[0] if q else default


def fit(target, source):
    ds = deque(source)
    return ''.join([ds.popleft() if peak(ds) == e else ' ' for e in target])

Es mejor en el sentido de que no es necesario hacer un seguimiento de las variables de estado i, jcomo en el método anterior.

Supongo que te gusta

Origin http://10.200.1.11:23101/article/api/json?id=408696&siteId=1
Recomendado
Clasificación