Barney:
Estoy buscando un algoritmo que se adapte a dos cadenas, llenándolos con espacios si es necesario para minimizar la distancia de edición entre ellos:
fit('algorithm', 'lgrthm') == ' lg r thm'
Hay seguro debe haber algún algoritmo escrito previamente para ello. ¿Algunas ideas?
Dani Mesejo:
Se podría hacer algo como lo siguiente:
def fit(target, source):
i, j = 0, 0
result = []
while i < len(source) and j < len(target):
if source[i] == target[j]:
result.append(source[i])
i += 1
else:
result.append(' ')
j += 1
return ''.join(result)
test = [('algorithm', 'lgrthm'), ('pineapple', 'pine'), ('pineapple', 'apple'), ('pineapple', 'eale'),
('foo', 'fo'), ('stack', 'sak'), ('over', 'or'), ('flow', 'lw')]
for t, s in test:
print(t)
print(fit(t, s))
print('---')
Salida
algorithm
lg r thm
---
pineapple
pine
---
pineapple
apple
---
pineapple
ea le
---
foo
fo
---
stack
s a k
---
over
o r
---
flow
l w
---
Una versión tal vez mejor, es la siguiente:
from collections import deque
def peak(q, default=' '):
"""Perform a safe peak, if the queue is empty return default"""
return q[0] if q else default
def fit(target, source):
ds = deque(source)
return ''.join([ds.popleft() if peak(ds) == e else ' ' for e in target])
Es mejor en el sentido de que no es necesario hacer un seguimiento de las variables de estado i, j
como en el método anterior.