Gap (Bioinformatik)

Ein Gap (engl., zu deutsch: Lücke) bezeichnet in der Bioinformatik eine Lücke oder Leerstelle in einer Sequenz, insbesondere beim Sequenzalignment. Ein Gap bedeutet, dass an der entsprechenden Stelle in einer verwandten Sequenz ein weiteres Element steht.

Es ist meist nicht bekannt, welche Sequenz evolutionär älter ist, also durch welche Art der Mutation die Sequenz verändert wurde. Bei einer Insertion wäre ein Element an der Stelle, an der sich jetzt das Gap befindet, eingefügt worden, bei einer Deletion wäre umgekehrt ein Element gelöscht worden, was zum Gap führt. Aufgrund dieser beiden Möglichkeiten werden Gaps auch als indels bezeichnet.

Verwandte Begriffe sind GOP (gap opening penalty), womit die Kosten für das Beginnen einer Lücke bezeichnet werden, und GEP (gap extension penalty), womit die Kosten für das Erweitern einer Lücke bezeichnet werden.