:, \s+\1\b)+. Der exakt gleiche reguläre Ausdruck ohne Kommas wäre: \b(\w+)(? :\s+\1\b)+ (könnte für andere Benutzer nützlich sein). Wenn Sie eine Regex speziell für nur zwei doppelte Wörter (Doppelwörter) wünschen, verwenden Sie diese Regex: (\b\w+\b)\W+\1. Entfernen Sie alle doppelten Zeilen aus einem Text. Fügen Sie diesen regulären Ausdruck in das Feld Ersetzen durch ein, um ein Vorkommen des Wortes beizubehalten (andernfalls werden alle wiederholten Wörter entfernt): ${1}. Diese regulären Ausdrücke beheben eine Situation wie die, die Sie in Ihrer Frage als Beispiel beschrieben haben. Der erste reguläre Ausdruck funktioniert für jede Anzahl doppelter Wörter (z. dangerous, dangerous, dangerous, dangerous, hazardous), während die zweite Version nur für zwei doppelte Wörter (z dangerous, dangerous, hazardous. ) funktioniert. Hinweis: Der reguläre Ausdruck wird nur auf das Format gelten in der Frage beschrieben, was bedeutet, dass Formate wie two words, two words, anotherword, two-words, two-words, anotherword, three words expression, three words expression, anotherword nicht geändert werden, da die Regex nicht für sie gelten.
Wenn Sie die Reihenfolge der Elemente innerhalb einer Liste nach dem Entfernen der doppelten Elemente nicht beibehalten wollen, dann können Sie eine Set -Datenstruktur verwenden. Wenn Sie die Reihenfolge der Elemente innerhalb einer Liste beibehalten wollen, nachdem Sie doppelte Elemente entfernt haben, dann können Sie etwas namens OrderedDict verwenden. Entfernen von Duplikaten aus einer Liste mit der Funktion set() in Python Um Duplikate aus einer Liste zu entfernen, können wir eine andere Datenstruktur namens Set verwenden. Doppelte Zeilen entfernen. Ein Set ist ein ungeordneter Datentyp, der nur eindeutige Werte enthält. Die Reihenfolge, in der ein Set die Werte speichert, unterscheidet sich von der Reihenfolge, in der Sie die Elemente in ein Set eingefügt haben könnten. Sets werden mit geschweiften Klammern {} dargestellt. Wenn Sie also die in der Menge gespeicherten Elemente ausgeben, wird die Reihenfolge der Ausgabe anders sein. Das ist der Grund, warum eine Indizierung nicht auf einer Menge durchgeführt werden kann, weil sie ungeordnet ist.
Je umfangreicher eine Tabelle ist und je mehr Mitarbeiter an ihr arbeiten, desto höher ist die Wahrscheinlichkeit, dass es zu Dubletten kommt. Unabhängig vom Alter Ihrer Excel-Version haben Sie die Möglichkeit, Datensätze gezielt nach doppelten Werten zu durchsuchen, sich diese anzeigen zu lassen und sie zu löschen. Duplikate mit Notepad++ entfernen - Der Pixelfriese. In neueren Versionen gibt es dafür einen eigenen Menüpunkt, in Excel 2003 funktioniert es über den Spezialfilter. Vergessen Sie jedoch nicht, die zu löschenden Inhalte genau zu überprüfen und vorher eine Sicherheitskopie anzulegen, um keine wichtigen Daten zu verlieren!