Вроде все случаи отработал. Убрал лишние пробелы между словами. Дубли не удаляются. Повторения могут быть в разных местах. В промежуточном списке остались только уникальные слова . Данные в исходном файле. рот s тор s тор тот торт о о тот тот тот тот s пот s пр топ