Toggle navigation
Text miner
Войти
Сравните необходимые файлы
Старый файл
Новый файл
Алгоритм
COSINE
JACCARD
DIFFLIB_RATIO
DIFFLIB_WITH_THRESHOLD
Фильтровать страницы из файла с очень коротким текстом
Страница должна содержать не менее
блоков ИЛИ не менее
слов
Минимальная степень похожести текста (от 0 до 1) (1 - максимально похожи)
Максимально разрешенная удаленность блоков для соединения блоков. Например, соединение двух блоков при разрыве страницы, когда один блок является продолжением другого. Между блоками на 2-ух страницах есть колонтитулы. 3 - означает, что между блоками должно быть не больше 3 блоков, иначе считается, что второй блок не является продолжением первого. Значение -1 означает любое количество блоков.
Без повторного прохода
Один дополнительный проход (в два раза дольше)
Два дополнительных прохода (в три раза дольше)
Степень грубости при сравнении блоков текста при дополнительных проходах (натуральное число (>0), чем больше, тем грубее сравнение, что иногда может дать лучше результаты)
Минимальная длина (количество символов) изменения (измененного текста), которое можно "откусить" от блока при повторном проходе.
Сравнить