Проверка уникальности текста шинглами по яндексу

Надоело искать нормально работающие программы для проверок текстов на предмет уникальности, пришлось всё написать самостоятельно. Захотелось поделиться с Вами своей наработкой. Скрипт не сложный, в его состав входят две основные функции: подготовка и анализ текста. Алгоритм работы состоит в разбивке текста на предложения, затем происходит разбиение предложений на паттерны, паттерны в свою очередь могут иметь перекрытия на любое заданное количество слов. По текстовой части это всё.
Для упрощения собственной жизни и для того чтобы исключить попадание на защиту от ботов и парсинга, будем усложнять работу их партнёров по поиску. Если более точно выразиться то не партнёров, а партнёра т.к. пробивка по базе Яндекса достаточна для моих целей.

Этот скрипт лучше всего запускать на собственном локальном сервере, который предварительно настроить на длительное выполнение php скриптов. Необходимые настройки, как правило, можно отыскать в php.ini. В этом файле увеличиваем параметр max_execution_time до нужного, к примеру, max_execution_time=600 секунд.

Сам скрипт, здесь

[author_infos]

rikuz

Несколько слов об авторе rikuz

Сайт предназначен для сравнения текстов на схожесть. Этот сайт незаменим в помощи копирайтерам. Сайт лёгок в управлении, разберётся даже маленький ребёнок. Инструкция написана доступным языком. Каждый копирайтер будет счастлив, найдя этот сайт:)
http://utext.rikuz.com/

Пока молчат

Leave A Reply

You must be logged in to post a comment.