Алгоритм автоматической покупки ссылок
24 мая 2014
Само по себе слово “качество” достаточно расплывчато, следственно нормализуем условие задачи.
Нормализованная цель задачи — из X доноров предпочесть N набравших огромнее баллов. Причем N задается неявно оптимизатором, как число денег желаемых потратить на запрос.
Еще больше упрощенно задача выглядит так — система должна из 2-х доноров предпочесть тот, что отличнее.
Покупка проходит в три этапа.
Этап 1: Сеошник создает фильтр в бирже удовлетворяющий его предпочтениям и задает бюджет.
Грубо говоря, скажем сеошник указал приобрести ссылки от 2 до 5 рублей, с бюджетом 30р на данный запрос.
Этап 2: Программа получает ссылки предложенные биржой через api и фильтрует полный хлам.
Я использую следующие фильтры:
1) Проверка на GBL из прошлого навыка проверок
2) Страница проходит проверку YAP и GOP
3) Отсеиваем сайты где страниц по yandex<80
4) Отсеиваем по stop-словам url и текст донора. (любые варезники, попандеры, pron-тематику, дипломы и т.д.)
5) Делаем перепроверку на BL (число исходящих ссылок) и удаляем >3
6) удаляем страницы с числом внутренних ссылок >150 и <5
7) удаляем страницы с числом чистого текста <500 символов (текст без html внутри body)
8. удаляем сайты с заспамленностью >100% (отношение числа исходящих ссылок с домена к числу страниц в индексе яндекса)
Этап 3: Из того что осталось вычисляем по формуле сколько баллов наберет всякий донор и скупаем набравшие огромнее каждого балов рассматривая лимитация по максимальному расходу средств.