Наиболее распространены следующие:
- марковские цепи — статистический метод для создания страниц с бессмысленным и бессвязным текстом на базе коллекции тематических текстов и списка ключевых слов. Он позволяет без человеческого участия генерировать десятки и сотни тысяч страниц с уникальным для поисковых роботов контентом. Тексты локально похожи на естественные (на уровне соседних слов), что затрудняет их распознавание как спам поисковыми машинами;
- синонимайзеры — программы для создания десятков уникальных текстов из одного посредством замены слов на их синонимы. В готовых текстах встречаются словосочетания, чуждые для естественного языка, например, «по юбке встречают», «друг от товарища» и т.д.;
- склейка сниппетов из поисковой выдачи по целевым запросам;
- парсинг RSS-лент;
- машинный перевод с одного языка на другой.
Созданные страницы перелинковываются между собой и, реже, с другими дорвеями вебмастера. Некоторые доргены способны во время запроса, динамически, создавать страницы или сайты, сочетая их с таким приёмом, как клоакинг, другие генераторы создают статический набор HTML страниц.
Основные функции генераторов дорвеев:
- локальное создание сайтов и автоматическая заливка по ftp;
- получение ключевых слов и исходного текста из файлов;
- генерация контента на базе исходного текста;
- выделение ключевых фраз заданными тегами;
- регулирование процента вхождения ключевых слов на странице;
- создание названий сгенерированных страниц (с помощью транслитерации ключа, нумерация и др.);
- генерация страницы по заданному шаблону, в т.ч. пользовательскому;
- перелинковка созданных страниц;
- создание карты сайта и другие.