Как не попасть в бан?
Навеяно топиком одного персонажа с сапофорума...
На форуме Сапы прозвучал вопрос:
а как делать говносайты (простите, сателлиты
), чтобы их не банили поисковики?
Вопрос отчасти наивный, отчасти серьезный, но тема для размышления есть, поэтому попробую обрисовать тактику сайтостроения в общих чертах. Я уже писал статью о том, что лучше не заниматься говномейкерством, а делать качественные сайты под сапу - преимущества очевидны. Но, коль уж тут такой конкретный вопрос: "как не залететь с говносайтами?", то будем искать способы.
При первом заходе поискового робота на сайт ему представляется следующая картина и данные для дальнейших действий (предположим, что первый заход совершен на морду сайта):
-
HTTP-заголовок, отданный сервером. Если заголовок отличен от кода 200 OK, то сайт пролетел с индексацией :) Отдельная ситуация с кодами 301 (Moved Permanently), 302 (Moved Temporaly), осуществляющие редирект на другую страницу в данном домене - в этих случаях робот скорее всего совершит заход на другую страницу и продолжит свою работу. Получив заголовок 304 (Not Modified) при первом заходе на страницу, робот проиндексирует ее.
- Размер документа. Страницу, менее 1Кб (приблизительная цифра!) робот Яндекса точно не станет индексировать. С Google мною такие эксперименты не проводились, но, логично предположить, с ним ситуация аналогичная. По крайней мере, я не наблюдал в индексе страниц, размер которых исчисляется байтами.
- Meta-теги. Наличие мета-тега reload однозначно отпугнет робота по вполне понятным причинам. Мета-тег noindex (не путать с
- Наличие тегов (для ПС Яндекс). Обилие тегов
Если в результате вышеизложенных проверок робот сочтет страницу
пригодной для внесения в поисковые индексы, то он приступит к
извлечению ссылок на другие страницы сайта. Не буду рассуждать, каким
образом извлекаются ссылки и осуществляется дальнейшая индексация сайта
- это уже тема для отдельной статьи.
Итак, предположим, что страница имеет ссылки на другие страницы. Интересно, а учитывается ли соотношение контента, состоящего из ссылок, к остальному текстовому/графическому контенту? На SEO-форумах частенько мелькают такие темы: "Мою доску объявлений забанили", "Мой каталог ссылок вылетел из индекса" и прочее. Поисковик не может однозначно определить, что из себя представляет сайт - доску или форум, блог или сайт фирмы, поэтому банить именно за то, что это доска объявлений или каталог ссылок, не могут. Проблему следует искать в структуре сайта, структуре отдельно взятых страниц и наличию какого-либо текстового контента, кроме ссылок на другие страницы. Думаю, понятно, что страница, на которой 5000 знаков в ссылках и 500 знаков в остальном текстовом контенте, не попадет в индекс, а эти самые ссылки не будут учтены.
Так почему же может вылететь сайт целиком? Ответ прост: много ссылок на морде, в том числе и внутренних, мало контента. Если контент еще и неуникален, то дальнейшее рассуждение "Почему?" не имеет смысла. Вылетит морда - вылетит весь сайт!
Создавая сайт, в первую очередь сделайте грамотную морду сайта - меньше ссылок, побольше уникального контента.
Добавив пару картинок, Вы облагородите облик сайта, а заобдно и дадите поисковику понять, что контент не сгенерирован, а размещался вручную.
Спонсор поста - http://oborudorg.info - продажа офисного оборудования.
Картинка в тему:
Часть контента добавляется пользователями сайта, автор не несет персональной ответственности за потоки сознания посетителей :)

