Добавлено: Вт Янв 08, 2008 11:30 am Заголовок сообщения: Из индекса выпали почти все страницы загруженные Яндексом
Вот что показывает сервис webmaster.yandex.ru по большому информационному портальному сайту:
- число загруженных страниц: 125785
- страниц попавших в поисковый индекс: 517
- число страниц ошибками: 38783
Как видно очень мало страниц в индексе, почти все выпали.
Случилось это примерно после введения нового алгоритма.
Не понимаю по какой причине из поискового индекса выпало более половины загруженых страниц (известных Яндексу, за исключением страниц с ошибками)?
Хостинг работает нормально, заголовки (код 200) и кодировка отдаются корректно, т.е. технических проблем не наблюдается, около половины всех страниц (т.е. те, что отмечены Яндексом с ошибками) специально мной заданы отдавать ошибку 404 или запрещены в robots.txt, как малоинформативные или дубликаты (печатные версии, формы и т.п.).
Информация не парсится (не воруется), размещают контент либо сами пользователи, либо я пишу и наполняю сам руками.
И я бы не сказал, что почти все страницы дубликаты и склеены, какую-то часть конечно допускаю, но не в таком огромном количестве.
Есть подобные конкурентные сайты с аналогичным контентом, но у них почти все страницы из загруженных Яндексом участвуют в поисковом индексе.
Подозрения (маловероятно конечно): на большинстве страниц присутствует php-код Бегуна (НЕ стандартный JS-код) с прямыми ссылками на click01.begun.ru/click.jsp... (до 5 ссылок на странице), который закрыт тегами <noindex>.
В остальном сайт белый и пушистый, нарушений нет.
Пользую host-tracker.com плюс периодически отслеживаю серверные логи, есть прога-скрипт для фиксирования серверных проблем. Да и в webmaster.yandex.ru видно было бы соответствующие серверные ошибки.
Вообщем дело не в хостинге.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах