Добавлено: Ср Авг 11, 2004 10:42 am Заголовок сообщения:
legat.... за такое банят. Но пока не забанили - мы этим пользуемся По айПи конечно лучше всего. Или по факту что робот скриптов не выполняет если лень вообще возиться. Или по юзер-агенту. На вкус. _________________ Золото | Реальность | Серебро | Gun auction
1) Какой именно IP ? Ну не может помоему у них быть всего ОДИН IP. Как именно его выделить ?
у каждого поисковика их (IP) много, очень...
legat писал(а):
2) А как по факту невыполнения скриптов ? Ява или VB ???
IMHO, Mauser написал про Javascripts (наверно про куку)
legat писал(а):
3) HTTP_USER_AGENT А это как ? Им влом добавить отправку этого параметра на хостер и данный параметр отсутствует ?
у всех роботов есть USER_AGENT
т.к. роботы работают по стандартам, то они обязаны его передавать
legat писал(а):
4) А если на странице расположить <div style="VISIBILITY: hidden;">Группа ударных кейвордов</div>
Такое проиндексируют ? И если нет, по причине невидимости, то наверное нет проблема сделать видимым, а потом скриптом скрыть по загрузке.
И как выделить НУЖНЫЙ IP ???
Подсеть всю накрывать чтоли ?
Цитата:
IMHO, Mauser написал про Javascripts (наверно про куку)
Так если кука не установлена, как это поможет ?
И как через проверку выполнения Ява скриптов сделать ? Они ведь уже не имеют отношения к серверу. Разве что Ява скрипт будет менять строку SRC у нулевого фрейма, а скрипт сервера ждёт несколько секунд запроса в этот нулевой фрейм. Но IMHO это кривой метод.
Цитата:
у всех роботов есть USER_AGENT
т.к. роботы работают по стандартам, то они обязаны его передавать
Тогда нет смысла его проверять. Значит Маузер что-то не то сказал. Или может ему неинтересно, чтобы ламеры взрослели и умнели 8-\
Последний раз редактировалось: legat (Вс Мар 25, 2007 2:47 pm), всего редактировалось 6 раз(а)
Добавлено: Чт Авг 12, 2004 1:22 am Заголовок сообщения:
legat Я все так сказал, это ты не так подумал
1. ip поисковиков. Идешь в логи. Ищешь тех кто назвался гуглем или яховским слурпом. Суешь эти айпи в хуиз датабейз и видишь кто собственних их. Если Google Inc, CA, то сам понимаешь... они . Весь этот диапазон направляешь куда тебе хочется.
2. скрипты. Яваскрипты. В том и цимус что происковик не выполняет скриптов (правда может попытатьсяих пропарсить), но... яваскриптовый редирект будет выполнен человеком и не будет поисковиком. То есть в корень ты кладешь дрвей, но в шапку его суешь яваскриптовый редирект на реальный сайт. Соответственно люди улетят туда, а поисковик нет. И да, куки тут совершенно непричем.
3. юзер-агенты. Если ты посмотрел на логи как я тебе советовал, то ты заметишь что паук всегда называется собой. соответственно юзер агент передае6тся в запросе еще, и ты можешь решать что отдавать тому или иному юзер агенту.
каждый способ имеет свои плюсы и минусы. Яваскрипт поще всегои может быть сунут на любой самый расбесплатный хост. Юзерагент прост, но некто может его легко подделать и выдать себя за поисковик вычислив чем ты кормишь пауков (и настучать на тебя например). По IP способ самый хороший (защищает даже от ревьюверов гугля отчасти), но самый трудоемкий в плане слежения за базой айпи. Они иногда меняются.
Зарегистрирован: 22.07.2004 Сообщения: 433 Откуда: Санкт-Петербург
Добавлено: Чт Авг 12, 2004 3:42 am Заголовок сообщения:
Mauser писал(а):
Кстати, пищу ты тоже предпочитаешь кем-то пережеванную?
Mauser, шеф-повар не жует пищу, он ее готовит, сервирует... Кстати, пост был на редкость полезный (для любознательных ла.. специалистов, вроде меня). _________________ Студия flash-анимации
Добавлено: Чт Авг 12, 2004 4:09 am Заголовок сообщения:
Мда... Полезная инфа для Эээ... Начинающих специалистов %)))
Тоесть делаем вывод: $HTTP_USER_AGENT не только может быть I-Explorer, Mozila, Netscape, Opera, Lynx и пр. Но он ещё может быть и Google Inc.
Вся суть вопроса к этому и сводилась Этого я не знал.
ЗЫ.
Маузер, я тут собираю Интернет Магазин небольшой такой. Можешь посоветовать, как поддержку сессии сделать ? Тоесть я делаю на Куках и в куке сразу содержимое корзины храню. ID товаров через двоеточие(
Это нормально ? И есть-ли альтернатива кукам в данном случае ?
Если их отрубят, как можно сделать накопление корзины ?
Добавлено: Сб Авг 14, 2004 8:35 am Заголовок сообщения:
Сделал поддержку сессий через сессии. Но теперь в строке адреса навечно поселился идентификатор сессии. Имя я ему поменял на ID но всёравно длина здоровая. Это плохо. В мануалах говорится, что если Куки включены, то идентификатор гасится там, но у меня почему-то он там не гасится, а всегда передаётся в строке заголовка. Как можно этот глюк победить ? Что-то очень простое до тупости, но я не знаю.
Определяется всё просто:
SESSION_NAME("ID"); session_start(); ... $_SESSION['enable']="1";
А передаваемые параметры, это уж слишком жестоко %)))
ЗЫ.
Прости Маузер, не в тему, но очень нужен ответ :-)))
Последний раз редактировалось: legat (Пт Мар 23, 2007 10:43 am), всего редактировалось 3 раз(а)
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах