Добавлено: Сб Июл 29, 2006 9:08 am Заголовок сообщения: Бизнес на воровстве
Два примера. Сайты http://www.midlehosting.msk.ru и http://www.businessobzor.info 100% текста "заимствованы", по длинной цитате из любого места несложно отыскать источники или перепечатки со ссылкой на источники. Сайты используются для оптимизаторских ссылок, в последнем случае нашел даже открытое предложение о продаже.
Т.е. имеем чистейший бизнес на воровстве. Примеры привел для наглядности, сайтов таких уже, думаю, тысячи, и я не осуждаю авторов этих сайтов: если есть возможность для заработка без особого риска, почему бы не зарабатывать.
Понятно, что интернету и поиску этот бизнес ничего хорошего не приносит. Поэтому вопрос такой - что, по вашему мнению, должны делать поисковые системы с такими сайтами. Варианты в опросе:
- ничего не делать
- ставить в непот-лист
- банить.
Кликните, пожалуйста, по более верному. Но буду очень признателен и за комментарии. _________________ С уважением,
Андрей Иванов.
Добавлено: Сб Июл 29, 2006 9:23 am Заголовок сообщения:
Это невозможно автоматизировать значит и банить не будут, откуда поисковику знать, кто владелец контента и кто у кого его утянул. _________________ Дешевые домены за Webmoney
Добавлено: Сб Июл 29, 2006 9:54 am Заголовок сообщения:
Drow писал(а):
Это невозможно автоматизировать значит и банить не будут, откуда поисковику знать, кто владелец контента и кто у кого его утянул.
Бан - процедура ручная. Определение дублей у поисковиков налажено довольно неплохо, поэтому, имхо, возможность автоматически определить и показать модератору, мол, на свежепроиндексированных вчера таких-то сайтах 99,9% контента не является уникальным, есть.
Далее тому только останется принять решение - в индекс или в бан. _________________ С уважением,
Андрей Иванов.
Ни один из вариантов не подходит.
Банить нельзя, потому как дублированный контент может быть благоприоретённым. Например, ресселер хостера наверняка часть материалов позаимствует у родительского хостера, причём владелец этих текстов может их сам выдать.
Непот-фильтр, т.е. полный неучёт ссылок с подобных сайтов тоже не логичен. По той же причине.
Ничего не делать тоже нельзя - в подобных сайтах можно захлебнуться.
Вывод - нужен некий понижающий фильтр как на сам сайт, так и на исходящие с него ссылки. У Гугля есть некие намётки на это, т.н. качество сайта. _________________ БолтоЛОГ, SEOBar
Добавлено: Вс Июл 30, 2006 6:03 am Заголовок сообщения:
AiK писал(а):
Ни один из вариантов не подходит.
Согласен, что это не все возможные решения. Поэтому для примера взял сайты, у которых попросту нет иного назначения, кроме как линкоподдержка и продвижение кого-то (и/или зарабатывание для кого-то), а также ни строчки собственного контента.
Но ты хорошо расширил вопрос. Тогда, на твой взгляд, в чем смысл существования в Сети дублированного контента? _________________ С уважением,
Андрей Иванов.
Добавлено: Вс Июл 30, 2006 7:37 am Заголовок сообщения:
непот. причём не на весь сайт а на конкретную страницу,
в случае 100% воровства получим 100% непот.
Есть ведь и вполне альтруистические причины для копирования контента - например чтобы он не пропал вместе с заброшенным сайтом, особенно это бесплатных хостингов касается. Можно сходу сочинить достаточно гуманное правило отправления в непот (с учётом ссылок на источник, например), но кто же под его обработку ресурсы даст...
Добавлено: Вс Июл 30, 2006 9:52 am Заголовок сообщения:
andre писал(а):
в чем смысл существования в Сети дублированного контента?
Я сначала подумал, что это ты ввернул словосочетание "альтруистическая причина". Был этим слегка озадачен
Тем не менее, и у тебя и у djatell'я мозги очень хорошо промыты импортными корпорациями, борящимися за бабло под соусом защиты авторских прав Изначально, сеть строилась для вояк и для учёных. И там проблемы дублирования контента не возникало. Помнишь мой совет, что делать, когда c сайта украли статью? Правильно - радоваться тому, что украли, т.к. плохое не воруют. Вот замечательная иллюстрация того, что дублированный контент это здорово: не так давно ты просил меня дать ссылку на rfc2616. А я тебе сказал - найди в Гугле. Дело в том, что ценность этого документа при копировании не теряется. И тебе безразлично, откуда качать этот документ с ietf.org или же с w3.org. Равно как с сотен других сайтов. Ежели не доступны по каким-то причинам первые два сайта, ты преспокойно скачаешь RFC с любого другого сайта и ни капли этому факту не огорчишься. Равно как и авторы этого документа.
Тут возникает соблазн сказать, мол это всё работает только в идеальном научном мире. А нифига подобного. Если ты хочешь купить, скажем, книгу, тебе абсолютно безразлично в каком из магазинов продаётся "оригинал". Более того, если вдруг поисковики начнут столь сильно бороться с дубликатами, что в выдаче останется только один магазин с этой книжкой, боюсь что ты особо не обрадуешься этому факту. А если остальные магазины начнут бороться с тотальной чисткой... меняя оригинальное название книги, то ты будешь недоволен вдвойне, т.к. уже не будешь знать, как найти нужную книгу! Утрирую конечно
Рассмотрю ещё один пример дублирования коммерческого контента.
Допустим, есть замечательный обзор хотя бы и принтеров (это не существенно). И его начинают копировать на всех магазинах оргтехники. Автору хорошо - его рекламируют. Производителям принтеров тоже хорошо по тем же причинам. Покупателям хорошо - они с большей вероятностью прочитают обзор. Плохо только тому, кто заказал этот обзор. Но тут надо не на поисковик пенять, мол он не подавляет дубликаты, а на себя: надо вставлять в обзор элементы, рекламирующие заказчика обзора: логотип в картинках, абсолютные ссылки на другие обзоры и т.д. Разумеется, я тут не рассматриваю вариант, когда имя автора обзора нагло выкинули и вставили своё.
Отмазка: автор оставляет за собой право не отождествлять в вышеидущем тексте местоимение "ты" и Андрея Иванова
Подытоживая: дублирование отличного контента всем наруку. Даже поисковикам, ибо как не ранжируй, а посетитель найдёт этот контент. Дублирование некачественного контента плохо всем. Чтобы отличить одно от другого придётся помучаться над автоматическим определением качества. И сайта и его контента. Должно быть что-то вроде этого: хороший контент на хорошем сайте это хорошо, плохой контент на плохом сайте - плохо, а плохой контент на хорошем сайте или хороший контент на плохом сайте это никак. _________________ БолтоЛОГ, SEOBar
Зарегистрирован: 31.05.2005 Сообщения: 1284 Откуда: Москва
Добавлено: Вс Июл 30, 2006 9:53 am Заголовок сообщения:
Вопрос некорректно поставлен. Поисковики никому и нечего не должны так как являются коммерческими предприятиями и созданы они не пользователями или сеошниками.
Другое дело - декларация своих целей. Например, Яндекс: "Яндекс индексирует сайты, созданные независимыми людьми и организациями. Мы не отвечаем за качество и содержание страниц, которые вы можете найти при помощи нашей поисковой машины. Нам тоже многое не нравится, однако Яндекс — зеркало Рунета, а не цензор."
С другой стороны: "Яндекс понимает релевантность как наилучшее соответствие интересам пользователей, ищущих информацию, что может в общем случае не совпадать с интересами авторов сайтов."
Насколько я понимаю, пока проблема (плагиата тоже) не станет критической для поиска Яндекс может ссылаться на пункт 3.1 совей лицензии, а при "широкой косьбе сайтов" на пункт 3.4.
Также не очень пока ясно, что такое плагиат. Подходить к этому понятию с представлениями эпохи книгопечатания - бред полный. Никто не может мне запретить перевести любую статью Аарона Уолла или Мэтта Каттса и повестить этот перевод (со ссылкой на первоисточник разумеется) на любом сайте, т.е. на этом форуме, у себя на блоге или сайте. Это плагиат или нет? С точки зрения "ублюдочных" законов - да, но ведь перевод-то сделал я сам! Тоже касается и перепечаток с других сайтов на родном языке. Очень все как-то расплывчато пока и оставляет лазейки как для откровенных воров, так и любителям "охоты на ведьм".
Кстати на многих статьях на сайте businessobzor.info авторы указаны.
Наиболее правильный подход в этом случае у Google. Разбираться кто прав, кто виноват - не его дело, но фильтры на дублирование контента работают.
Добавлено: Вс Июл 30, 2006 10:36 am Заголовок сообщения:
AiK писал(а):
Тем не менее, и у тебя и у djatell'я мозги очень хорошо промыты импортными корпорациями, борящимися за бабло под соусом защиты авторских прав
Вполне возможно. Но ты снова расширил тему.
"Правильно - радоваться тому, что украли, т.к. плохое не воруют". В данном конкретном случае авторам сайтов нет разницы, что заимствовать - это первое. Второе - они тоже борются за бабло. Т.е. очередной виток размышлений уже на тему "Чтобы отличить одно от другого придётся помучаться над автоматическим определением качества" - сюда пока лезть не хочется.
Аналогия с оффлайном простая. Я пользуюсь мобильником, чтобы звонить. Тем же мобильником может пользоваться другой человек и с той же целью. Но переход мобильника из рук в руки может произойти только, если другой купит у меня этот мобильник или я его ему подарю - это законно. Незаконные варианты - украсть и отобрать.
Тебе не кажется, что в инете тоже можно было бы сделать что-то подобное? Например, автор объявляет, что его контент:
- может брать любой без малейших обязательств (подарок);
- может брать любой с условием установки ссылки, кнопки, имени владельца и т.п. ("раздача пробников");
- может купить любой по такой-то цене за штуку.
Иные формы распространения контента - незаконны, со всеми вытекающими (допустим, что "вытекающие" легко обеспечить) .
Хороша или плоха такая постановка задачи? _________________ С уважением,
Андрей Иванов.
Зарегистрирован: 31.05.2005 Сообщения: 1284 Откуда: Москва
Добавлено: Вс Июл 30, 2006 10:54 am Заголовок сообщения:
Цитата:
Например, автор объявляет
тут еще целая куча подводных камней начиная с того, что в разных зонах инета разные правила игры и заканчивая тем, что понятие "сослаться" тоже весьма расплывчато
Добавлено: Вс Июл 30, 2006 11:08 am Заголовок сообщения:
Цитата:
Аналогия с оффлайном простая. Я пользуюсь мобильником, чтобы звонить.
Вот по тому, как ты выбираешь аналогию я иделаю вывод про промывку мозгов Почему бы тебе не взять за отправную точку, скажем, знания? У меня есть знания (допустим, как вычислить орбиту астероида по короткой дуге наблюдений) и я ими с тобой поделился. От этого знаний у меня не убыло.
Мне лениво лопатить законодательство, но я точно помню, что где-то присутствуют слова про свободу распространения информации. В конце концов, твоя позиция имеет в пределе запрет на существование поисковой системы, поскольку поисковик тоже дублирует чужой контент _________________ БолтоЛОГ, SEOBar
если я из вредности чуть-чуть подправлю текст RFC, выложу его у себя без ссылки на "откуда взял".... а кто то наивный сделает по моему тексту и будет удивлён что ничерта не работает?
или без умысла - просто RFC обновился, а мне было лень проверять... в этой каше именуемой интернетом на любой пример можно найти контпример
последний случай кстати сплошь и рядом встречается
djatell, извратить можно любую идею. Например, на основе RFC дор сделать. Раньше так и делали, в последнее время не замечал ибо мне и в голову не приходит искать технические тексты Яндексом
А RFC просто так не обновляется. Т.е. он обновляется всегда существенно и всегда при этом меняется номер документа. _________________ БолтоЛОГ, SEOBar
У меня есть знания (допустим, как вычислить орбиту астероида по короткой дуге наблюдений) и я ими с тобой поделился. От этого знаний у меня не убыло.
А поделись со мной знаниями, как можно набрать ссылок в западном инете, чтобы хорошо двинуть сайт в Гугле! Эта идея, мол, я тебе информацию дал, в итоге у меня не стало меньше, а у тебя стало больше - только одна сторона монеты. Есть и другая. _________________ С уважением,
Андрей Иванов.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах