Добавлено: Пт Ноя 03, 2006 8:50 am Заголовок сообщения: Авторское право и поисковики, оригиналы и дубли
Хочется порассуждать не о судебных исках к грандам, связанных с авторским правом, а о том, могут ли поисковики контролировать его соблюдение.
Подавление нечетких дублей - одна из задач, которую решает Яндекс. Между тем, он традиционно старается не ввязываться в вопросы авторского права, потому что тогда придется из сферы алгоритмов переходить в сферу юристпруденции. Гарантий же, что подавлены именно дубли, а не оригиналы, никто сейчас дать не может.
Недавно проскользнуло сообщение, что чем-то подобным стал заниматься Гугль. Я имею ввиду так называемые supplemental results
Здесь же прошу высказаться по вопросам:
1) имеют ли поисковики к этому отношение, или это не их задача
2) как можно отличить оригинальный текст от дубля
Добавлено: Пт Ноя 03, 2006 9:42 am Заголовок сообщения: Re: Авторское право и поисковики, оригиналы и дубли
spark писал(а):
Здесь же прошу высказаться по вопросам:
1) имеют ли поисковики к этому отношение, или это не их задача
2) как можно отличить оригинальный текст от дубля
Про отличия оригинального контента говорили много, но рискну еще раз предложить простенький алгоритм. Пусть речь идет о текстах, на которые может распространяться закон об авторском праве (реплики на форуме и рекламные объявления к таковым вряд ли относятся).
- Текст не может быть анонимным. Публикация анонимного текста при соответствующей жалобе приводит к бану. Т.е. у любителей "републикаций" выходов только два: а) либо договариваться с авторами о легальной републикации, б) подделывать авторов, например, реальный автор Петров, а в "републикованном" материале указано, что Иванов. Это может вызвать прецеденты.
- авторство в инете устанавливается по дате первой публикации. Если поисковик проиндексировал первой перепечатку, автору придется доказывать свои права уже не в поиске, а в реальном суде. Поисковик лишь выполнит решение суда.
Может, утопия, но это лучше, чем ничего. Yukko недавно даже схему предложил, как проверить легальность републикации.
Теперь второй вопрос, который первый - дело это поисковиков или не дело - лезть в авторские споры. По идее, не дело, потому что, вроде как, у них совсем другие задачи - обеспечивать контакты юзеров с поставщиками информации, при этом поисковик не волнует, "лицензионная" ли это информация или "контрабандная", лишь бы качественной была, и юзеры оставались довольны.
С другой стороны - количество недовольных авторов, на труде которых умудряются подниматься более смыслящие в инете "зароботчики" становится все большим. И тут уж как в поговорке, один плюнет умоешься, а тысяча - утонешь. Имхо, поисковикам все же придется подключаться к этому процессу, т.е. "интернетовская вольница" со временем уйдет в прошлое и уступит место законам. _________________ С уважением,
Андрей Иванов.
Не вдаваясь в вопросы, зачем им это нужно, могу констатировать, что поисковики - единственные, кто что-то может сделать в вопросах авторства.
Мне были известны ряд инициатив веб-мастеров, предлагавших какие-то процедуры регистрации авторских прав и т.п. Но ни одна из них не получила большого распространения.
А вот если четкие правила сформулируют Гугль или Яндекс, с этим будут считаться все веб-мастера.
Зарегистрирован: 30.04.2006 Сообщения: 255 Откуда: Москва и окрестности
Добавлено: Вс Ноя 12, 2006 2:13 am Заголовок сообщения:
spark писал(а):
Не вдаваясь в вопросы, зачем им это нужно, могу констатировать, что поисковики - единственные, кто что-то может сделать в вопросах авторства.
Мне были известны ряд инициатив веб-мастеров, предлагавших какие-то процедуры регистрации авторских прав и т.п. Но ни одна из них не получила большого распространения.
А вот если четкие правила сформулируют Гугль или Яндекс, с этим будут считаться все веб-мастера.
Да уж, считаться придётся.
Но важно, чтобы эти правила были правильными.
А, скажем, устанавливать авторство по дате индексации поисковиком...
Опубликовано может быть раньше, а проиндексировано позже - такое ведь возможно, не правда ли?
А выпадения сайтов из индекса разве не случаются?..
Добавлено: Пн Ноя 13, 2006 9:26 am Заголовок сообщения:
Случается и такое. Но давайте представим, что в форме добавления URL предусмотрена графа "автор", и все, кого это волнует, первым делом графу эту заполняют, едва текст выложен в сети.
чтобы робот поисковой системы получал необходимые признаки авторства сам благодаря ACAP. В деталях может содержаться информация о том, как может быть использовано содержимое.
Пилотный проект ACAP будет запущен после 2006 года и планируется, что он проработает 12 месяцев.
Google и Yahoo! пока никак не комментировали этот проект.
Случается и такое. Но давайте представим, что в форме добавления URL предусмотрена графа "автор", и все, кого это волнует, первым делом графу эту заполняют, едва текст выложен в сети.
Поддерживаю целиком и полностью. Но здесь есть одно "но" - а как быть с материалами, которые выкладываются на сайт уже после того, как прошла регистрация сайта в поисковике?
Как вариант может быть следующее (вариант гиморный, но другой пока не придумывается) - при добавлении очередного материала на сайт информация о добавленном материале, его авторе и дате добавления на сайт по желанию автора отправляется в спецслужбы основных поисковиков и там складируется в виде некоего архива. В случае возникновения спорной ситуации, делается запрос в эту службу, данные извлекаются из архива и вопрос проясняется. _________________ Мы знаем толк в сайтах
Yukko недавно даже схему предложил, как проверить легальность републикации.
практика показала, что и это несколько нереально будет... Кто не понял, о чем я: http://seochase.com/viewtopic.7256.html Т.е. реально будет работать только с "брендовыми" статьями, когда все знают, где находится оригинал и кто автор. Все остальное, и я с этим столкнулся, обходится.
Обходится это благодаря техническому прогрессу или большому трудолюбию. Люди усиленно начали меняться статьями (только ко мне на размещение приходит по 5-10 в день), для того, чтобы поисковики не начали клеить дубли, статьи переписываются, причем я подозреваю, что практически на автомате.
Среди тех, кто предлгает услуги публикации статей, были замечены люди с отличной технической новинкой: синонимайзер
И судя по всему я уже видел результат работы этого зверя... Впечатляет
Конечно, им управляет человек, кое-что подправляет, немного дописывает кое-где, но судя по неофициальным описаниям ТТХ, до 500 человекочитабельных статей на основе двух авторских в приемлемые сроки получить можно.
Те статьи, которые мне присылают, я просто перечитываю, и вижу, что уж очень смысл похож на то, что я недавно читал, бегло пошарил по архиву, статью не нахожу, воткнул пару запросов в поисковик, тоже не нахожу, потом начал вручную просматривать каждую статью, присланную мне. Нашел!
Если не проводить смысловой анализ, а именно попытаться найти одинаковые предложения, фразы достаточной длинны, чтобы сказать, что это дубль, то найти сложно, но смысл один в один, что и в оригинале.
Также у kevindark'a в одном из сообщений проскакивало, что у него есть замечательная программка, которая на основе определенной логики, скормленного в нее материала и под контролем человека выдает вполне осмысленный текст, я просил руцями помацать, но он не дал.
Эх... если бы еще стилевой. Наткнулся вот на труды "SEO-копирайтеров" (черт знает, может, это и какой-нибудь полуавтомат накатал). Сижу, чуть не плачу.
Цитата:
Вы решились заказать шкаф-купе, корпусную или встроенную мебель? Вы сделали правильный выбор! Встроенная мебель, шкафы-купе, корпусная мебель — идеальный современный выбор для Москвы.
Вы особенно почувствуете разницу, если меняете старую, громоздкую бабушкину мебель, купленную во второй половине прошлого века на современную корпусную мебель заказ или шкафы-купе, которые органично и согласно вашему дизайну, впишутся в интерьер. Заказ шкафа-купе, или корпусной мебели позволят вам выделить для встроенной мебели ровно столько места, сколько хотите вы.
____________________________________-
irfas regt - это сочетание, которое вы получаете, набирая "шкафы-купе" в поисковой системе, не переключась на русскую транскрипцию. )) Мы предлагаем услуги по созданию дизайна"irfas regt", изготовления "irfas regt", доставки "irfas regt", и сборки "irfas regt".))
_____________________________________
Мы предлагаем вам встроенную мебель, шкафы, корпусную мебель любой конфигурации и ограничиваем ваш заказ только вашей фантазией и возможностью современных технологий мебели. Корпусная мебель на заказ поможет вам задействовать всё "нерабочее" пространство вашей спальни, гостиной, кабинета, библиотеки или прихожей: ниши, углы, простенки, подпотолочное пространство - всё это превратится в необходимые вам шкафы-купе, стеллажи, мебельные стенки и антресоли.
угу, а поисковик хавает (С) и ссылки с таких статей учитывает
Знаю. Только "во многия знания многия печали, и умножающий познание умножает скорбь" (С) В конечном счете все это хаваем и мы сами. _________________ С уважением,
Андрей Иванов.
Добавлено: Вс Ноя 26, 2006 12:05 am Заголовок сообщения:
Цитата:
В конечном счете все это хаваем и мы сами.
ну... не в больших количествах в принципе:
1 уникальный заход в день на одну опубликованную статью.
Да и многое зависит от владельца сайта, который эти статьи публикует. У меня такое (особенно, как выше было приведено) не проходит; у меня жесткая цензура, репрессии в виде правок HTML-кода и текстов, а у кого-то добавление на автомате практически без модерации со всеми вытекающими отсюда выводами и последствиями.
Зарегистрирован: 31.05.2005 Сообщения: 1284 Откуда: Москва
Добавлено: Вс Ноя 26, 2006 3:50 am Заголовок сообщения:
Процесс поиска дублей статей можно немного автоматизировать.
Только не шинглами
На одном форуме набрел на интересную мысль использовать для поиска дублей статей методы криптографии, цепей маркова и нейроцепей.
Вообщем, потом сам стал вспоминать: действительно используя алгоритмы хеширования и цепи маркова, можно дать некоторому тексту некоторое число. При совпадении или очень близком значении этих оценок у текстов можно утверждать, что тексты несут примерно одну и туже информацию (не смысл).
про смысл текста я ничего не писал, потому что не знаю что это такое.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах