Добавлено: Ср Окт 06, 2004 7:48 am Заголовок сообщения: Как писать оптимизированный текст - можно ли "содрать&q
Подскажите, как наиболее эффективно составить оптимизированный текст по ключевым словам?
Правда ли, что если текст "содрать" с чужого сайта, то Yandex его не
проиндексирует повторно? Как в таком случае составлять такой текст?
Писать самому или искать в печатных изданиях уникальный текст? А как тогда узнать уникален ли он? Вдруг такой же текст уже есть на другол сайте и на моём он проиндексирован не будет. _________________ Рассылка "Продвижение сайта. Профессиональные советы экспертов".
http://www.optimization.ru/subscribe/list.html
- - - - - - -
Вопрос в рассылку можно задать, написав письмо на subscribe@ashmanov.com
"Содранных" текстов - навскидку - больше половины содержания Сети. Есть хорошая статья Антона Санченко "Воровство как способ продвижения сайта" - http://www.optimization.ru/subscribe/005.html
Узнать, насколько уникален текст можно просто - ввести цитату из 3-5 слов в поле запроса поисковой системы. Чем больше в выдаче клонов - тем меньше уникальность. А вот онлайн-машинки для определения нечетких дублей, компилятов - не знаю.
Текст на Вашем сайте будет проиндексирован, даже это полная копия уже имеющегося в Сети оригинала.
Писать лучше самостоятельно, в этом случае уникальность обеспечиватеся автоматически. Если пишете что-то "техническое" без компиляции вряд ли удастся обойтись. В этом случае желательно не повторять орфографические ошибки оригинала и делать смысловые связки для кусков текста из разных источников. Ну, и "кажется", можно заменять на "может быть", "наверное"; "автомашину" на "автомобиль" и т.п. для достижения необходимой степени "уникальности".
Хотя может и не помочь. В статье главного разработчика Яндекса Ильи Сегаловича описывается метод, при помощи которого Яндекс обнаруживает копии.
- - - -
Очевидно, что с полными повторами проблем особых нет, достаточно сохранять в индексе контрольную сумму текста и игнорировать все остальные тексты с такой же контрольной суммой. Однако этот метод не работает для выявления хотя бы чуть-чуть измененных документов.
...
Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте!
Очевидно, что так можно определять процент перекрытия текстов, выявлять все его источники и т.п. Этот изящный алгоритм воплотил давнюю мечту доцентов: отныне мучительный вопрос «у кого студент списывал этот курсовик» можно считать решенным! Легко оценить долю плагиата в любой статье[9]. http://www.dialog-21.ru/direction_fulltext.asp?dir_id=15539
- - - - _________________ С уважением,
Андрей Иванов.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах