- никто не знает, чего хочет пользователь
- никто не знает, какова должна быть идеальная выдача
По поводу этих вопросов я сейчас поделюсь своими размышлениями и постараюсь в какой-то мере на них ответить.
andre
Обобщая все те высказыания СЕО экспертов на данном форуме, которые я встречал, на тему что же должно быть в серпе, можно сделать заключение, что в зависимости от эксперта (его отраслевой принадлежности - кому-то нужны кейворды "по продажам", а кому-то "информационные"), а также в зависимости от целей юзера поисковика (которые априори неизвестны), в серче хотят видеть разные, порой диаметрально противоположные рузультаты. Поэтому, резюмируя, скажу, что в серче должны быть результаты нацеленные сразу на несколько групп (а то и на все, если это возможно) искателей. Т.е. в серче должы быть ссылки на все типы сайтов - как товаро-ориентированные, так и информационно-ориентированные.
Исходя из данной постановки вопроса, предлагаю следующую реализацию (её алгоритм).
Дабы удовлетворить потребностям всех групп искателей и всех групп сайтов, можно ввести квоты. Допустим исходя из имеющихся данных (о них далее) устанавливаются квоты по темам. Отношение каждого кейворда к определённой теме дело решаемое (поисковик создаёт базы данных тем, кейвордов и отношений между ними). Также создаются базы "ориентаций" сайтов на сегменты: товар, информация, другое. Понятное дело чем больше сегментов сайтов и больше тематик (и чем меньше в каждой из тематик кейвордов + с учётом того, что один вейворд может быть записан в несколько тем), тем больше вычеслительные нагрузки, на и качество серпа выше.
Рассмотрим случай с кейвордом "досуг". Тема для кейворда тоже "досуг".
В теме задаются следующие квоты:
1) Для сайтов "проституток" - 50%.
2) Для сайтов развлекательных (юмор, например - тот же мой сайт http://mlfun.org.ua) - 30%.
3) Прочие сайты, например фирм организующих развлекательные мероприятия (не связанные с проституцией) - 20%.
В зависимости от квот, при генерации серпа поисковик выводит количество сайтов в процентом соотношении на страницу, и при этом уже в пределах страницы сортирует их по релевантности, PR, ВИЦ и другим показателям (то что предварительно уже сайты соответствуют запросу в какой-то мере - по наличию кейвордов на страницы например - т.е. предварительная оценка релевантности - это понятно). В итоге как-бы получается двойная оценка релевантности, общая и тематическая (дабы выбрать из неё по квотам и уже после отсортироавать на странице массив серпа).
Также стоит упомянуть случай, когда сайтов в какой-то сегменте нету под свою квоту, например юзер зашёл на n-ную страницу серпа. В таком случае его квоту делят между собой оставшиеся сегменты сайтов и выводят в серп свои результаты (делить могу поровну на все оставшиеся в группе сегменты, или пропорционально "весовым коэфициентам" этих сегментов).
При этом 10 сайтов на страницу - это лишь частность. Есть поисковики по дефолту выдающие 15 или 20 сайтов в серпе (плюс есть ещё оплаченные результаты - о них я речи вообще не веду). Плюс пользователь в настройках поисковика сам может задать количество сайтов на сраницу серпа. Алгоритм работы по квотам будет свободно подстраиваться под количество сайтов на страницу.
В случае наших квот и при 10 сайтах на страницу поисковик выводит (пост-отсортировав):
5 сайтов - проститутки
3 сайта - юмор и развлечения
2 сайта - фирмы организующие развлекательные мероприятия
При этом квоты у нас динамические. Данные для квот у нас будут браться из данных по поисковым запросам - по многословным запросам. По ним, допустим по итогам месяца, будет раз в месяц проводится корректировка квот груп сайтов в пределах тематических групп (не по кажому кейворду, а по группам - т.е. все слова в группе будут получать установленные квоты, поэтому и корректировка будет проводитс яв пределах тематических групп).
Допустим у нас за прошлый месяц искали "досуг проститутки" и "проститутки" в 60% случаев, "досуг юмор" и "юмор" в 20% и "досуг праздник" и "праздник" тоже в 20% случаев в пределах данной тематической группы, то новые квоты у нас будут:
1) Для сайтов "проституток" - 60%.
2) Для сайтов развлекательных - 20% (-10% по сравнению с предыдущим месяцем).
3) Прочие сайты - 20%.
При этом, при использовании данного алгоритма, мы убиваем всех зайцев сразу - так как выдаём серп рассчитанный под разные категории пользователей поисковика. И каждый найдёт что-то для себя - каждый останется довольным (при этом учитывается динамика пользовательских предпочтений - если по данной группе кейвордов искали в основном "проституток", то значит таковы настрои искателей, и выдавать информацию теоритическую им не нужно, им бы практику сразу).
Здесь главное в погоне за несколькими зайцами не попасть в просак - не стоит повторять ошибок Голохвастова. Сделать всё с умом и с заботой о пользователях поисковика - и всё будет хорошо. Будет самый "релевантный" серп - и все будут довольны, как обычные юзеры, так и СЕО . _________________ MustLive/BPG Collections of Fun - Коллекции приколов
Ничего себе как всё трудно. Вернее много воды разлито. Не зря говорят: краткость сестра таланта. Поисковик просто должен отслеживать по досугу на какие сайты чаще всего кликали. Скорее всего это будут проституточные сайты, потом юмор и уже затем организация праздников. Организации праздников может в 10-ке и вообще не быть скорее всего, пусть фирмы продвигают свои ресурсы по более релевантным запросам.
Добавлено: Пн Июл 04, 2005 4:38 am Заголовок сообщения:
aids писал(а):
Поисковик просто должен отслеживать по досугу на какие сайты чаще всего кликали.
Этот принцип ранжирования один из самых старых и накручивается проще всего.
С целью "дабы удовлетворить потребностям всех групп искателей" согласен на 100%. Но квотирование в зависимости от объема спроса - идея очень спорная. "Досуг" не синоним "проституток".
- - - - -
По Далю:
Цитата:
ДОСУГ м. свободное, незанятое время, гулянки, гулячая пора, простор от дела. (На досуге, на досугах. в свободное от дела время.) Досуги мн. досуг, забава, занятия для отдыха, на гулянках, безделье.
- - - - -
По БСЭ
- - - - -
Цитата:
Досуг,
часть внерабочего времени, которая остаётся у человека после исполнения непреложных непроизводственных обязанностей (передвижение на работу и с работы, сон, приём пищи и др. виды бытового самообслуживания). Деятельность, входящую в сферу Д., можно условно разделить на несколько взаимосвязанных групп. К первой из них относятся учёба и самообразование в широком смысле слова, т. е. различные формы индивидуального и коллективного освоения культуры: посещение публично-зрелищных мероприятий и музеев, чтение книг и периодики, слушание радио и просмотр телевизионных передач. Другую, наиболее интенсивно развивающуюся группу в структуре Д. представляют различные формы любительской и общественной деятельности: самодеятельные занятия и увлечения (хобби), физкультура и спорт, туризм и экскурсии и т.д. Важное место в сфере Д. занимает общение с. др. людьми: занятия и игры с детьми, товарищеские встречи (дома, в кафе, на вечерах отдыха и т.д.). Часть Д. расходуется на пассивный отдых. Социалистическое общество ведёт борьбу за вытеснение из сферы Д. различных явлений "антикультуры" (алкоголизм, антиобщественное поведение и др.).
Если бОльшая часть по этому запросу ищет далеко не "игры с детьми" и "товарищеские встречи", то пусть проститутки первыми будут. Но зачем вытеснять ими предложения по темам
- общение
- афиши
- организация праздников
- активный отдых
- хобби
- клубы и рестораны
- отдых с детьми
- библиотеки
- программа телепередач
и др.
Любителям "жриц любви" по запросу "досуг" останется сделать лишь 1 клик по первой ссылке - уточнить запрос, а дальше им никакие библиотеки и хобби мешать уже не будут.
Но и сайты с девочками, в свою очередь, не должны мешать другим "досуговым" сайтам в выдаче по запросам, которые не относятся к ним явно. _________________ С уважением,
Андрей Иванов.
Зарегистрирован: 08.09.2004 Сообщения: 1059 Откуда: Москва
Добавлено: Пн Июл 04, 2005 7:55 am Заголовок сообщения:
Интересно сколько кликают в "досуге" по не проституточным сайтам. В топе, с первого по третье места, на девок жмут по 150-200 раз в сутки. Вопрос борьбы за запросы сайтов различных тематик очень интересен. Просто вот, например, взял оптимизатор и продвинул сайт с девками по запросам 15-20, начиная от проституток и заканчивая ночными бабочками (кстати, запрос с "бабочками" тоже может свести сайты различных тематик), по всем запросам наверхушке, естественно оптимизатор будет добавлять смежные запросы к продвигаемому сайту, особенно зная, что этот запрос принесет хотя бы человек 30 за день. Под удар попадаются, иногда, и случайные запросы: http://www.yandex.ru/yandsearch?text=%CF%E8%F2%E5%F0&stype=www - запрос Питер, половина выдачи опять в проститутках.
Добавлено: Пн Июл 04, 2005 8:51 am Заголовок сообщения:
aids писал(а):
Вопрос борьбы за запросы сайтов различных тематик очень интересен. Просто вот, например, взял оптимизатор и продвинул сайт с девками по запросам 15-20, начиная от проституток и заканчивая ночными бабочками (кстати, запрос с "бабочками" тоже может свести сайты различных тематик),
Угу. В результате такой "борьбы" вопросы со словом "детский" задавать уже немного страшно. _________________ С уважением,
Андрей Иванов.
И чего все прицепились к бедному "досугу". На этом примере надо показывать не испорченность выдачи, а закон обратной связи в действии. По запросу "детский досуг" ведь нет проституток в выдаче. _________________ Жизнь это школа, но я не спешу её закончить...
Вот мы говорили о серпе, и при этом зациклились на Яндексе .
Суть идеи: сравнение серпа разных поисковиков по выбранным кейвордам
У какого поисковика серп чище - более сбалансированнее выводит результаты? У кого менее загажен - менее "переоптимизирован"?
Очень интересный вопрос. Я так вижу никто этот вопрос не подымал и подобными исследованиями не занимался.
При желании можно в рамках форума провести мини исследование: нужно разработать список критериев по которым "будем судить" серпы, списко поисковиков и список кейвордов (а там можно разбить работу на нескольких людей). Также, при желании можно вынести это обсуждение в отдельную тему. _________________ MustLive/BPG Collections of Fun - Коллекции приколов
По этому кейворду вы уже видели серп в Яндексе.
9 из 10 порно (кроме номера 10).
Смотрим Гугл: серп
1 из 10 на тему секса (номер 4 - "Юмористический портал РУС-хумор...").
Т.е. у Гугла ситуакция диаметрально противоположная. Они что-ли с порнухой борятся?! И я так понимаю всё это на уровне алгоритма - ведб руками парится со всем Вебом никто не будет (это не Яндекс - даже с "одним рунетом" управится не может).
Так что Гугл в этом плане рулит явно.
Смотрим кейворд: досуг.
Яндекс.
Та же ситуация: 9 из 10 порно (кроме номера 8 - www.denegnet.ru).
Гугл.
Порно только №3 (dosug.org), №6 (abom.ru - в Яндекск №1) и №9 (http://www.lovenet.ru). Всё. №7 (www.mromance.ru) и №10 (http://www.dosugonline.ru) я к порно не отнёс (что вносит немного субъективизма в данное исследование, но субъективизм в вопросе чистоты серпа был изначально - ещё у Биг Босса andre).
Выходит: 3 из 10 порно.
Т.е. опять же Гугл выдаёт серп лучше.
Другого и быть не могло - так как я пользуюсь именно Гуглом . С 1998 по 2000 Яндекс был моим поисковиком №1. С 2000 таковым стал Гугл (и ему явно ничего не грозит в ближайшей перспективе), Яндекс же стал №2 - и ему уже ничего не светит. Ситуация с серпом - объективное тому подтверждение. Ламерит Яндекс - причём по жизни.
Но это лирика была.
А на деле выходит, что каждый из этих поисковиков имеет тенденцию к поляризации серпа. Один в одну сторону полярен - другой тянет в другую. Яндекс симпатизирует "товарному" серпу, Гугл "информатвному". Это лишь в случае данных кейвордов. В случаеи других кейвордов, результаты могут быть иными.
Поэтому обоим поисковикам нужно заюзать предложенный мною алгоритм - квот (желательно динамических) под разные сегменты поискового рынка по каждой из тематик.
И тогда серп будет содержать как тех (проституток), так и других (юмор, литература, отдых). В определённых пропорциях - причём не полярных (как в случае Гугла и Яндекса) - каждого сегмента по чуть-чуть. И все будут счастливы и каждый сможет найти то, что он ищет . _________________ MustLive/BPG Collections of Fun - Коллекции приколов
Я взял ключевое слово "досуг", так как о нём вёл речь Андрей (в теме "Гипотеза о "несправедливом" ранжировании" и ранее не раз в других темах).
Цитата:
На этом примере надо показывать не испорченность выдачи
Испорченность выдачи величина динамическая и контекстно-зависимая - в частности от контекста "поисковика" (и использованным им алгоритмов).
Это я показал выше на примере сравнения серпа Яндекса и Гугла.
Но то, что на одном "досуге" нельзя строить выводы - это понятно.
Нужно проводить исследования (а не в форуме перекидываться словечками - одному по душе одна выдача, а другому другая, а третьему не нравится мой стиль написания ).
С учётом "досуга", "рассказы для маленькой девочки" да и других кейвордов (исходя из опыта регулярного, ежедневного, поиска) - можно смело говорить о тенденции и о системе.
Системе того, что выдача хренеет из года в год. И мы подымаем (и подняли сейчас) один из больных вопросов современного поиско-вединия. И раз есть тенденция, раз есть факты загнивания серпа (на примере кейвордов - уже имеющихся, и тех которые будут найдены в результатах исследований "качества" серпа), то нужно и предлагать решения данной проблемы.
Я предложил свой алгоритм. Который решает проблему. Главное детально его прочитать (не поверхностно) и вникнуть в глубину решения (потому-то я его так детально и описал - хотя старался как можно лаконичней). _________________ MustLive/BPG Collections of Fun - Коллекции приколов
Я ещё прокомментирую ваш пост, просто нету времени
andre писал(а):
aids писал(а):
Поисковик просто должен отслеживать по досугу на какие сайты чаще всего кликали.
Этот принцип ранжирования один из самых старых и накручивается проще всего.
О кликак я вообще речи не вёл. Как я говорил, нужно читать внимательно, и не перекручивать мои слова.
Я ещё продолжу с вами разговор на эту (довольно интересную тему), но в другой раз, в связи с браком времени.
З.Ы.
Даже читать рассылку Андре, нету совсем времени. Вот ещё два последних номера лежат в инбоксе, два предыдущих прочитал на выходных - в нём то и была ссылка на форум сеочейз, где шёл разговор "о ранжировании" и заодно Андре упомянул о своей "любимой" проблеме - о чистоте серпа. Вот я и решил помочь (ему и всему миру ) разобраться с этой проблемой - причём кардинально. А то в который раз уже в форуме поднимается этот разговор (мне хватает времени только читать форум - писать же времени нету, особенно с моими объёмными месаджами).
Так как самого гнилой серп уже достал - причём давно. Вот помню в 1998, 1999, 2000, ну и может ещё в 2001 - такого загнивания серпа как сейчас небыло и в помине - искал и душа радовалась (от полученных результатов поиска) . Не то что сейчас. Явно "незапятнанных" кейвордов осталось мало (в частности однословных). Все сейчас ударились в коммерцию (нередко даже кейворды из 3-5 слов пестрят лишь одними "товарными предложениям", хотя тебя "шопинг" и не интерисует вовсе - всё зависит конечно от темы). _________________ MustLive/BPG Collections of Fun - Коллекции приколов
Добавлено: Пн Июл 11, 2005 12:10 am Заголовок сообщения:
При использовании моего алгоритма построения выдачи, также можно параллельно заюзать и кластеризацию (дабы ещё больше учесть все потенциальные сферы данного "нечёткого кейворда"):
http://clusty.com/search?query=MustLive
Хотя и без неё поисковая система использующая мой алгоритм довольно хорошо решает проблему серпа (как в случае "нечётких" кейвордов, так и вообще).
В случае кластеризации можно сделать в каждой папке "теме" вложенные "темы". При этом вложенность можно сделать более одного уровня (т.е. общая иерархия 2 и более уровня), как в случае Класти (в этой системе максимальный уровень иерархии = 3). В идеале вложенность тематик может быть бесконечной. Что даст пользователям возможность уточнять свой поиск до полной сатисфакции.
Процесс подсчёта связанных тем при запроссе конечно не должен быть чрезмерным, нескольких уровней вполне достаточно, но при каждом новом клике-запросе на тему, должны подсчитываться новые связанные темы (что сейчас в Класти не делается). _________________ MustLive/BPG Collections of Fun - Коллекции приколов
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах