Зарегистрирован: 20.02.2005 Сообщения: 308 Откуда: город Ногинск Московская область
Добавлено: Чт Дек 01, 2005 2:07 am Заголовок сообщения:
Все совмещается в одном измерении, если это необходимо. По недвижимости у меня не стояла задача отделить контент от ссылок.
Правда надо учесть, что отдельное измерение - это серия из примерно 100-400 запросов к Яндексу (в зависимости от точности получаемого ответа). Если полный алгоритм Яндекса - итерационный хотя бы в небольшой степени, то без самого Яндекса обойтись сложно. Измерение идет итерациями от запроса к запросу. По мере необходимости к запросу подключаются отдельные слова, отсутствующие в ссылках и их комбинации. Для учета ссылок и контента по отдельности надо мерять с максимальной точностью. Особенно для оптимизированных сайтов, так как там ссылочная составляющая не то что преобладает, а просто подавляет все остальное. Тем не менее, точности хватает, чтобы и это измерить. По полученным данным строится линия тренда, два направления которой дают по отдельности ссылочный вклад (суммарный по сайтам со ссылками) и контента.
Пока вклад безтекстовых ссылок считается за вклад контента. Для измерения этого вклада сейчас отлаживаю методику.
Если же в ссылке разместить достаточно уникальное слово в дополнение к основному тексту, то все настолько упрощается, что просто становится элементарной операцией.
Эта технология выгодна, если:
1. Сайт, размещающий ссылки на своих страницвх, хочет доказать заказчику, что ссылка с его страниц очень выгодное предложение.
2. Покупатель ссылки уверен, что его деньги за ссылку тратятся не зря.
3. Система сайтов разрабатывает схемы оптимальной линковки своих ресурсов для максимальной отдачи от своих ресурсов для продвижения своих клиентов (оптимизаторские фирмы, использующие собственные ресурсы) и раскрутки самой себя (в отличие от барона Мюнхаузена с его болотом, в физике, математике и загрузке Windows это вполне возможно(bootstrap)). _________________ У Миныча Рекламное интернет агентство # Агентства недвижимости городов Московской области # ИС Региональная промышленность
Добавлено: Чт Дек 01, 2005 10:03 am Заголовок сообщения:
Мдя. Красивые картинки, красивые правильные графики. Вспомнились, аспиранские годы, когда всем скопом мы помогали написать кирпич диссера одному аспиранту и подгоняли его аналитику и алгоритм под результаты эксперимента, чтоб погрешность не была слишком большой.
Миныч, все это, конечно интересно. Я допускаю, что Вы довольно серьезно изучили вопрос определния текствоых критериев релевантности, и даже что-то довольно точно можете считать.
Но текстовые факторы довольно слабы по сравнению с ссылочными.
И похоже с ссылочными критериями, начинается та самая подгонка "под результат".
Во-первых, вообще неясно о том, считаете ли Вы статический ранг документов (а он есть и используется при ранжировании).
Во-вторых, вроде бы из контекста Ваших сообщений следует, что Вы каким-то образом пытаетесь оценить вклад текста ссылок. Однако, совсем непонятно как. И тут я не нашел ничего, что могло хоть как-то пролить свет на это, как в случае с довольно подробным описанием изысканий по текстовым критериям.
В-третьих, не секрет, что на многие документы и ссылки с них Яндексом накладываются блокирующие или понижающие фильтры. Как например блокирующий фильтр на учет текста сквозных ссылок с сайта. Очень сильно сомневаюсь, что этот факт учтен в модели. Т.к. для этого надо оценить ресурсы на предмент подобных фильтров, что очень трудоемкая, если вообще решаемая задача.
Ну. и в заключении.
AiK прав. Для того, чтобы серьезные люди заинтересовались Вашими изысканиями, им нужна максимальная прозрачность вычислений. Иначе Ваши красивые картинки годятся только для разводки на вебмани ньюбов. Впрочем, ньюбов много, и Вам может хватить на хлебушек с маслицем.
А по поводу searchengines.ru - зря Вы. Что-то мне подсказывает, что забанили Вас отнюдь не за революционные идеи, а за что-то более приземленное и банальное. Обычно банят за хамство или наплевательсвкое отношение к правилам форума.
Зарегистрирован: 20.02.2005 Сообщения: 308 Откуда: город Ногинск Московская область
Добавлено: Пт Дек 02, 2005 3:19 am Заголовок сообщения:
Уважаемый Wolf.
Спасибо, что Вы считаете возможным обращаться ко мне на Вы, пренебрегая "принятыми" правилами форума.
Прошу прощения, что ответ Вам будет не очень коротким.
Начну чисто с человеческого. Как человек, я не икона. На searchengines меня отключил Gray, так как я не удержался, ответил оскорбившему меня дважды подряд, в начатой мною теме, человеку фразой: "Да пошел ты...", те. фразой из 3 слов. В ответ на первое оскорбление я вежливо попросил его (на Вы) не мусорить его в этой теме и воздержаться от оскорблений. Тем не менее, он продолжил свои оскорбления. Я до сих пор считаю, что правильно сделал. И мне не важно, академик ли он на форуме или нет, исключат меня из форума или нет. Есть вещи выше, чем выгода, деньги или прочая лабуда. До сих пор благодарен человеку, который, даже под угрозой применения к нему санкций за обсуждение решения модератора форума (Gray-я), открыто высказался, кто в этом случае был прав.
wolf писал(а):
Мдя. Красивые картинки, красивые правильные графики. Вспомнились, аспиранские годы, когда всем скопом мы помогали написать кирпич диссера одному аспиранту и подгоняли его аналитику и алгоритм под результаты эксперимента, чтоб погрешность не была слишком большой. :)
Wolf, Вы писали, я нет. Хотите поделиться со мной опытом? У меня на это нет времени.
Цитата:
Миныч, все это, конечно интересно. Я допускаю, что Вы довольно серьезно изучили вопрос определния текствоых критериев релевантности, и даже что-то довольно точно можете считать. Но текстовые факторы довольно слабы по сравнению с ссылочными. И похоже с ссылочными критериями, начинается та самая подгонка "под результат"
Wolf, Вы меня заинтриговали словом "похоже". Чем похоже? В каком это месте "подгонка" идет? Я ведь открыто выложил цифирки, которые в файл Excel записывал, а цифирки не с потолка брал, а из серпа. Ей богу самому интересно :)
Если бы Вы просто написали, у меня сомнения, а не лапша ли это, то это, собственно, ожидалось мною с самого начала этого топика :) и ничего нового Вы этим не добавили бы.
1. Текстовые факторы, по крайней мере для меня лично, давно пройденный этап. В этой теме главное - измерение ссылочного фактора!!! Я уже обещал опубликовать данные о вкладе контента и сделаю это. А вот вопрос об открытом опубликовании измерения ссылочного фактора и о полноте обнародования информации для меня еще не решен. Эта тема для того и создана, чтобы четче с этим определиться.
2. Кто бы спорил о ссылочном факторе. Больше всего времени у меня заняли не измерения, а подбор подходящих "линеек" и запросов под эти линейки. Потому как измерительные линейки надо подобрать по масштабу близкому к "недвижимость".
Оказалось это не просто. "Математика", "физика", сильно зашкаливали, "химия", "психология" недотягивали. Опять же "бухучет" недотягивал, зато "главбух" опять зашкалил :)
Это кстати, натолкнуло на мысль, что предлагаемый сервис может включать в себя точный инструмент измерения конкурентности запросов, т.е. может давать информацию, по каким запросам УЖЕ раскручены и НАСКОЛЬКО раскручены конкуренты. И мог бы помочь некоторым фирмам в поиске "ниш" на поисковом поле и экономии средств за счет отказа от раскрутки по явно недостижимым запросам.
3. Мне кажется, у Вас убавится оптимизма в "лапше", если Вы просто зададите Яндексу запрос типа "авто|недвижимость", посмотрите на выдачу Яндекса (прошу обратить внимание, на выдачу именно Яндекса, а не Миныча!!!, и на то, что это Яндекс так учитывает ссылочный фактор, а не Миныч!!! и что это именно выдача Яндекса с применением ВСЕХ наложенных самим Яндексом фильтров, а не фантазии папы Карло!!!), на то как перемешались сайты.... Добавьте к этой сладкой парочке слова типа "главбух", "математика"... Теплее не стало?
Это же так очевидно!!! :)
Цитата:
Во-первых, вообще неясно о том, считаете ли Вы статический ранг документов (а он есть и используется при ранжировании).
Поправочка небольшая - я не считаю, я измеряю и вклад этот учитывается, причем не мной, а повторюсь, самим Яндексом.
Цитата:
Во-вторых, вроде бы из контекста Ваших сообщений следует, что Вы каким-то образом пытаетесь оценить вклад текста ссылок. Однако, совсем непонятно как. И тут я не нашел ничего, что могло хоть как-то пролить свет на это, как в случае с довольно подробным описанием изысканий по текстовым критериям.
Не сочтите за браваду, уже не пытаюсь, а реально измеряю. И Ваши слова пока меня успокаивают. Представьте, Вы нашли месторождение золота... Но нужны деньги на его освоение...
Цитата:
В-третьих, не секрет, что на многие документы и ссылки с них Яндексом накладываются блокирующие или понижающие фильтры. Как например блокирующий фильтр на учет текста сквозных ссылок с сайта. Очень сильно сомневаюсь, что этот факт учтен в модели. Т.к. для этого надо оценить ресурсы на предмент подобных фильтров, что очень трудоемкая, если вообще решаемая задача.
Смотрите мой ответ выше по тексту.
Как лирическое отступление. Когда-то занимался стабилизацией частоты мощных лазеров на частоте практически прозрачной для атмоферы. Так вот с помощью одного осциллографа с двумя входами, двух конденсаторов, двух резисторов и трех потенциометров от лампового приемника удалось поднять стабильность частоты лазера в 40 раз. И оставить и забугорных и СССРовских коллег далеко позади. И что интересно, для анализа частотных характеристик усилителей осциллографа применял сам этот осциллограф. Других просто не было потому, что этот был самый широкополосный и самый "линейный" :)
Ничто не ново под луной :)
Цитата:
Ну. и в заключении. AiK прав. Для того, чтобы серьезные люди заинтересовались Вашими изысканиями, им нужна максимальная прозрачность вычислений. Иначе Ваши красивые картинки годятся только для разводки на вебмани ньюбов. Впрочем, ньюбов много, и Вам может хватить на хлебушек с маслицем.
Wolf, поделитесь всем, что знаете и умеете публично.
Вы считаете меня серьезным человеком? Если нет, то тогда, собственно в чем вопрос?
Если да, то подходить ко мне с позиции "ты нам, а мы тебя..." не имеет никаких шансов.
Вот если Текарт (гипотетически) заинтересован в раскрутке собтвенных ресурсов, раскрутке клиентов, максимизации отдачи от своих ресурсов, то его руководство может подумать, а как это можно использовать? Две стороны должны хотеть! Тогда и найдут способы взаимодействия, путем совместной работы. И демонстрацию можно организовать, только не публичную, а конфиденциальную. Когда и я буду видеть серьезность намерений тех, кто ко мне обратится.
Зарегистрирован: 31.05.2005 Сообщения: 1284 Откуда: Москва
Добавлено: Пт Дек 02, 2005 3:32 am Заголовок сообщения:
Цитата:
7. Для "линеаризации" полученных экспериментальных значений использовалась функция:
у=sqrt(ln(вес_запроса_переходной)),
где sqrt - увадратный корень
ln - натуральный логарифм
переходной вес - вес при изменении которого на 1, тестируемая страница и измерительная в выдаче меняются местами.
8. Почему именно такая функция - спросите у Яндекса. Я не виноват, что именно при такой функции все 4 графика для всех 4х тестовых страниц совпали с точностью 1-2 процента, несмотря на неоптимальность "измерительных страниц" с точки зрения достижения максимальной точности. Я еще вернусь к этой функции, когда буду публиковать данные об алгоритме Яндекса при взвешивании контента (без ссылок).
Вообще не очень ясно как Вы пришли к этой формуле. Не могли бы Вы изложить, если это ноу хау, хотя бы общие соображения?
Зарегистрирован: 20.02.2005 Сообщения: 308 Откуда: город Ногинск Московская область
Добавлено: Пт Дек 02, 2005 4:10 am Заголовок сообщения:
Это из изучения "ступенек", когда на них наткнулся:
Вначале думал, что здесь "округляются" логарифмы и целым числом должен быть log. Потом поднял точность измерений до 1/1000 и явно что-то не сходилось.
Расширил диапазон по ступенькам и страницы подстроил так, чтобы вблизи изломов точнее переход мерять.
Одновременно не сходились данные по суммированию весов с чистыми log, т.е слово с очень большим весом никак не могло перевесить два с маленькими весами.
Тогда точность довел до 9 знаков. И несколько ступенек очень хорошо подошли под квадрат логарифма, т.е.
логарифм веса нн-ой ступеньки пропорционален квадрату нн, а так как скорее всего Яндекс суммирует целые числа, то это число должно быть пропорционально (если не считать округлений) корню квадратному из логарифма. А потом идет проверка закономерности в широком диапазоне измерений...
Так что Маслов и Сегалович заставили меня попыхтеть...
Добавлено: Пт Дек 02, 2005 8:08 am Заголовок сообщения:
Миныч писал(а):
Уважаемый Wolf.
Спасибо, что Вы считаете возможным обращаться ко мне на Вы, пренебрегая "принятыми" правилами форума.
Прошу прощения, что ответ Вам будет не очень коротким.
Начну чисто с человеческого. Как человек, я не икона. На searchengines меня отключил Gray, так как я не удержался, ответил оскорбившему меня дважды подряд, в начатой мною теме, человеку фразой: "Да пошел ты...", те. фразой из 3 слов. В ответ на первое оскорбление я вежливо попросил его (на Вы) не мусорить его в этой теме и воздержаться от оскорблений. Тем не менее, он продолжил свои оскорбления. Я до сих пор считаю, что правильно сделал. И мне не важно, академик ли он на форуме или нет, исключат меня из форума или нет. Есть вещи выше, чем выгода, деньги или прочая лабуда. До сих пор благодарен человеку, который, даже под угрозой применения к нему санкций за обсуждение решения модератора форума (Gray-я), открыто высказался, кто в этом случае был прав.
Сейчас уже не с руки разбираться. Я на правах супермодератора серченжайнс.ру снял с Вас бан. так, что, если будет желание - заходите, поболтаем. Я лично, с большим интересом слежу за Вашими изысканиями.
Миныч писал(а):
Если бы Вы просто написали, у меня сомнения, а не лапша ли это, то это, собственно, ожидалось мною с самого начала этого топика и ничего нового Вы этим не добавили бы.
Похоже, вы слишком бюольшое значение придаете форме, а не содержанию сообщения. Когда я писал "похоже", то это означало "для меня похоже", т.е. ровно то же самое, что и "у меня есть сомнения".
Миныч писал(а):
Поправочка небольшая - я не считаю, я измеряю и вклад этот учитывается, причем не мной, а повторюсь, самим Яндексом.
Вот здесь хотелось бы попдробнее. Мне не нужны конкретные цифры, мне хотелось бы узнать методику измерения, чтоб попытаться оценить ее адекватность.
Цитата:
Wolf, поделитесь всем, что знаете и умеете публично.
Я это делаю постоянно. Уачствую в семинарах, выступаю на конференция, в форумах пишу, в конце концов. Делюсь, чем знаю и что умею.
Цитата:
Вы считаете меня серьезным человеком? Если нет, то тогда, собственно в чем вопрос?
Если да, то подходить ко мне с позиции "ты нам, а мы тебя..." не имеет никаких шансов.
Вы знаете, это напоминает вопрос двух малознакомых собутыльников - "ты меня уважаешь?" Я пока знаю слишком мало о Вас, что бы сформировать мнение о том, насколько Вы серьезны. Ваши изыскания по текстовым критериям, несомненно, заслуживают уважения, теперь мне хотелось бы понять, насколько это применимо и для изысканий по ссылочным факторам.
Цитата:
Вот если Текарт (гипотетически) заинтересован в раскрутке собтвенных ресурсов, раскрутке клиентов, максимизации отдачи от своих ресурсов, то его руководство может подумать, а как это можно использовать? Две стороны должны хотеть! Тогда и найдут способы взаимодействия, путем совместной работы. И демонстрацию можно организовать, только не публичную, а конфиденциальную. Когда и я буду видеть серьезность намерений тех, кто ко мне обратится.
Текарт заинтересован не гипотетически. Он работает и продвигает проекты. Ваш чип-тюнинг очень интересен, но пока работа эффективно проводится на уровне ударов кувалдой. Весь вопрос в экономической целесообразности на проведение чип-тюнинга. А для этого хотелось бы оценить, что он вообще из себя представляет.
Зарегистрирован: 20.02.2005 Сообщения: 308 Откуда: город Ногинск Московская область
Добавлено: Вт Дек 06, 2005 10:49 am Заголовок сообщения:
Здравствуйте Wolf.
Спасибо за помощь. Много воды уже утекло и, как я смотрю, многие, интересные для меня темы, в которых я участвовал, уже погибли.
Например, мои дискуссии с Interitus о возможности прикинуть ПР Гугля, задавая отсутствие некоторых слов. А тут случайно, проверяя есть ли наука по ранжирующим системам, наткнулся на перевод известного автора, в котором он почти те же методы использует:
http://www.webmasterpro.com.ua/news27.html
Или вопрос о том, влияет ли размер сайта на ПР (можно ли накачать ПР за счет создания новых страниц). Почему-то у многих просто ВЕРА в то, что так сделать нельзя, а откуда она берется ответить не могут.
Насчет ссылочного фактора. Как Вы думаете, если я задаю тестовый запрос Яндексу, он что, учитывает, что это тестовый запрос и поэтому надо фильтры отключить и ссылочные факторы ранжирования? На каком основании?
Поэтому, я основываю свои выводе на выдаче Яндекса, которая учитывает ВСЕ факторы и ВСЕ фильтры, так как Яндекс не знает, что это запрос не обычного юзера, а чисто исследовательский.
Вот обычный исследовательский запрос:
"недвижимость|главбух|бухучет"
Неужели Вы думаете, что Яндекс при выдаче отключит свои фильтры и отключит ссылочные факторы при ранжировании?
Экономические факторы. Вам виднее, нужна ли Текарту ювелирная точность. Я не работал на уровне фирм с собственными ресурсами, собственными доменами в количестве 600 штук и т.п. Если не нужна, то и особого желания сотрудничать у Вас и не возникнет. А я это приму к сведению.
Или Вы думаете, что я буду кого-то убеждать в пользе сервиса? Вы ошибаетесь. Как написал когда-то Ницше в замечательной книге "Заратуштра", только то имеет действительную ценность, что не требует доказательств, в силу своей очевидности.
Если же встает вопрос о доказательствах, лучше это дело оставить и не тратить свое время на мышиную возню.
Буду искать варианты в пределах разумного. Или займусь более денежным Гуглем без спонсоров... не боги горшки обжигают. Тем более, что к Гуглю интерес более проявился. А российский интернет должен еще денежно созреть для серьезных денег.
Добавлено: Ср Дек 07, 2005 7:50 am Заголовок сообщения:
Ок, Миныч, Ваше право - доказывать и нет. Я его уважаю.
Не буду больше спрашивать "как", буду спрашивать "что".
Хотелось бы понять, что Вы можете измерять у ссылочных факторов? Надеюсь, эта информация не секретная?
Например,
1. Можете ли Вы в каких-либо условных единицах оценить величину статического ранга конкретного документа?
2. Можете ли Вы в каких-либо условных единицах оценить вклад текстовой ссылки с конкретного документа (при условии точного вхождения поисковой фразы в текст ссылки) в ранжирование по этому запросу документа, на который ведет ссылка?
3. Можете ли Вы оценить вклад текстовой ссылки с конкретного документа при различных условиях неточного вхождения фразы, но при условии, что все слова из нее входят в нее?
И т.д.
Добавлено: Чт Дек 22, 2005 4:27 pm Заголовок сообщения: Миныч на связь не выходит...
Думал заказать услугу для одного проекта - но не получил ответа на 2 свои письма. Может быть, Миныча просто полностью перекупили наши "Зубры" от оптимизации и тему можно закрывать... _________________ GOOD LUCK!!!
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах