В тот день я понял, что поисковики не могут определять релевантность - они вынуждены полагаться на человека, чтобы иметь возможность предложить хотя бы «восприятие» релевантности.
Предоставляемые человеком данные – не значит ссылка с DMOZ или то, что Yahoo! надо заплатить $299. Если кто-то размещает ссылку на сайт, которым он не владеет, это предоставляемые человеком данные. Это именно то, что сейчас известно как популярность ссылок, и это то, что Google использовал для рейтинга страницы, который превратил его в поисковую систему номер один.
Вы можете относится к рейтингу страницы как вам угодно. Как и многие, вы можете считать его самым главным достижением нового столетия, которое сделало Google поисковой системой, обрабатывающей 70% всех запросов. Или вы можете принять мою точку зрения: признание поражения в попытке заменить суждение человека компьютерной программой. Я не футурист и я не знаю, на что будет похож наш мир через 20 лет или даже через 20 минут, но я готов поставить весь свой бизнес на то, что никакая программа не сможет заменить человеческие эмоции, принципы и суждения в ближайшем будущем.
Если я прав, то у использующих роботов-пауков поисковых систем просто нет выбора, кроме как создавать все больше роботов, чтобы выгодно использовать эти эмоции, принципы и суждения. А значит – ссылки.
Я тоже готов на это поставить много. Если убрать последний футуристический абзац об "эмоциональных роботах", получится интересный вывод - поисковики должны все больше и больше искать опору во мнениях человека. Не в "свойствах естественных текстов", а именно в сообществах и личностях.
Забавно, почему же сам человек не верит в свои силы, что он может создать что-то лучшее, чем робот? _________________ С уважением,
Андрей Иванов.
Добавлено: Вс Июн 19, 2005 6:56 pm Заголовок сообщения: Re: Боб Масса пишет о "суждениях человека"
Хорошая статья.
andre писал(а):
Я тоже готов на это поставить много. Если убрать последний футуристический абзац об "эмоциональных роботах", получится интересный вывод - поисковики должны все больше и больше искать опору во мнениях человека. Не в "свойствах естественных текстов", а именно в сообществах и личностях.
Да нету там ничего футуристического. Речь шла об учете ссылок и ни о чем большем. А под признанием поражения подразумевалась всего лишь невозможность корректного ранжирования по текстам, без учета ссылок.
Добавлено: Вс Июн 19, 2005 9:16 pm Заголовок сообщения: Re: Боб Масса пишет о "суждениях человека"
Interitus писал(а):
Да нету там ничего футуристического. Речь шла об учете ссылок и ни о чем большем. А под признанием поражения подразумевалась всего лишь невозможность корректного ранжирования по текстам, без учета ссылок.
Ну, цитата вверху, каждый волен упражняться в понимании, как умеет. Ссылками поисковики дорвеи "победили", чего же стоят современные "предоставляемые человеком данные" мы все неплохо знаем. Все по кругу идет. _________________ С уважением,
Андрей Иванов.
Добавлено: Пн Июн 20, 2005 4:55 am Заголовок сообщения:
andre, ты все время забываешь о количестве. Считать никогда не пробовал? Деньги и время.
Пусть ответ на оин запрос составленный человеком занимает 1 час. Будем считать что в среднем запросы устаревают (или требуют пересмотра) раз в год.
Пусть разных запросов 10 миллионов.
Считая зарплату оператора 20 долларов в час получаем что расходы составят 200 миллионов долларов в год только на операторов.
А что бы сделать хотя бы на 5 языках - миллиард.
Причем я не предусмотрел вопроса вопроса контроля качества, нкладных расходов на процесс управления, на оплату источников информации для операторов...
Добавлено: Пн Июн 20, 2005 5:28 am Заголовок сообщения:
Mauser писал(а):
andre, ты все время забываешь о количестве. Считать никогда не пробовал? Деньги и время.
А почему обязательно нужно или/или? Речь идет о том, чтобы улучшить качество выдачи. Выдача, к которой приложили "ручки", лучше алгоритмической. Рассмотрим еще одну задачку на деньги и время.
Берем список запросов по маске "знакомств*" в Рамблере.
Частота всех запросов с этой подстрокой - 268793. Общее количество формулировок - 41850+.
Первые две формулировки
- знакомства 105833
- знакомство 9362
Их суммарная частота - 115195 или 42,9% от общей. Т.е. приложив ручки к двум запросам из 41850 (0,005%), ты можешь улучшить выдачу для 43% пользователей с этим запросом или примерно для 3800 человек в день. Хватит денег на такую операцию? Остальные запросы пусть ранжирует алгоритм.
Если же идти по пути, когда оператор получает зарплату не за составление ответов (этим занимаются, и расходы несут те, кому это выгодно - т.е. владельцы ресурсов), а только за проверку "правильный ответ - неправильный ответ", его кпд возрастает во много раз. _________________ С уважением,
Андрей Иванов.
Добавлено: Пн Июн 20, 2005 5:42 am Заголовок сообщения:
Не хвтатит. Потому что я тебе посчитал что запрос устаревает раз в год, а такие запросы устаревают постоянно. _________________ Золото | Реальность | Серебро | Gun auction
Добавлено: Пн Июн 20, 2005 5:56 am Заголовок сообщения:
Mauser писал(а):
Не хвтатит. Потому что я тебе посчитал что запрос устаревает раз в год, а такие запросы устаревают постоянно.
Запрос, который пользователи задают несколько (тысяч, сотен, десятков) раз в день - не устаревает. Точнее, он, как и любая нужная вещь, нуждается в присмотре и уходе. Аналогия - люди живут в домах долго, а порядок наводят в них если не каждый день, то уж каждую неделю.
Конечно, если через год проблема "знакомства" по каким-то причинам отомрет, тогда ты прав. Но она довольно давно почему-то актуальна для очень многих.
Если же "отомрут" сайты, которые сегодня могут дать информацию в ответ на данный запрос, так желающих на их место и сейчас сколько хочешь. И это по любым популярным запросам. _________________ С уважением,
Андрей Иванов.
Добавлено: Пн Июн 20, 2005 8:08 am Заголовок сообщения:
"устаревает" в смысле требует пересмотра не сам запрос, а ответ. То есть человеку снова придется разгребать. А труд человечий дорог и долог.
С тех пор как железный конь пришел на смену крестьянской лошадке... _________________ Золото | Реальность | Серебро | Gun auction
Добавлено: Пн Июн 20, 2005 8:35 am Заголовок сообщения:
Mauser писал(а):
"устаревает" в смысле требует пересмотра не сам запрос, а ответ. То есть человеку снова придется разгребать. А труд человечий дорог и долог.
Поэтому давай откажемся от поваров и всех будем кормить, пропуская все продукты через одну мясорубку и пастеризуя потом это варево. Проголодаются - сожрут ведь, куда денутся-то.
Давай, книги у нас писать будут "алгоритмы". Картины рисовать, автомобили проектировать, одежду придумывать. Программы новые компьютерные пусть тоже машины лепят, они же это дешевле, наверное, сделают...
Если ты хочешь предоставление информации довести до совершенства и дальше это совершенство поддерживать в соответствии с современностью - без человека не обойдешься. 10 миллионов ответов постоянно "совершенствовать" не придется, распределение запросов видел же. А важные запросы - просто необходимо. _________________ С уважением,
Андрей Иванов.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах