![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Если я этой записи буду давать метки (tags), то там будут и евреи, и Холокост, и маразмы Америки, и антисемитизм, и ревизионизм, и политика... Короче, целый букет, сюда только шанхайского триппера для полного счастья не хватает.
Итак, приступим. Г-н
emdrone старался, ну так старался, такую длинную статью написал... "плакать хочется" (голосом Леонова из Кин-Дза-Дзы). Цитирую:
Теперь настало время провести эксперименты.
Эксперимент 1. Заходим в гугл и набираем:
David Irving
И вправду, в первой ссылке выдается вот что:
David Irving's Action Report
Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about ...
www.fpp.co.uk/
Теперь идем на сайт. Да, на сайте нету слов disgraced и denier. Заговор? Заговор.
Эксперимент 2. Заходим в гугл и набираем:
miserable failure (жалкий неудачник)
В первой ссылке нам выдается такое:
Biography of President George W. Bush
Biography of the president from the official White House web site.
www.whitehouse.gov/president/gwbbio.html
Разумеется, на странице нету слова miserable. И слова failure, естественно, нет. Но мало того, на странице нету слов из описания. Слова official нету. И слова web нету. И слова site нету. И даже слов White и House нету. Тут партизан въезжает в этот ритм и начинает его стучать. А психиатор достает гитару, и у них получается джэм-сэйшен часа на полтора.
Ну что, все понятно? Кому все понятно, можете дальше не читать. Для остальных -
Эксперимент 3. Попробуем найти в гугле мой любимый сайт. Набираем:
Клуб Скептиков
Получаем:
Клуб Скептиков / Russian Skeptics Club
О природе черной магии, НЛО, полтергейста, телепатии, религий с точки зрения науки.
www.skeptik.net/
Аналогичная монопенисуальность. На странице нету слова "природе", нету слова "точки" и нету слова "зрения". И могу вас заверить, что никогда не было. Мало того, если набрать в гугле "О природе черной магии, НЛО, полтергейста, телепатии, религий с точки зрения науки", то в списке результатов будут какие угодно сайты, но не будет скептик.нет. Заговор? Заговор!
Переходя на личности... Ну, что я могу сказать о личности г-на
emdrone... Ревизионист, антисемит и антиамериканист, немножко параноик, русский патриот, человек явно старательный и скрупулезный... Все это сочетание напоминает одну смешную историю - о том, как девушка котел песком отмывала. См. самую последнюю фразу.
Итак, приступим. Г-н
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
http://www.livejournal.com/users/emdrone/133835.htmlСидят, понимаешь, тысячи красноглазых (от напряжения и недосыпания) этнических мафиозо-контролеров и дрожащими (от туннельного синдрома) руками кликают на все восемь миллиардов проиндексированных гуглом страниц. Представили? Жуткая картина...
Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц. Например, никаким автоматическим сбором информации невозможно объяснить label приставленный к результату гуглопоиска на имя David Irving:Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about ...Чтобы понять, отчего он удостоился штучного обращения, надо знать, насколько центральным для холокостников было дело против Ирвинга, историка Второй Мировой, выкапывающего новые документы в архивах вместо переписывания устоявшейся версии истории. Для суда против него этнической мафией - деятелями вроде вложившегося Спилберга - были собраны миллионы (5? 15? не помню, есть на сайте Ирвинга, лень проверять) и куплен за 300-400 тысяч кембриджский профессор истории Эванс]
www.fpp.co.uk/
[Дословно: "Веб сайт опозорившегося британского отрицателя Холокоста Дейвида Ирвинга. Содержит последние новости о себе ... -- второе предложение действительно есть на его сайте. Первое же подставлено евреями работающими в Гугле.]
Теперь настало время провести эксперименты.
Эксперимент 1. Заходим в гугл и набираем:
David Irving
И вправду, в первой ссылке выдается вот что:
David Irving's Action Report
Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about ...
www.fpp.co.uk/
Теперь идем на сайт. Да, на сайте нету слов disgraced и denier. Заговор? Заговор.
Эксперимент 2. Заходим в гугл и набираем:
miserable failure (жалкий неудачник)
В первой ссылке нам выдается такое:
Biography of President George W. Bush
Biography of the president from the official White House web site.
www.whitehouse.gov/president/gwbbio.html
Разумеется, на странице нету слова miserable. И слова failure, естественно, нет. Но мало того, на странице нету слов из описания. Слова official нету. И слова web нету. И слова site нету. И даже слов White и House нету. Тут партизан въезжает в этот ритм и начинает его стучать. А психиатор достает гитару, и у них получается джэм-сэйшен часа на полтора.
Ну что, все понятно? Кому все понятно, можете дальше не читать. Для остальных -
Эксперимент 3. Попробуем найти в гугле мой любимый сайт. Набираем:
Клуб Скептиков
Получаем:
Клуб Скептиков / Russian Skeptics Club
О природе черной магии, НЛО, полтергейста, телепатии, религий с точки зрения науки.
www.skeptik.net/
Аналогичная монопенисуальность. На странице нету слова "природе", нету слова "точки" и нету слова "зрения". И могу вас заверить, что никогда не было. Мало того, если набрать в гугле "О природе черной магии, НЛО, полтергейста, телепатии, религий с точки зрения науки", то в списке результатов будут какие угодно сайты, но не будет скептик.нет. Заговор? Заговор!
Переходя на личности... Ну, что я могу сказать о личности г-на
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
no subject
Date: 2005-09-02 08:55 pm (UTC)Согласен, что emdrone криво выразился. Но суть именно в том, что по поиску (только что проверил) на имя David Irving именно что вылазит "Web site of disgraced British Holocaust denier". И ссылка стоит именно что на сайт Ирвинга. Спрашивается, _откуда взялся текст_?
Понятно, если бы ссылка была на сайт "об этом мерзком ревизионисте". Но как может аннотация такого содержания выдаваться к ссылке _непосредственно на сайт Ирвинга_?
Кроме как "Гугль дописал ручками", мне что-то в голову ничего не приходит...
no subject
Date: 2005-09-02 09:05 pm (UTC)Описание каждого сайта попадает в Гугл с сотен и тысяч других сайтов. Гугловский автомат собирает описание сайта со всех мест, где стоит на него ссылка, и самое распространенное описание ставит себе. Если набрать в гугле "Web site of disgraced British Holocaust denier David Irving", то вылезет ЧЕТЫРЕСТА ссылок. Значит, именно это - наиболее частое описание сайта Ирвинга в инете. И вполне логично роботу (а искусственный интеллект еще не изобрели) использовать именно его. На самом сайте может быть сказано одно, а сам сайт - совсем про другое. И тут лучше ориентироваться не на хозяина этого сайта, а на "коллективный разум". Вот, для примера: Т.е., к примеру, Вася сделал сайт и назвал его "самый лучший и уникальный сайт о том, как разбогатеть, а также голые бабы, секс, порно и бесплатные доллары". Думаешь, именно это появится в гугле? Хрен там. Скорее что-то вроде "сайт мудака и наебщика Васи". Причем, судя по описанию моего сайта, так же поступает Яндекс. Причем я вполне доволен, Буш наверняка тоже (Biography of the president from the official White House web site - вполне правильно, хоть на самом сайте и нет этих слов), ну, а Ирвинг плачет горькими слезами, потому что на всех не угодишь :-)
no subject
Date: 2005-11-02 02:18 am (UTC)---------
Майк, это не совсем верно. Действительно, используя ссылочное ранжирование можно выдвинуть ресурс по различным ключевым словам (известные шутки - "miserable failure" на Дж.Буша, либо "вор должен сидеть в тюрьме" Януковича), но эти слова НИКОГДА не попадут в сниппет этого ресурса. В него гарантированно попадает тэг TITLE и релевантный запросу кусок контента сайта.
Другое дело, если сам сайт использует клоакинг-методы, выдавая один контент посетителям, другой - ботам. Но я только что проверил эту версию. Никаких "disgraced"
no subject
Date: 2005-09-02 09:25 pm (UTC)no subject
Date: 2005-11-02 03:06 am (UTC)----
В принципе это мог сделать кто угодно (вот здесь: http://dmoz.org/add.html ),
но при попустительстве гугля.
(см. http://directory.google.com/Top/Society/Issues/Race-Ethnic-Religious_Relations/Holocaust_Denial/ )
no subject
Date: 2005-09-02 09:38 pm (UTC)Кстати, на "Web site of disgraced British Holocaust denier David Irving" у меня выдало 916 линков, а не 400 :-) Но! они _на документы_ (в основмном - письма об Ирвинге), в том числе и с его сайта. Линки ведут на конкретные страницы.
Возьмем "Warrax". 21000 ссылок. Отрывок текста - лин на соотв. документ.
А вот такого, чтобы линк описывался иным текстом, чем есть в том документе, на который ссылаются...
Возьмем, скажем, Adolf Hitler. 1460000 линков. И опять то же: отрывок из текста и ссылка на страницу, содержащую текст.
Или возьмем "Satan". Казалось бы, тут сатанистов должны заткнуть наглухо высказывания от христиан и т.п. Но нет - на первом месте "Church of Satan: The Official Web Site
The official Church of Satan website as founded by Anton LaVey. Includes membership
information, news, essays, policy statements, historical documents and ..."
Чуть ниже - "SATAN. (Security Administrator Tool for Analyzing Networks). SATAN Information. What SATAN is about · SATAN updates"
А откуда вообще инфа, что "Гугловский автомат собирает описание сайта со всех мест, где стоит на него ссылка, и самое распространенное описание ставит себе"?
no subject
Date: 2005-09-02 10:09 pm (UTC)Во-вторых, 400 линков - это именно тогда, когда всю фразу в кавычки берешь, чтобы слова шли именно в том порядке и подряд. А если ввести так:
Web site of disgraced British Holocaust denier David Irving www.fpp.co.uk
то выдается 145 (сто сорок пять) ссылок конкретно на главную страницу его сайта, как я и говорил.
> А вот такого, чтобы линк описывался иным текстом,
> чем есть в том документе, на который ссылаются...
Ну как же? Я ж в корневом сообщении привел сразу два примера - мой сайт и сайт Буша :-)
> А откуда вообще инфа, что "Гугловский автомат
> собирает описание сайта со всех мест, где
> стоит на него ссылка, и самое распространенное
> описание ставит себе"?
Это наиболее логичное объяснение. Моя паранойя не доходит до мысли, что гугловцы специально наняли русского сотрудника, чтобы он описал для них мой сайт. Причем описал именно самым распространенным описанием на тех сайтах, где стоит на него ссылка, т.е. еще и research ради меня, любимого, провел.
no subject
Date: 2005-11-04 07:50 pm (UTC)no subject
Date: 2005-09-02 11:16 pm (UTC)no subject
Date: 2005-09-03 08:28 pm (UTC)Затем заходим на первую страницу (за заставкой) и начинаем читать текст.
Впрочем, я понял гипотезу: "Гугль составляет описание каким-то хитрым образом не с самого сайта, а делает резюме из подборок описаний сайта со ссылками на таковой".
Мне эта гипотеза кажется сомнительной, т.к.:
1.Для этого нужна мощнейшая программа искуственного интеллекта - там ведь не ключевые слова через запятую, а _связный текст_.
2.Именно что "ты много знаешь христианских сайтов, где стоят ссылки на сатанинские сайты?" - как объяснить это с CoS?
no subject
Date: 2005-09-04 05:43 pm (UTC)2) Не понял вопроса. И вообще это не ко мне, это kay1313 писал.
3) И, наконец, не забываем про мой сайт и еще кучу других:
Описание яндекса: "Поисковый сервер для русского сегмента Интернета, разработка компании CompTek" (на странице yandex.ru нету слов "сервер" и "сегмент")
Описание x-files.ru: "информационно-поисковая система.Российский уфологический сервер. Новости об НЛО, пришельцах..." (на странице yandex.ru нету слов "сервер" и "пришельцах")
Описание susi.ru: "Подборка рецептов национальной японской кухни" (на странице susi.ru нету слов "подборка" и "рецептов")
Зато во всех вышеприведенных случаях ключевая фраза есть в десятках описаний на ссылках на этот сайт. Проще поверить в то, что это делает робот, чем в то, что гугловцы наняли сто переводчиков со ста языков.
no subject
Date: 2005-09-04 08:21 pm (UTC)Вот возьмем, например, "Black Fire Pandemonium". Ссылок на меня должно быть достаточно много - примерно 19800.
Black Fire Pandemonium
Just a pix. BLACK FIRE PANDEMONIUM. 84 edition, 08 August XL AS. Created for MS
Internet Explorer. Copyright: Warrax XXXII AS-NOW e-mail: warrax@warrax.net.
warrax.croco.net/ - 2k - Сохранено - Похожие страницы
Black Fire Pandemonium - Меню
Статьи. Мои личные · Других авторов · Христианские статьи · Пресса · О сатанизме
и сатанистах · Гуманизм и А-Теизм · Сатанизм и рок-музыка · Кретиноционизм ...
warrax.croco.net/menu.html - 8k - Сохранено - Похожие страницы
[ Дополнительные результаты с warrax.croco.net ]
The site has moved to warrax.croco.net Сайт переехал на warrax ...
The site has moved to warrax.croco.net. Сайт переехал на warrax.croco.net.
warrax.df.ru/ - 1k - Сохранено - Похожие страницы
Институт "Коллективное Действие" - Ревизионисты и «расологи» в РФ
... "Black Fire Pandemonium" - сайт "главного" сатаниста страны Warrax-а, ...
"Краткая расология Европы"), на сайте Warrax-а Black Fire Pandemonium (в ...
ikd.ru/Campaign/xeno/Article.2005-05-05.0810 - 45k - Сохранено - Похожие страницы
Что-то не заметно, чтобы было резюме из каких-то описаний сайта...
Т.е. вполне возможно, что есть некий абстрактор. Я же не заявляю, что его нет и быть нге может. Однако версию, что отдельные сайты могут быть подправлены ручками это никак не опровергает.
Скажем, когда-то мой сайт стабильно находился в первой десятке "Яндекса" по теме "религия". А потом буквально за день первый десяток был занят строго православными сайтами. И с чего бы это...
В общем, я в ситуации с Ирвингом не считаю возможным поддерживать ни одну из сторон. А энтузиазм обоих стророн "может быть только так!" указывает на предвзятость.
Проясню и углублю
Date: 2005-09-05 11:02 pm (UTC)Случай с РПЦ и запросом "религия": могу предположить, что в РПЦ наняли профессионального оптимизатора под поисковики. А эти - могут что угодно вывести по любому запросу.
Вопрос на заметку: ни разу спам в форумах/гостевых/блогах не видели? С абсолютно глупыми ссылками?
Угу. Никто из ставящих эти ссылки и не ожидает, что народ ломанется по ним кликать. А вот когда их сожрет поисковик, получатель ссылки получит "вкусный" запрос из текста ссылки. У буржуев эта тенденция вообще повальна: подобный спам про виагру, покер и прочие хрени заколебал конкретно.
Далее. Поисковик учитывает не только текст ссылок, но также их количество и качество тех страниц, на которых ссылки стоят. Это делается для определения порядка сайтов в списке выдачи. Хотя это уже отклонение от темы...
Источник: патент Google на поисковую систему.
no subject
Date: 2005-09-06 06:23 pm (UTC)Оттуда и возьмется. Для сайта на XYZ-ском языке может существовать, скажем, сто ссылок на других XYZ-ских сайтах, из которых, к примеру, 20 содержат одинаковое (т.е. идентиченое) описание. Такой машине и язык знать необязательно. Повторяю: сотрудникам гугла и яндекса нет смысла вводить в машину выражения "в жопу" и "геморрой" для поиска microsoft.com и "miserable failure" для поиска сайта президента США. Это было сделано машиной автоматически. Но, естественно, после спланированной акции, сделанной руками. Но, естественно, на сайтах, к гуглу и яндексу отношения не имеющими.
> Вот возьмем, например, "Black Fire Pandemonium".
А вот фиг его знает, как машина в данном случае сработала. Алгоритм невероятно сложный и, естественно, засекреченный. Кроме того, в последнее время я стал сам обращать внимание, как описание сайта коррелирует с его содержимым. Оказалось, что в очень многих случаях оно берется из мета тега "description". Кстати, на сайте Ирвинга этого тега нет, так что он сам себе злобный Буратино. Может быть, стоит ему (Ирвингу) этот тег заюзать, как недели через три жидомасонский дескрипшн исчезнет. А может, и не исчезнет, ибо алгоритм... см выше.
> Однако версию, что отдельные сайты могут быть подправлены
> ручками это никак не опровергает.
Эту версию опровергает бритва Оккама. Как лишнюю сущность, которую нет смысла вводить.
> буквально за день первый десяток был занят строго православными сайтами
А, это совсем несложно. Найди пару сотен ребят, и пусть они каждый день ищут в Яндексе твой сайт и с Яндекса на него переходят. Через месяц сайт будет на первом месте.
> В общем, я в ситуации с Ирвингом не считаю возможным поддерживать
> ни одну из сторон. А энтузиазм обоих стророн "может быть только
> так!" указывает на предвзятость.
Напоминаю, что вначале кое-кто сказал: "Кроме как "Гугль дописал ручками", мне что-то в голову ничего не приходит...".
no subject
Date: 2005-09-06 07:51 pm (UTC)Не совсем так.
Сотня ребят может проспамить форумы и гостевые, т.к. учитывается именно текст в ссылке.
Яндекс пока что не ведет статистику посещений страниц из поисковика.
no subject
Date: 2005-09-06 11:17 pm (UTC)"Найди пару сотен ребят, и пусть они каждый день ищут в Яндексе твой сайт" - еще раз: _за день_ и _вся_ десятка первая - строго православная, чохом.
"Напоминаю, что вначале кое-кто сказал: "Кроме как "Гугль дописал ручками", мне что-то в голову ничего не приходит..."." - ну все верно: не приходило. потом ты с Мухой выдвинул вполне правдоподобную гипотезу, которая мне в голову не приходила. Теперь - пришла :-)
no subject
Date: 2005-11-02 03:13 am (UTC)http://directory.google.com/Top/Society/Religion_and_Spirituality/Esoteric_and_Occult/Satanism/Church_of_Satan/
no subject
Date: 2005-09-03 03:12 am (UTC)Баран, ты много знаешь христианских сайтов, где стоят ссылки на сатанинские сайты? Или просто читать не умеешь?
ps: это же надо, решить, что христиане ставят больше ссылок на CoS, чем сатанисты. Умора, бля...
no subject
Date: 2005-09-03 06:21 am (UTC)При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 07:40 am (UTC)Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 03:04 pm (UTC)Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 05:11 pm (UTC)Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 05:19 pm (UTC)Вот тебе простой пример. Введи в гугле: chicken soup. А теперь ответь, почему на первом месте там книжка по психологии, а кулинарные рецепты - только на третьем?
Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 05:34 pm (UTC)Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 05:35 pm (UTC)Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 05:46 pm (UTC)Ну и, если набрать "nissan", то nissan.com в первой десятке будет, но в самом конце. Почему?
И перечитай еще раз, медленно, ту идею, в которую ты не въехал ;-)
Re: При чем тут ссылки на «сатанинские сайты»?
Date: 2005-09-08 05:57 pm (UTC)no subject
Date: 2005-09-03 05:39 am (UTC)То что поисковики учитывают текст ссылок никем не скрывается, например у яндекса это называется "найдено по ссылке"
no subject
Date: 2005-09-03 05:31 am (UTC)А вообще "геморой" является гораздо большим приколом указаных механизмов
no subject
Date: 2005-09-03 06:22 am (UTC)no subject
Date: 2005-09-03 06:37 am (UTC)no subject
Date: 2005-09-03 12:53 pm (UTC):)))
no subject
Date: 2005-11-02 02:31 am (UTC). . .
Biography of the president from the official White House web site.
www.whitehouse.gov/president/gwbbio.html
. . .
Но мало того, на странице нету слов из описания. Слова official нету. И слова web нету. И слова site нету. И даже слов White и House нету.
--------
Хм. Не вижу такого сниппета. Вот:
http://www.google.com/search?q=miserable+failure --
1. Biography of President George W. Bush
Biography of the 43rd President of the United States.
www.whitehouse.gov/president/gwbbio.html - 25k - Cached
В сниппете использован только оригинальный контент сайта, а именно:
<TITLE>Biography of President George W. Bush</TITLE>
и
<meta name="description" content="Biography of the 43rd President of the United States.">
no subject
Date: 2005-11-02 02:40 am (UTC). . .
На странице нету слова "природе", нету слова "точки" и нету слова "зрения".
----------
Тут все просто, твой сайт занесен в каталог dmoz ( == google directory) именно с таким описанием, см.:
http://dmoz.org/World/Russian/%D0%9D%D0%B0%D1%83%D0%BA%D0%B0/%D0%9F%D1%83%D0%B1%D0%BB%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8/
no subject
Date: 2005-11-02 02:42 am (UTC)http://directory.google.com/Top/Society/Issues/Race-Ethnic-Religious_Relations/Holocaust_Denial/
no subject
Date: 2005-11-04 06:42 pm (UTC)no subject
Date: 2005-11-07 09:14 pm (UTC)no subject
Date: 2005-11-07 09:17 pm (UTC)no subject
Date: 2005-11-08 02:37 pm (UTC)опять же запасная площадка на случай если мне вдруг захочется немножко поубивать нато
no subject
Date: 2006-04-26 03:28 pm (UTC)yahoo тоже находит ту же ссылку, на том же первом месте
http://search.yahoo.com/search?_adv_prop=web&x=op&ei=UTF-8&fr=fp-top&fr2=op&va=miserable+failure&va_vt=any&vp_vt=any&vo_vt=any&ve_vt=any&vd=all&vst=.gov&vs=.gov&vf=all&vm=i&fl=0&n=10
альтависта тоже находит, тоже на первом месте
http://www.altavista.com/web/results?itag=ody&pg=aq&aqmode=s&aqa=miserable+failure&aqp=&aqo=&aqn=&aqb=&kgs=0&kls=1&dt=tmperiod&d2=0&dfr%5Bd%5D=1&dfr%5Bm%5D=1&dfr%5By%5D=1980&dto%5Bd%5D=26&dto%5Bm%5D=4&dto%5By%5D=2006&filetype=&rc=dmn&swd=gov&lh=&nbq=10
search.msn.com тоже находит =))) правда - третья ссылка
http://search.msn.com/results.aspx?q=%6D%69%73%65%72%61%62%6C%65%20%66%61%69%6C%75%72%65
no subject
Date: 2006-04-26 06:14 pm (UTC)no subject
Date: 2006-04-27 07:36 am (UTC)no subject
Date: 2006-04-27 01:14 pm (UTC)no subject
Date: 2006-04-28 01:54 pm (UTC)no subject
Date: 2006-04-28 02:04 pm (UTC)no subject
Date: 2006-04-28 02:09 pm (UTC)no subject
Date: 2006-04-28 03:28 pm (UTC)Так получается, что остальные товарищи тоже модифицировали свои алгоритмы поближе к pagerank (ибо штатовские патенты любой желающий может почитать) ?
no subject
Date: 2006-04-28 03:25 pm (UTC)Я не понимаю, ведь этот флэш-моб влияет только на результаты гугла, у остальных же поисковиков другие алгоритмы.