Как Яндекс борется с оригинальностью

Сегодня команда Яндекса опубликовала новость, которая, казалось бы, должна порадовать владельцев контентных сайтов, потому что, теоретически, у них теперь будут меньше красть текстов злые копипастеры, которым, на самом деле, все равно, что красть. Да, все мы знаем, что красть нехорошо, а сеошники до конца уверены, что Яндекс фильтрует (и даже банит в поиске) те сайты, которые крадут информацию у других, однако, реальность совсем не такая, какой ее хочет видеть наш кривой поисковик.

Я совсем не фанат Яндекса, даже к Google у меня есть куча претензий — хотя я лишь мелкая мошка, которая легко прячется на теле этих двух мамонтов. Почему мамонтов? Ну, наверное, потому, что, со всеми усовершенствованиями в своих поисковых алгоритмах, к верному результату они прийти никак не могут. Никогда не забуду новости годовой (а то и больше) давности, когда Яндекс обещал убрать порнографию из результатов невинного поиска, а потом полинтернета прикалывались, какие выходят результаты на довольно популярные запросы.

Сегодняшняя новость выглядит так:

Многие вебмастеры знают, как обидно обнаружить копию своего текста, размещенную на чужом сайте, которая в результатах поиска находится выше оригинала.Чтобы честные вебмастеры расстраивались как можно реже, Яндекс старается отдавать предпочтение оригиналам. Благодаря сегодняшнему обновлению страницы, содержащие авторский контент, стали ранжироваться лучше.

В большинстве случаев наш поисковик правильно определяет автора документа, убирая копии из выдачи. Обычный пользователь ссылки на ресурсы с «копипастой» не увидит, но у вебмастера есть возможность посмотреть, где и кем используются его тексты. Чтобы увидеть результаты поиска без фильтрации, нужно пройти по ссылке «Показать все ответы без исключения» в конце выдачи.

Мы хотим сделать определение авторства еще точнее, поэтому если ваш оригинальный текст ранжируется хуже копии, сообщите, пожалуйста, нашей службе поддержки.

Разумеется, Яндекс не пытается оценить законность копирования текста. Мы отдаем предпочтение авторской публикации, даже если дальнейшее ее распространение происходит с полного согласия автора.

В общем, перефразируя Маяковского: больше текстов, хороших, но разных.

В современном интернете нет ничего сложнее, чем взять и поставить ссылку — конечно, надо сделать тяжелый моральный выбор и порадовать автора, потому что скопировать текст просто, а вот адрес указать, для тех, кому статья понравилась, это уже лишнее. Потому напрягаться не надо, бери и копируй. Однако, иногда даже ссылка не спасает.

Мы, например, регулярно (раз в месяц-два) мониторим интернет (через Яндекс, кстати), насчет того, кто нас скопировал, процитировал, украл. Для этого берем пару последних новостей или статей и вбиваем в поисковик запрос с текстом из них, только данный в кавычках. В таком случае, вы обязываете поисковик искать только точную цитату (возьмите на вооружение, если не знали). Вот, к примеру. Кстати, на этот запрос у нас вышел такой вот ответ:

yandex_copypasted Скриншот: Яндекс

Согласно последней новости, по этому запросу на первом месте должна быть наша оригинальная новость (которую мы и искали, кстати). Вместо этого, там красуется сервис RSS-читалок, а наш сайт открывается при «Показать все без исключения». В принципе, ничего криминального, ведь в нашем фиде содержится ссылка на источник, которая ведет на наш сайт. Но насколько это правильно? Почему здесь не Feedburner, к примеру? Более того, чем сайт с фидочиталками лучше копипастеров? Тем, что сделали граббер и репостят новости без претензий? Хорошо, но почему они тогда значатся в качестве источника новости, тем более, что в тексте явно содержится ссылка на оригинал?

Примерно месяц назад я потратил суммарно минут двадцать на тупую переписку с Яндексовским полуботом Платоном Щукиным (иногда создается впечатление, что там только такие и работают, хотя я знаю, как минимум, одного очень хорошего фотографа и просто живого человека Александра Артеменко, который под мои глюки, естественно, не подходит), доказывая ему, что Subscribe.ru просто не может быть источником новостей. Результатом было письмо в сам Subscribe.ru, чьи админы оказались живыми (а соответственно, более вменяемыми) людьми и просто убрали наш фид из публикации.

Так что, теперь надо обойти все грабберы и попросить их сделать то же самое? Или просто исключить бот Яндекса от того, чтобы он своими грязными ногами топтался по нашему сайту?

Дорогой Яндекс, неужели так сложно в тексте отыскать ссылку «Постоянная ссылка» и включить мозг, а не свой компьютеризированный мегапроцессор, который, хоть и очень дорогой (компания собралась размещаться на Нью-Йоркской бирже, дорогие инвесторы), получается, явно не выполняет своих функций?

Тем не менее, все это пустяки, на них можно закрыть глаза, нам должно быть наплевать на то, как поисковики нас индексируют, но наплевать нам будет лишь тогда, когда в этом вопросе мы поставим точку. Мы с уважением относимся к копирайту, что дает нам право надеяться на похожее отношение и со стороны других. С копипастеров взять нечего, их даже понять можно, ведь они этим вроде как деньги зарабатывают, но вот когда видишь неуважение к авторским правам со стороны самого крупного поискового сайта из отечественных производителей, хочется гнать этот глупый поисковик с сайта взашей. Мы не собираемся резать фиды, чтобы репостились только их неполные версии, мы не собираемся вообще никак ущемлять наших читателей (у нас постоянных и верных последователей около 200 человек, но мы в них верим), но если такое отношение и дальше будет существовать на этом забытом богом сайте, мы его просто лишим права доступа сюда. Поверьте, это сделать проще, чем кажется.

16 комментариев

  • С копипастеров взять нечего, их даже понять можно, ведь они этим вроде как деньги зарабатывают, но вот когда видишь неуважение к авторским правам со стороны самого крупного поискового сайта из отечественных производителей, хочется гнать этот глупый поисковик с сайта взашей.

    При чем здесь неуважение к авторским правам. Любой поисковик знать ничего не знает про авторские права и не обязан. То, что Яндекс начал делать хоть какие-то попытки изменить эту ситуацию, по моему, говорит в его пользу.

    Да, ранжирование результатов сложная штука. да, она много может не учитывать или учитывать неправильно. Никто ведь и не обещал, что оно сразу, и для всех заработает так как надо?

    Закрывать сайт от индексации, я считаю, глупо. И вижу только один выход — писать грамотные багрепорты в службу поддержки Яндекса. Мол, по такому-то запросу выдаются те-то сайты на таких-то позициях, хотя вот этот должен быть на такой-то, потому что первоисточник.

    Вот как-то так.

    • Саша, багрепорты писать скучно. Могу даже такой двухмесячный тред здесь текстовым файлом написать. Если писать серьезно, считают за идиота, если начинать вашего Платона подкалывать, он принимает это за чистую монету. Говорю же, бот. «Делать попытки» надо было года четыре назад, в яндексовской новости куча народу про это высказывается. А пытаться подогнать поисковик сегодня под то, что Гугл выдает всегда, причем считать это великим достижением, по-моему, некрасиво.

      По поводу закрытия индексации — как я сказал, это болезненно только для нас. Никто от этого больше, чем наше собственное эго, не пострадает. Пользователи найдут копирастерские тексты в других точках, хостер выиграет от уменьшившейся посещаемости, яндексу не придется искать оригинал и отвечать на глупые письма, а наше сообщество ничего не заметит, потому что читает новости по RSS.

      Travel Fan, ничего ужасного там не вижу. Фокусы на справедливом первом месте, два копирастерских ресурса на остальных.

  • Еще чуток разочарую.

    Google

  • Aleck says:

    Методично долбать Яндекс, чтобы изменить ситуацию. Это игра такая. Я их достану! ))

    • Aleck правильно сказал. Я удовольствие получаю хотя бы оттого, что гружу работой хотя бы одного человека оттуда. Остальные вполне могут отдыхать и заниматься более важными делами.

  • Илюха says:

    UncleSam: Ну если побороть их не удается – не трать силы и время. Просто наплюй! :)) Или ты надеешься, что кто-нибудь из Яндекса, прочитав эту статью, засовестится и помчится всё исправлять? Да на фих им это надо, их и так “неплохо кормят” :)) Мне кажется, потраченные тобой нервы просто не стоят этого…
    А если стоят – нанимай грамотного юриста и составляй качественную претензию! :)))

  • Сергей, к вам, к этому блогу, к моему блогу. Да к большинству блогов.

  • Артём – изучите историю рейтингов русской блогосферы (и поиска по ней) в момент любых политических волнений или момента когда Яндексовая команда просыпается и переключается между ручным и автоматическим обновлением. Это очень смешно выглядело в моменты, когда, к примеру – процессы шли надо Ходорковским и все зудели про это, но в топах блогоновостей все было совершенно иначе.

    Если же подколка про никому не известный и не нужный сайт была ко мне, ну что я могу сказать – рад за вас, да.

    • Я знаю, что ручная игра в Яндексе есть. Банально видно на примере той же Википедии — ее никто не оптимизирует, и все же она всегда стоит выше всех оптимизаторских вещей. Это опровергает их утверждение про то, что они этим не занимаются. Собственно, кто сказал, что на википедии что-то написано лучше? По поводу того, что Яндекс или Гугл не могут в тексте найти «Постоянная ссылка», «Источник», «Взято с» и прочие довольно шаблонные вещи… несмешно это, совсем несмешно.

      Я знаю, что верстка здесь ужасная, что тему надо менять и пр. Нету совершенной темы, честно, а самому рисовать… результат будет примерно как с подкастом, но к нему вот никто не придирается. Кстати, Артем, спасибо за мысль про контент в конце страницы, в следующей теме обязательно ее учту. Хотя, откровенно говоря, Яндексу должно быть на это наплевать. Что если бы я сам писал шаблон? Да я бы столько ошибок наклепал, что вообще в результатах фокусы никогда бы не появились. Слово «копирасты» тоже понравилось, думаю, надо его укоренить в русском интернетном.

      По поводу менять позицию в запросе — не нужно менять позицию блогов, нужно просто учесть, что есть сервисы по публикации фидов. На фидбернер не выдаются же ссылки совсем. И я знаю почему, все та же ручная модерация, нелюбовь к сервисам конкурента.

      Искусственный интеллект изобрели, его зовут Платон Щукин. Кто с ним общался, поймет.

      А пробить запрет Яндексу в robots (или даже в htaccess), наверное, очень приятная мысль. Ну уйдут какие-то 4-5 тысяч показов, но останутся постоянные читатели и весь гугл. При том, что коэффициент отказов в районе 80%, можно смело сказать, что это все посетители с поисковиков, соответственно, без них и обойтись можно, потому что сообщество формируют не они, а число посещений важно только для рекламы, которой здесь практически нет, вон, один баннер вверху висит. По любому запросу сейчас массу инфы можно найти в сети, так что конечный пользователь тоже не пострадает. Я хочу сказать, что если поступиться личными амбициями, остальному миру на это будет наплевать. Вон, rosbest исчез, разве кто-то плачет?

  • Я обычно выше копирастов, но не всегда. Вообще (по личным ощущениям) тут очень сильно помогает хорошая вёрстка.

    Кстати, идея засунуть весь полезный контент в самый конец документа — далеко не самая лучшая.

  • PS: Я, кстати нахожусь обычно месте на шестом-десятом, после многочисленных перепостов RSS ленты и просто копий статей..

  • Сергей, неужели вы правда верите, что Яндекс будет менять позицию никому неизвестного и ненужного сайта сам, без чего-либо запроса? :)

  • Vendigo – ошибка в рассуждении. Яндексовые подтасовки в поиске, ручное изменение индексов и тп (в том числе и ради корректности к власти) – хорошо известны. Поэтому именно что руками.

  • Сергей, я думаю, ты гораздо лучше разбираешься в теме поисковой выдачи чем я. Все таки твой успешный опыт в интернете, гораздо богаче моего. Но тут я с тобой не совсем согласен.

    Ты предъявляешь справедливые претензии к Яндексу, по нескольким частным случаям. Но алгоритмы Яндекса и Гугла, это именно что алгоритмы. Никто же вручную приоритеты не задает.

    “Дорогой Яндекс, неужели так сложно в тексте отыскать ссылку «Постоянная ссылка» и включить мозг, а не свой компьютеризированный мегапроцессор”

    В том то и дело, что все запросы и сайты, анализируются программно, а поскольку искусственного интеллекта еще не изобрели, то неизбежны ошибки. Успешность таких проектов как Яндекс и Гугл, держится на том, что в целом все более менее работает в соответствии с замыслом.

    Вот ты упомянул, что Яндекс плохо фильтрует порно, ну это же естественно. Понятие порно, же нельзя формализировать, так что бы его однозначно описывал алгоритм. Да что там алгоритм, сами люди оценивая снимок, могут разойтись во мнениях что это ню, или порно ))

  • Да лишите уже, какие проблемы. Кому от этого станет хуже? Ох, смешно мне.

  • Svetlay says:

    Страсти мордасти!

Leave a Reply

Your email address will not be published. Required fields are marked *

*