Именно так у нас часто и бывает - чем пользуюсь, то и ругаю:))
Яндекс плохо индексирует, очень плохо ищет и очень плохо работает с дубликатами.
Примеры приводились неоднократно. Например яндекс очень плохо индексирует ЖЖ и ищет в ЖЖ.
Конкретно, например, этот журнал быстро индексируется, и всё, что тут есть быстро находится в Интернете.
Но, например, тут http://ru-seo.livejournal.com/986194.html?thread=10021970#t10022482
в комментариях народ жалуется, что у них журналы не индексируются. Я проверял - действительно не индексируются. Человек пишет, пишет, но в яндексе это написанное найти невозможно.
То есть, в Интернете есть огромные залежи информации, которую мы не видим, потому что не можем найти.
Это вообще-то обидно. Ведь часто очень нужная информация есть, но мы просто не можем ее найти.
Я всегда знал, что яндекс не умеет искать дубликаты. На радость пиратам и накрутчикам.
А сегодня еще нашел яркий пример, насколько яндекс плохо ищет дубликаты и к чему это приводит.
Вот конкретный пример:
Моя статья про усадьбу Сергиевка:
Тайны парка Сергиевки http://pvn123.livejournal.com/199093.html
Эту статью попросила перепечатать девушка с marinatur.ru
И я с удовольствием разрешил. Мне не жалко.
И эта статья появилась здесь: http://www.marinatur.ru/blogs/10548
И нет никаких сомнений, где оригинал, а где копия. И на самой копии указано, что оригинал здесь http://pvn123.livejournal.com/199093.html.
Но яндекс этого не способен понять.
Делаем простой запрос в яндексе "усадьба Сергиевка"
Всего выдача 8700 ссылок
На пятом месте стоит копия моей статьи на marinatur.ru.
А оригинал статьи?
А на каком месте находится оригинал, я не нашел - долго листать:)
Хотя и оригинал там тоже есть, это легко установить поиском с галочкой "в найденном".
Делаем запрос "усадьба Сергиевка pvn123" в найденном.
Получаем уже 176 ответов.
Там оригинал на первом месте.
На втором месте - битая ссылка (яндекс не в состоянии даже нормально освежать ссылки, и выводит их аж в топы).
И только на третьем - marinatur.ru.
Это просто как иллюстрация.
Иллюстрация того, что с дубликатами ситуация очень плоха.
А это значит, что спамеры будут продолжать наращиться количество и качество дублей.
И Интернет (во всяком случае при взгляде через яндекс) будет все больше становиться похожим на городскую свалку мегаполиса.
Еще недавно опять прогулялся по Сергиевке.
Отчет пока не выкладываю для всех, пока в тестовом виде:
http://pvn123.livejournal.com/228470.html