pvn123 Павлов Василий Николаевич. Итака (pvn123) wrote,
pvn123 Павлов Василий Николаевич. Итака
pvn123

Categories:

Тайны парка Сергиевки в Интернете

Я частенько ругаю яндекс за полное неумение работать.

Именно так у нас часто и бывает - чем пользуюсь, то и ругаю:))

Яндекс плохо индексирует, очень плохо ищет и очень плохо работает с дубликатами.

Примеры приводились неоднократно. Например яндекс очень плохо индексирует ЖЖ и ищет в ЖЖ.

Конкретно, например, этот журнал быстро индексируется, и всё, что тут есть быстро находится в Интернете.

Но, например, тут http://ru-seo.livejournal.com/986194.html?thread=10021970#t10022482
в комментариях народ жалуется, что у них журналы не индексируются. Я проверял - действительно не индексируются. Человек пишет, пишет, но в яндексе это написанное найти невозможно.

То есть, в Интернете есть огромные залежи информации, которую мы не видим, потому что не можем найти.

Это вообще-то обидно. Ведь часто очень нужная информация есть, но мы просто не можем ее найти.

Я всегда знал, что яндекс не умеет искать дубликаты. На радость пиратам и накрутчикам.
А сегодня еще нашел яркий пример, насколько яндекс плохо ищет дубликаты и к чему это приводит.

Вот конкретный пример:
Моя статья про усадьбу Сергиевка:
Тайны парка Сергиевки http://pvn123.livejournal.com/199093.html

Эту статью попросила перепечатать девушка с marinatur.ru
И я с удовольствием разрешил. Мне не жалко.

И эта статья появилась здесь: http://www.marinatur.ru/blogs/10548

И нет никаких сомнений, где оригинал, а где копия. И на самой копии указано, что оригинал здесь http://pvn123.livejournal.com/199093.html.

Но яндекс этого не способен понять.

Делаем простой запрос в яндексе "усадьба Сергиевка"

Всего выдача 8700 ссылок

На пятом месте стоит копия моей статьи на marinatur.ru.

А оригинал статьи?

А на каком месте находится оригинал, я не нашел - долго листать:)
Хотя и оригинал там тоже есть, это легко установить поиском с галочкой "в найденном".
Делаем запрос "усадьба Сергиевка pvn123" в найденном.

Получаем уже 176 ответов.
Там оригинал на первом месте.
На втором месте - битая ссылка (яндекс не в состоянии даже нормально освежать ссылки, и выводит их аж в топы).
И только на третьем - marinatur.ru.

Это просто как иллюстрация.
Иллюстрация того, что с дубликатами ситуация очень плоха.
А это значит, что спамеры будут продолжать наращиться количество и качество дублей.
И Интернет (во всяком случае при взгляде через яндекс) будет все больше становиться похожим на городскую свалку мегаполиса.


Еще недавно опять прогулялся по Сергиевке.

Отчет пока не выкладываю для всех, пока в тестовом виде:
http://pvn123.livejournal.com/228470.html
Tags: ИТ
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 37 comments