Все мы знаем о большом приоритете для нашего любимого гугленка уникальности контента на сайте. Не будем повторяться на эту тему , а сразу перейдем к решению данной проблемы. С литературным переводом у меня хреново , но общие черты работы метода я опишу. Автор некий тип с блога BlueHatSeo описал технологию получения уникального контента несколько необычным способом.
Итак начнем с введения. Известно , что тот контент что не находится в поисковой базе гугленка , считается им уникальным. Предположим- вы написали(купили) уникальный контент ,разместили на своем сайте .а его кто-нибудь технично упер и опубликовал на своем сайте. Теперь вопрос - если контент размещенный на его странице проиндексируется быстрее вашего , то кто будет авторитетнее ? Правильно - кто успел , тот и съел. Но это из другой темы навеянной другим фактом , который мы счас рассмотрим.
Так же база гугля не резиновая и он не будет хранить старые страницы (года эдак 1998-2000) на своих быстрых дисках. Так же известно , крупные проекты гугленок индексирует неочень качественно (ну заиндексит 60% и скажет достаточно). А на этих страничках как раз и контент уникальный для гугленка.
Итак весело бежим на Archive.org и вводим в форму поиска URL сайта чтоб найти архив какого-нибудь крупного портала . Ну например www.looksmart.com. Появиться список архивированных страниц этого сайта по годам и месяцам. Берем , например , 29 февраля 2000 года , появиться архивная страничка сайта . Там выберем раздел Travel . Вываливается список сайтов по этой категории . Возьмем сайт www.oceancitygolf.com и его страничку с "Ocean City Maryland Golf Packages and Golf Travel Vacations -- Ocean City Go..." . А теперь проверьте эту страничку в гугленке - что нема ?Ну вот кусочек
текста вы уже нарыли.
Но этот способ для садомазохистов . Вышеупомянутый товарисч предлагает другой способ :
1)Береться sitemap от какого-нибудь путевого сайта , где контента поболее.
2)Ляпается скрипт , который проверяет в гугленке все ссылки на наличие в индексе (site:site.com/page.html)
3)Если страница в индексе - нафиг ее , остальные в отдельный список.
4)Проверяется - подходит ли на оставшихся страницах нам контент.
Способов поиска sitemap достаточно , скрипт написать - дело десяти - двадцати минут .
Есть еще один способ - проверить на страницы которые появляются в индексе : некоторые разработчики сайтов используют свои страницы для 404 ошибки . Ну так найдите такие страницы и проверьте их , сначала в гугленке , а потом в остальных поисковиках.
ну вот и все.
pS : на досуге захреначу скрипт - и локальный и серверный , но попозже : счас времени нет , может завтра или послезавтра.



