Сталкер - блог веб-программиста - Комментарии к "Мысли по поводу уникального контента. Практическая реализация." /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya RSS лента комментариев к "Мысли по поводу уникального контента. Практическая реализация." ru что то не фурычит скрипт, /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-638

что то не фурычит скрипт, создает пустую папку в дериктории аут и все

Tue, 15 Sep 2009 16:34:53 +0000 Гость comment 638 at http://stalker-x.ru
С парсингом самой выдачи /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-261

С парсингом самой выдачи проблем не возникает. Бан случается, когда подряд идет дофига запросов в кеш гугля. Как это "очеловечить" я не представляю, поскольку css и картинки гугль у себя не хранит, да и нормальные люди по кешу в таких количествах не шарятся. Так что остается только прокси.

Wed, 18 Feb 2009 16:53:03 +0000 Alek$ comment 261 at http://stalker-x.ru
сенкс за скрипт, как раз /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-260

сенкс за скрипт, как раз планировал писать :)
Навскидку пару идей как обойти проблему
1. Прокси - железобетонное решение. Прокси геморно искать, они дохнут как мухи, вобщем мне стало влом.
2. "Более натуральное поведение" - вытягивать по 10 страниц, не только скрипт, но и картинки\css\вообще все вхождения, дальше 5й страницы не заходить. По идее таким раком можно вытянуть дохера
3. Забить на гугл. Подсказка - база гугла много где юзается, зато защиты наверняка нет. Раньше можно было через aol тянуть, сейчас уже лень искать как еще можно.

Wed, 18 Feb 2009 13:05:16 +0000 zhil comment 260 at http://stalker-x.ru
Затея провалилась. Все равно /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-169

Затея провалилась. Все равно банит.
Прокси - это следующий шаг, но до него у меня пока руки не дошли.

Tue, 06 Jan 2009 14:05:24 +0000 Alek$ comment 169 at http://stalker-x.ru
Подскажите, насчет отправки /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-168

Подскажите, насчет отправки запросов через разные датацентры, что то получилось сделать?, и еще вопрос а если реализовать отправку через прокси? Мне нужно напарсить 3000 страниц из кэша, может ставить побольше задежку чтоб гугля не банила?

Tue, 06 Jan 2009 11:38:37 +0000 Stas comment 168 at http://stalker-x.ru
Если бы вы /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-122

Если бы вы прочли первый пост, вы бы поняли. Идея в том, что скачивается он с уже не уществующих сайтов. И, отлежавшись до тех пор, пока поисковики не очистят кеш для этого сайта, контент становится уникальным. И если изначально он был уникален, то и после он будет уникален, но на другом сайте.

Tue, 16 Dec 2008 16:46:08 +0000 Alek$ comment 122 at http://stalker-x.ru
не пойму как /blog/alek%24/mysli-po-povodu-unikalnogo-kontenta-prakticheskaya-realizatsiya#comment-121

не пойму как этот контент будет считаться уникальным, если его скачали с других сайтов?

Tue, 16 Dec 2008 16:37:39 +0000 Kastoff Alex comment 121 at http://stalker-x.ru