Google дает сделать около 20 запросов и выбрасывает капчу. Не влияют ни интервалы между запросами, ни даже вход под разными Ip (кстати, как же ему тогда удается отлавливать?). Можно ли каким-либо образом, используя WebDriver, организовать автоматические запросы?
Как обойти ограничение по числу запросов от Google?
#1
Отправлено 21 февраля 2016 - 07:30
#2
Отправлено 21 февраля 2016 - 09:25
Пользовательский интерфейс Google не предназначен для того, чтобы через него выполнялись действия роботами, и препятствует этому.
Вместо этого нужно использовать Search API: https://developers.g...api/v1/overview
(и для выполнения большого количества запросов нужно платить за использование сервиса, да)
Тренинги для тестировщиков (тестирование производительности, защищенности, тест-дизайн, автоматизация):
Линейка тренингов по Selenium
#3
Отправлено 21 февраля 2016 - 10:00
Пользовательский интерфейс Google не предназначен для того, чтобы через него выполнялись действия роботами, и препятствует этому.
Вместо этого нужно использовать Search API: https://developers.g...api/v1/overview
(и для выполнения большого количества запросов нужно платить за использование сервиса, да)
А какое количество запросов можно считать большим? Ну т.е. какое количество и за какое время можно делать бесплатно?
#4
Отправлено 21 февраля 2016 - 19:17
Search API это, конечно интересно, однако он выдает поразительную разницу с количеством результатов, найденных в стандартном пользовательском поисковике Google. Например, если в поисковике вбить запрос Beatles, то получим что-то около 107 000 000 результатов. А если то же самое сделать в Google Custom Search (ну, или воспользоваться Search API), то получим только 10 900 000. Почему возникает огромная разница почти в 10 раз?
P.S. Google Custom Search настроен на поиск во всем интернете, никаких фильтров или ограничений по используемым сайтам для поиска не применялось.
#5
Отправлено 22 февраля 2016 - 05:41
Про количество запросов и стоимость есть информация как раз на той самой странице по ссылке.
Что касается количества результатов и даже самих результатов -- конечно нет никаких гарантий, что API будет возвращать в точности то же самое, что и пользовательский интерфейс. Я лишь хотел сказать, что Google активно препятствует использованию пользовательского интерфейса роботами и предложил "официальную" альтернативу.
Кстати, а как Вы организовали использование разных IP-адресов? И насколько много их было, разных?
Тренинги для тестировщиков (тестирование производительности, защищенности, тест-дизайн, автоматизация):
Линейка тренингов по Selenium
#6
Отправлено 22 февраля 2016 - 08:53
Про количество запросов и стоимость есть информация как раз на той самой странице по ссылке.
Что касается количества результатов и даже самих результатов -- конечно нет никаких гарантий, что API будет возвращать в точности то же самое, что и пользовательский интерфейс. Я лишь хотел сказать, что Google активно препятствует использованию пользовательского интерфейса роботами и предложил "официальную" альтернативу.
Кстати, а как Вы организовали использование разных IP-адресов? И насколько много их было, разных?
Есть 3 VPN на 3 разных сервера. Подключаюсь через первый VPN, делаю запрос Google (хоть через браузер при помощи WebDriver, хоть через get-запрос из скрипта), Возвращаюсь на пустую страницу браузера, отключаю соединение VPN и перехожу к следующему VPN, делаю второй запрос Google, ну и т.д. Через 20 запросов получаю капчу. Никакой разницы, как если бы делать запросы напрямую с одного Ip.
Что же касается Custom Search API, то согласен конечно, что разница по сравнению с запросами в Google может быть, но согласитесь, - в 10 раз это уж слишком. Причем закономерность соблюдается по отношению ко всем запросам - это уж какая то система.
#7
Отправлено 22 февраля 2016 - 08:59
#8
Отправлено 22 февраля 2016 - 10:30
#9
Отправлено 22 февраля 2016 - 10:57
Вы кукисы чистите? Гугл ставит куку, по ней определяет время и кол-во запросов. Во всяком случае с google ads так. Я вообще ставлю фейк кукиес для некоторых вещей.
Нет, не чистил. Надо попробовать.
Количество пользователей, читающих эту тему: 0
0 пользователей, 0 гостей, 0 анонимных