Nos meus primeiros dias na Web, eu estava interessado em extrair e coletar dados com base nos resultados das pesquisas do Google. Naquela época, era mais fácil fazer scraping do Google, mas agora os resultados de pesquisa do Google são tão dinâmicos que o senhor não pode contar com o retorno do mesmo HTML ou da mesma estrutura de dados. Acrescente CAPTCHAs, limites de taxa, etc., e a tarefa se torna ainda mais difícil.

Se o senhor precisa de resultados confiáveis, é melhor usar um serviço incrível como o serpstack: uma API que pode analisar os resultados do Google e fornecer ao senhor os dados em um formato lógico e confiável!
Acesso rápido
- Fornece resultados para pesquisa padrão, mapas, compras, imagens, clima e muito mais
- Fornece informações de anúncios por pesquisa, para permitir que o usuário veja quem está competindo com o senhor por quais palavras-chave
- Escolha o local de sua solicitação para obter resultados localizados
- Trazido até os senhores pela apilayer, criadores do currencylayer, mailboxlayer, userstack, etc.
- Gratuito para começar!
Depois de se inscrever na sua conta, o senhor pode fazer solicitações aos pontos de extremidade da API do serpstack para obter os dados desejados – alguns parâmetros principais incluem:
query
– o termo de pesquisa a ser executadotype
– direcionar diferentes tipos de pesquisa: web, imagens, vídeos, notícias ou comprasdevice
– celular, desktop ou tablet
Existem dezenas de outras opções dependendo do tipo de pesquisa que o senhor está executando, como:
image_size
: ícone, médio ou grandeimages_type
: clipart, line_drawing ou gifnews_type
: blogs, etc.
A resposta para as pesquisas também será variável, dependendo do tipo de pesquisa e das opções com as quais o senhor envia sua solicitação; aqui está um detalhamento do serpstack categorias de resposta com base na posição na página:

Então, vamos fazer algumas solicitações de amostra usando a API do serpstack:
# Get web results from tablet device http://api.serpstack.com/search ?access_key=MY_API_KEY &type=web &device=tablet &query=david+walsh # Get the second page of shopping results from Canada http://api.serpstack.com/search ?access_key=MY_API_KEY &type=shopping &location=ca &page=2 &query=trailer+park+boys
A serpstack é uma API realmente incrível e incrivelmente detalhada. Os resultados de pesquisa do Google se tornaram tão variáveis que escrever seu próprio scraper/parser é uma tarefa árdua. Mas o poder de rastrear seus próprios resultados e os resultados de seus concorrentes? Não tem preço!