Versão final do tutorial
This commit is contained in:
parent
b0b016a4d9
commit
384488b283
13 changed files with 1046 additions and 310 deletions
38
README.md
Normal file
38
README.md
Normal file
|
@ -0,0 +1,38 @@
|
|||
# Raspando Dados Da Internet Com Python
|
||||
## Python Brasil 2023 - 31 / 10 / 2023
|
||||
|
||||
## Sobre o tutorial
|
||||
|
||||
A informação é abundante e está facilmente disponível na Internet. No entanto, a enorme quantidade de dados pode
|
||||
ser esmagadora e demorada para navegar. É aí que entra a raspagem de dados - uma ferramenta poderosa usada para
|
||||
extrair dados de sites e transformá-los em um formato utilizável.
|
||||
|
||||
Neste tutorial, exploraremos os fundamentos de raspagem de dados e como implementá-los usando Scrapy (um
|
||||
framework Python). Quer você seja um analista de dados, programador ou pesquisador, este tutorial irá
|
||||
equipá-lo com as habilidades fundamentais necessárias para criar seu próprio raspador e extrair informações
|
||||
valiosas de sites.
|
||||
|
||||
## Antes do tutorial
|
||||
|
||||
Clone este repositório para ter acesso à apresentação e também à solução do código dos exercícios sugeridos:
|
||||
https://github.com/rennerocha/europython-2023-gathering-data-tutorial
|
||||
|
||||
Durante o tutorial espera-se que você tente resolver alguns pequenos exercícios usando
|
||||
[Scrapy](https://scrapy.org), um framework de web scraping. Será a única biblioteca necessária para ser instalada
|
||||
(quaisquer outras dependências deverão ser instaladas junto com ela).
|
||||
|
||||
Siga o [guia de instalação do Scrapy](https://docs.scrapy.org/en/latest/intro/install.html) de acordo com sua
|
||||
plataforma e certifique-se de que você consegue executar a `versão do scrapy` em seu terminal e veja
|
||||
`Scrapy 2.11.0` como resultado (sem erros).
|
||||
|
||||
Na plataforma Linux sugiro a utilização de um ambiente virtual. Se tudo estiver certo, só será necessário executar alguns
|
||||
comandos para ter tudo funcionando e pronto para utilização:
|
||||
|
||||
```
|
||||
$ git clone https://github.com/rennerocha/pybr2023-tutorial.git tutorial
|
||||
$ cd tutorial
|
||||
$ python3 -m venv .venv
|
||||
$ source .venv/bin/activate
|
||||
$ cd code
|
||||
$ python -m pip install -r requirements
|
||||
```
|
Loading…
Add table
Add a link
Reference in a new issue