Forum
>>
Programmazione Python
>>
Web e Reti
>>
Web scraping
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
Scritto da Jack_37 |
2023-08-28 19:34:34 - Web scraping
|
Volevo gentilmente chiedere, come si può fare, magari con la libreria Scrapy, o Selenium; a prendere delle informazioni, quali: testo, ed immagini, di un sito web.
Grazie |
|
Scritto da Daniele aka Palmux |
2024-02-04 09:50:39 - Re: Web scraping
|
Ciao caro.
Cosa ti serve sapere con esattezza? Quasi tutto quello che ti serve sapere lo trovi qui, punto di partenza obbligatorio. Cya |
|
Scritto da assroal asaeela |
2024-11-20 05:01:25 - Re: Web scraping
|
import scrapy class ExampleSpider(scrapy.Spider): name = 'example_spider' start_urls = ['https://www.example.com'] # Inserisci qui l'URL da cui fare scraping def parse(self, response): # Estrai il testo titolo = response.css('h1::text').get() # Estrae il testo dell'elemento <h1> paragrafi = response.css('p::text').getall() # Estrae tutti i testi nei paragrafi <p> # Estrai le immagini immagini = response.css('img::attr(src)').getall() # Estrae gli URL delle immagini yield { 'titolo': titolo, 'paragrafi': paragrafi, 'immagini': immagini |
|
Scritto da Joanna |
2024-12-12 07:22:06 - Re: Web scraping
|
Hi!
For static sites , use Scrapy: Install:pip install scrapyWrite a spider to extract text ( response.css('p::text')) and images ( response.css('img::attr(src)')).For dynamic sites , use Selenium: Install:pip install seleniumUse a browser driver to load the page, then extract text ( element.text) and images ( img.get_attribute('src')).Choose Scrapy for speed and Selenium for handling JavaScript. Thank you |
Pagina: 1
Esegui il login per scrivere una risposta.