Web scraping | Linguaggio di programmazione Python

Forum >> Programmazione Python >> Web e Reti >> Web scraping

Pagina: 1

Scritto da Jack_37 Messaggi 1 Registrato il 2023-08-28 19:22:52	2023-08-28 19:34:34 - Web scraping
	Volevo gentilmente chiedere, come si può fare, magari con la libreria Scrapy, o Selenium; a prendere delle informazioni, quali: testo, ed immagini, di un sito web. Grazie
Scritto da Daniele aka Palmux Messaggi 1386 Registrato il 2012-03-17 01:43:25	2024-02-04 09:50:39 - Re: Web scraping
	Ciao caro. Jack_37 said @ 2023-08-28 19:34:34: Volevo gentilmente chiedere, come si può fare, magari con la libreria Scrapy, o Selenium; a prendere delle informazioni, quali: testo, ed immagini, di un sito web. Cosa ti serve sapere con esattezza? Quasi tutto quello che ti serve sapere lo trovi qui, punto di partenza obbligatorio. Cya
Scritto da assroal asaeela Messaggi 2 Registrato il 2024-11-20 04:56:48	2024-11-20 05:01:25 - Re: Web scraping
	import scrapy class ExampleSpider(scrapy.Spider): name = 'example_spider' start_urls = ['https://www.example.com'] # Inserisci qui l'URL da cui fare scraping def parse(self, response): # Estrai il testo titolo = response.css('h1::text').get() # Estrae il testo dell'elemento <h1> paragrafi = response.css('p::text').getall() # Estrae tutti i testi nei paragrafi <p> # Estrai le immagini immagini = response.css('img::attr(src)').getall() # Estrae gli URL delle immagini yield { 'titolo': titolo, 'paragrafi': paragrafi, 'immagini': immagini
Scritto da Joanna Messaggi 2 Registrato il 2024-12-06 07:16:29	2024-12-12 07:22:06 - Re: Web scraping
	Hi! For static sites , use Scrapy: Install:pip install scrapyWrite a spider to extract text ( response.css('p::text')) and images ( response.css('img::attr(src)')).For dynamic sites , use Selenium: Install:pip install seleniumUse a browser driver to load the page, then extract text ( element.text) and images ( img.get_attribute('src')).Choose Scrapy for speed and Selenium for handling JavaScript. Thank you

Pagina: 1

Esegui il login per scrivere una risposta.