Wprowadzenie.
We wpisie dowiesz się jak odczytać adres URL strony z wykorzystaniem modułu selenium w Pythonie.
Zakres artykułu.
- Jak odczytać adres URL strony?
- Test
- Zasoby
- Źródła
Jak odczytać adres URL strony?
W celu odczytania adresu URL strony internetowej przy użyciu modułu selenium w języku Python należy skorzystać ze zmiennej current_url obiektu driver. Obiekt driver jest instancją klasy webdriver.Firefox().
driver.current_url
Możemy też sprawdzić jakiego typu jest zmienna current_url przy pomocy wbudowanej metody type() [1].
type(driver.current_url)
Cały kod programu prezentuje się następująco
#!/usr/bin/env python3 # -*- coding: utf-8 -*- from selenium import webdriver def main(): driver = webdriver.Firefox() driver.get("https://www.google.pl") page_url = driver.current_url print(f'Typ page_url: {type(page_url)}') print(f'Adres URL strony: {page_url}') driver.quit() if __name__ == '__main__': main()
Test
W celu przetestowania, wyników skryptu należy otworzyć terminal. W terminalu przechodzimy do folderu, w którym znajduje się środowisko wirtualne naszego projektu.
Aktywujemy nasze środowisko wirtualne poleceniem
source venv/bin/activate
Następnie w terminalu przechodzimy do miejsca, gdzie znajduje się nasz skrypt, a następnie wpisujemy komendę do uruchomienia skryptu.
./main.py
Po wykonaniu skryptu powinniśmy zobaczyć w terminalu typ zmiennej current_url oraz aktualny adrers url strony.
Zasoby
Źródła
[1] Oficjalna strona Selenium – Browser interactions, Dostęp z dnia 11 Sierpnia 2023 z https://www.selenium.dev/documentation/webdriver/interactions/