Wprowadzenie.
We wpisie dowiesz się jak odczytać tytuł strony z wykorzystaniem modułu selenium w Pythonie.
Zakres artykułu.
- Jak odczytać tytuł strony?
- Test
- Zasoby
- Źródła
Jak odczytać tytuł strony?
W celu odczytania tytułu strony internetowej przy użyciu modułu selenium w języku Python należy skorzystać ze zmiennej title obiektu driver. Obiekt driver jest instancją klasy webdriver.Firefox().
driver.title
Możemy też sprawdzić jakiego typu jest zmienna title przy pomocy wbudowanej metody type() [1].
type(driver.title)
Cały kod programu prezentuje się następująco
#!/usr/bin/env python3 # -*- coding: utf-8 -*- from selenium import webdriver def main(): driver = webdriver.Firefox() driver.get("https://www.google.pl") page_title = driver.title print(f'Typ page_title: {type(page_title)}') print(f'Tytuł strony: {page_title}') driver.quit() if __name__ == '__main__': main()
Test
W celu przetestowania, wyników skryptu należy otworzyć terminal. W terminalu przechodzimy do folderu, w którym znajduje się środowisko wirtualne naszego projektu.
Aktywujemy nasze środowisko wirtualne poleceniem
source venv/bin/activate
Następnie w terminalu przechodzimy do miejsca, gdzie znajduje się nasz skrypt, a następnie wpisujemy komendę do uruchomienia skryptu.
./main.py
Po wykonaniu skryptu powinniśmy zobaczyć w terminalu typ zmiennej title oraz tytuł strony.
Zasoby
Źródła
[1] Oficjalna strona Selenium – Browser interactions, Dostęp z dnia 11 Sierpnia 2023 z https://www.selenium.dev/documentation/webdriver/interactions/