HTML 소스에 액세스하는 Python Selenium

developer tip

HTML 소스에 액세스하는 Python Selenium

optionbox 2020. 9. 16. 07:37

HTML 소스에 액세스하는 Python Selenium

Python과 함께 Selenium 모듈을 사용하여 변수에서 HTML 소스를 얻으려면 어떻게 해야합니까?

다음과 같이하고 싶었습니다.

from selenium import webdriver
browser = webdriver.Firefox()
browser.get(raw_input("Enter URL: "))
if "whatever" in html_source:
    # Do something
else:
    # Do something else

어떻게 할 수 있습니까? HTML 소스에 액세스하는 방법을 모르겠습니다.

page_source부동산 에 전화해야 합니다. 아래를 참조하십시오.

from selenium import webdriver
browser = webdriver.Firefox()
browser.get(raw_input("Enter URL: "))
html_source = browser.page_source
if "whatever" in html_source:
    # do something
else:
    # do something else

Selenium2Library를 사용하면 다음을 사용할 수 있습니다. get_source()

import Selenium2Library
s = Selenium2Library.Selenium2Library()
s.open_browser("localhost:7080", "firefox")
source = s.get_source()

driver.page_source 는 페이지 소스 코드를 얻는 데 도움이됩니다. 페이지 소스에 텍스트가 있는지 여부를 확인할 수 있습니다.

from selenium import webdriver
driver = webdriver.Firefox()
driver.get("some url")
if "your text here" in driver.page_source:
    print('Found it!')
else:
    print('Did not find it.')

페이지 소스를 변수에 저장하려면 driver.get 뒤에 아래 줄을 추가하십시오 .

var_pgsource=driver.page_source

if 조건을 다음으로 변경하십시오 .

if "your text here" in var_pgsource:

페이지 소스를 사용하면 전체 HTML 코드를 얻을 수 있습니다.
따라서 먼저 데이터를 검색하거나 요소를 클릭하는 데 필요한 코드 또는 태그 블록을 결정합니다.

options = driver.find_elements_by_name_("XXX")
for option in options:
    if option.text == "XXXXXX":
        print(option.text)
        option.click()

이름, XPath, ID, 링크 및 CSS 경로로 요소를 찾을 수 있습니다.

urllib에 사용할 URL 가져 오기에 대한 질문에 답하려면 다음 JavaScript 코드를 실행하십시오.

url = browser.execute_script("return window.location;")

urllib로 소스를 얻는 것이 좋으며 , 파싱 할 경우 Beautiful Soup 과 같은 것을 사용하십시오 .

import urllib

url = urllib.urlopen("http://example.com") # Open the URL.
content = url.readlines() # Read the source and save it to a variable.

참고 URL : https://stackoverflow.com/questions/7861775/python-selenium-accessing-html-source

'developer tip' 카테고리의 다른 글

Visual Studio 2015에서 누락 된 리팩터링 메뉴 (0)	2020.09.17
numpy의 배열에 단일 요소 추가 (0)	2020.09.16
.NET Core에서 연결 문자열을 읽는 방법? (0)	2020.09.16
인증 : JWT 사용 vs 세션 (0)	2020.09.16
Kotlin 배열을 Java varargs로 변환 (0)	2020.09.16

현재글HTML 소스에 액세스하는 Python Selenium

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

optionbox

HTML 소스에 액세스하는 Python Selenium

HTML 소스에 액세스하는 Python Selenium

'developer tip' 카테고리의 다른 글

'developer tip'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

HTML 소스에 액세스하는 Python Selenium

HTML 소스에 액세스하는 Python Selenium

'developer tip' 카테고리의 다른 글

'developer tip'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역