Herramientas de usuario

Herramientas del sitio


python:webscraping

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
python:webscraping [2024/02/05 18:52] – [Encontrar elementos] albertopython:webscraping [2024/02/05 19:00] (actual) – [Encontrar elementos] alberto
Línea 169: Línea 169:
 >>> pElems[2].getText() >>> pElems[2].getText()
 'By Al Sweigart' 'By Al Sweigart'
 +</code>
 +
 +==== Obtener datos de atributos de elementos ====
 +Para obtener fácilmente los valores de los atributos de un elemento (objeto tipo tag), podemos usar el método **get()**. Se le pasa el string del nombre de un atributo, y devuelve su valor. Vemos un ejemplo en la consola de Python:
 +<code python>
 +>>> import bs4
 +>>> soup = bs4.BeautifulSoup(open('example.html'), 'html.parser')
 +>>> spanElem = soup.select('span')[0]
 +>>> str(spanElem)
 +'<span id="author">Al Sweigart</span>'
 +>>> spanElem.get('id')
 +'author'
 +>>> spanElem.get('some_nonexistent_addr') == None
 +True
 +>>> spanElem.attrs
 +{'id': 'author'}
 </code> </code>
 ===== Módulo selenium ===== ===== Módulo selenium =====
python/webscraping.1707155537.txt.gz · Última modificación: por alberto

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki