Web Scraping

Módulo Webbrowser

El módulo webbrowser sólo abre la dirección de internet que se especifique en una nueva pestaña del navegador configurado por defecto.

# Abrir dirección en google maps
import webbrowser, sys, pyperclip
 
if len(sys.argv)>1:     # Comprobamos si hay parámetros de entrada
    direccion = '+'.join(sys.argv[1:])
 
else:                   # Si no hay parámetros de entrada toma los datos del portapapeles
    direccion = pyperclip.paste()
    # calle salsipuedes, 2, Madrid
 
webbrowser.open("https://www.google.es/maps/place/" + direccion)

Módulo requests

Con este módulo es posible descargar archivos de la web de forma sencilla.
No viene por defecto instalado con python, por lo que habría que ejecutar:

pip install --user requests

Python dispone de la librería ulllib2 para este cometido, pero e complicada de manejar.

Para descargar una págoina web, o un archivo, basta con especificar la URL en la fución .get()

import requests
res = requests.get('https://automatetheboringstuff.com/files/rj.txt')  # Descargamos Romeo y Julieta en txt
type(res)  # Tipo request.models.Response
res.status_code == requests.codes.ok  # 200
len(res.txt)  # Nº de caracteres del txt
print(rest.text[:250])  # Se muestran los primeros 250 carateres

Enciclopedia Galáctica

Tabla de Contenidos

Web Scraping

Módulo Webbrowser

Módulo requests

Módulo bs4

Módulo selenium