Hola.
import requests
import re
from bs4 import BeautifulSoup
url = "https://detail.1688.com/offer/597824178682.html?spm=a26352.b28411319.offerlist.1.93fd1e62xnfG3F"
headers = {"User Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"}
res = requests.get(url,headers=headers)
res.raise_for_status()
soup = BeautifulSoup(res.text, "lxml")
print(soup)
Como resultado de eso, especialmente la línea “print(soup)”, esperaba ver el código html de la página del producto. Bueno, no esta vez. Me devuelve lo siguiente, que imagino es la versión html de esta imagen en este sitio web. Por cierto, no estoy usando VPN.
¿Entonces, hay alguna forma de sortear esto? ¿Necesito usar Selenium para tener en cuenta cuándo esto sucede?
Solo quiero llegar a la página del producto y extraer algunas informaciones que quiero.