Webscraping a product page of Alibaba (1688.com) and the website not behaving it the way I anticipated it to be

Hola.

import requests
import re
from bs4 import BeautifulSoup

url = "https://detail.1688.com/offer/597824178682.html?spm=a26352.b28411319.offerlist.1.93fd1e62xnfG3F"
headers = {"User Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36"}
res = requests.get(url,headers=headers)
res.raise_for_status()
soup = BeautifulSoup(res.text, "lxml")
print(soup)

Como resultado de eso, especialmente la línea “print(soup)”, esperaba ver el código html de la página del producto. Bueno, no esta vez. Me devuelve lo siguiente, que imagino es la versión html de esta imagen en este sitio web. Por cierto, no estoy usando VPN.

¿Entonces, hay alguna forma de sortear esto? ¿Necesito usar Selenium para tener en cuenta cuándo esto sucede?

Solo quiero llegar a la página del producto y extraer algunas informaciones que quiero.

Este es un mecanismo anti-spider. Se supone que debes resolver un captcha o algo así. No es exactamente trivial programáticamente.