Я пытаюсь написать код Python, который посещал бы страницу Реал Мадрида в Википедии и печатал бы названия его команды

Мой текущий запрос xpath:

for t in doc.xpath("//table//table/tr[position() > 1]/td[4]/span//text()"):
   #print the player's name here

Но при этом также печатаются игроки, которые находятся в таблице «Взято в аренду».

Итак, мой вопрос: как мне выбрать только первую таблицу, которая содержит таблицу в запросе xpath? или, может быть, есть другой способ добиться того, чего я хочу?

Большое спасибо.

P.S: Таблица начинается со строки 775 в исходном коде страницы Реал Мадрид в Википедии (https://en.wikipedia.org/wiki/Real_Madrid_C.F.).

Kyle

Ответов: 1

Ответы (1)

Вы можете использовать следующий XPath:

(//span[@id='Current_squad']/following::table)[1]

Будет выбрана только таблица «Current sqaud».

Чтобы получить список игроков, вы можете использовать следующий XPath:

(//span[@id='Current_squad']/following::table)[1]//span[@class='fn']//text()

2022 WebDevInsider