Список для сбоев веб-приложений на Python

голоса
0

Я новичок на сайте, я не уверен , что это правильное место , чтобы задать вопросы питона, если не пожалуйста , сообщите мне , и я вновь после этого в нужном месте. Мне нужна помощь с кодом , который я работаю для моего класса Coursera, цель состоит в следующем: Найти ссылку на позиции 18 (первое название 1). Следуйте по этой ссылке. Повторите этот процесс в 7 раз. Ответ последнее имя , которое вы извлекаете. Подсказка: первый символ имени последней страницы , что вы будете загружать это: J от ссылки :( http://py4e-data.dr-chuck.net/known_by_Shannon.html )

Я написал код для выполнения этой задачи, но кажется, что он работал только для первого элемента, и каждый сайт так как это первый, код в списке неисправности. Моя идея заключается в том, чтобы получить код Html и добавьте URL в список, а затем найти 18-й элемент из списка, а затем перенаправить весь цикл с новым URL и удалить старый список. Повторяя процесс 7 раз. Я серьезно спутать с того, где именно код пошло не так. Заранее спасибо.

    import urllib.request, urllib.parse, urllib.error
from bs4 import BeautifulSoup
import ssl
import re
term_counter = (0)
file = list()
regex = list()
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE

url = input('Enter - ')
for I in range(7) :
    html = urllib.request.urlopen(url, context=ctx).read()
    soup = BeautifulSoup(html, 'html.parser')
    tags = soup('a')
    del file[:]
    file = list()
    for tag in tags :
        file.append(tag)
        print(tag.contents[0])
        url = tag.get('href')
        print (url)
    for items in range(17,18) :
        print(file[items])
Задан 02/09/2018 в 05:22
источник пользователем
На других языках...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more