Захотелось мне стать фирлансером. А делать, то по сути, ничего не умею. Начал тусоваться на веблансере. Читаю как то объявление:
Нужно с определенных урлов выдернуть текстовые ссылки вида slovo.html, перемешать их и вставить в текстовой файл. Оплата 40 USD.
Ну, думаю, пришел мой звездный час. Сейчас я заработаю 40 USD. А потом сомнения: "Смогу ли я?". Открыл ранее скачаную книгу Dive into Python и как настоящий ленивый программист, пользуясь наработками других, написал:
#!usr/bin/python
"""
Program parsing urls, searching links, writing shuffled links in file
"""
#preferences
adresses = ['http://mail.ru', 'http://netz.ru']
wesearch = 'netz.ru'
result_file = 'e:\\urls.txt'
#URLLister
from sgmllib import SGMLParser
class URLLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.urls = []
def start_a(self, attrs):
href = [v for k, v in attrs if k=='href']
if href:
self.urls.extend(href)
#result
import urllib, re, random
result = []
log_file = open(result_file, 'a')
for adress in adresses:
usock = urllib.urlopen(adress)
parser = URLLister()
parser.feed(usock.read())
usock.close()
for url in parser.urls:
if (re.search(wesearch, url)):
result.append(url)
#in file shuffled list
random.shuffle(result)
for url in result: log_file.write(url + "\n")
log_file.close()
И все работает, урра!
Но... заказчик выбрал другого исполнителя и отдал ему вожделенные 40 USD.
Комментариев нет:
Отправить комментарий