Last active
September 23, 2015 01:49
-
-
Save allieus/4f22b4f6555d895604e9 to your computer and use it in GitHub Desktop.
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
# -*- coding: utf8 -*- | |
from __future__ import unicode_literals | |
try: | |
from urllib.request import urlopen | |
except ImportError: | |
from urllib import urlopen | |
import re | |
from bs4 import BeautifulSoup | |
html = urlopen('http://www.booksaetong.co.kr/shop/list.php?ca_id=60&gdate=2015-04-10').read() | |
soup = BeautifulSoup(html, 'html.parser') | |
for table_tag in soup.select('td[width=25%] table'): | |
try: | |
orig_amount = table_tag.find('strike').text or None | |
except AttributeError: | |
# strike 태그가 없을 때 | |
orig_amount = None | |
else: | |
orig_amount = ''.join(re.findall(r'\d+', orig_amount)) | |
is_pumjul = bool(table_tag.select('img[src*=pumjul]')) | |
properties = {'orig_amount': orig_amount, 'is_pumjul': is_pumjul} | |
for tag in table_tag.select('input'): | |
if tag.has_attr('value'): | |
name = re.sub(r'(^it_|\[\d+\]$)', '', tag['name']) | |
value = tag['value'] | |
properties[name] = value | |
print('[{id}] {name} {orig_amount} {amount} {point}, {is_pumjul}'.format(**properties)) |
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
[1430893869] 아이들 (이자혜 단편만화) 8800 7920 440, True | |
[1430270134] 미지의 세계 01 20000 18000 1000, False | |
[1428640259] 니세코이 비하인드 스토리 01 6800 6120 340, False | |
[1428562083] 바라카몬 10 4500 4050 220, False | |
[1428562041] 쿠로코의 농구 29 4500 4050 220, False | |
[1428562003] 청의 엑소시스트 14 4500 4050 220, False | |
[1428561974] 금빛 모자이크 03 5000 4500 250, False | |
[1428561946] 흐린 하늘에 웃다 06 (완) 4500 4050 220, False | |
[1428561919] 나가토 유키 짱의 소실 07 4500 4050 220, False | |
[1428561893] 전자상가의 서점 아가씨 08 4800 4320 240, False | |
[1428561850] 스즈미야 하루히의 경연 (스즈미야 하루히 앤솔로지) 4500 4050 220, False | |
[1428561816] 사랑한다고 말해 13 4200 3780 210, False | |
[1428561781] 그녀의 플래그가 꺾이면(코믹) 02 4800 4320 240, False | |
[1428561756] 노보 씨와 그녀? 03 7000 6300 350, False | |
[1428561731] 하늘에서! MY NANNY 04 4500 4050 220, False | |
[1428561680] J노벨- 소드 아트 온라인 15 7000 6300 350, False | |
[1428561636] J노벨- 리어왕! 01 6800 6120 340, False | |
[1428561604] 인류는 쇠퇴했습니다 07 6800 6120 340, False | |
[1428561576] J노벨- 성각의 용기사 16 6800 6120 340, False | |
[1428561540] 공허의 상자와 제로의 마리아 05 6800 6120 340, False | |
[1428561497] J노벨- 마법전쟁 07 6800 6120 340, False | |
[1428561454] J노벨- 특이영역의 특이점 02 8000 7200 400, False | |
[1428561350] GALGOD!!!!! 04 (갸르고!!!!! - 지옥천국직통대전) 6800 6120 340, False | |
[1428561289] J노벨- RIGHT X LIGHT 08 6800 6120 340, False | |
[1428561278] 어떤 마술의 금서목록 SP 7000 6300 350, False | |
[1428561277] NT노벨- 널 오타쿠로 만들어줄 테니까, 날 리얼충으로 만들어줘! 10 7000 6300 350, False | |
[1428561276] NT노벨- 도쿄 레이븐스 11 7000 6300 350, False | |
[1428561275] NT노벨- 풀 메탈 패닉! 어나더 08 7000 6300 350, False | |
[1428561274] NT노벨- RAIL WARS! -일본국유철도 공안대- 05 7000 6300 350, False | |
[1428561273] NT노벨- 스즈밍은 육식계 화룡 02 7000 6300 350, False | |
[1428561272] NT노벨- 관희 챠이카 10 7000 6300 350, False | |
[1428561271] NT노벨- 라이벌 온리원 03 7000 6300 350, False | |
[1428561270] 광란 가족 일기 15 (완) 7000 6300 350, False | |
[1428557708] 할리퀸 080 - 기적을 배달해 드립니다 (단) 4500 4050 220, True | |
[1428557608] 할리퀸 079 - 숙녀로 가는 계단〈결혼을 싫어하는 삼형제Ⅲ〉 4500 4050 220, True |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment