From a90a75a9a59ce62a7dc5549ae704336768a322fb Mon Sep 17 00:00:00 2001 From: Thomas Date: Sat, 12 Sep 2020 09:31:47 +0200 Subject: [PATCH] Version 2.1 --- Dockerfile | 12 ++++++++++++ README.md | 4 ++++ newspaper.py | 6 +++--- 3 files changed, 19 insertions(+), 3 deletions(-) create mode 100644 Dockerfile diff --git a/Dockerfile b/Dockerfile new file mode 100644 index 0000000..d4a5972 --- /dev/null +++ b/Dockerfile @@ -0,0 +1,12 @@ +FROM python:3.8-slim AS onetz + +LABEL maintainer="reiser.thomas@gmail.com" + +VOLUME /config +VOLUME /newspaper + +RUN pip install --no-cache-dir requests beautifulsoup4 fake-useragent workalendar + +ADD newspaper.py / + +CMD [ "python", "./newspaper.py", "-c", "/config/newspaper.json" ] diff --git a/README.md b/README.md index 411f868..da6469b 100644 --- a/README.md +++ b/README.md @@ -91,6 +91,10 @@ Ist ein Wert bei *current_epaper_filename* hinterlegt und *current_epaper_symlin ## Changelog +#### 12.09.2020 +- Dockerfile zum Ausführen des Scripts in einem Container +- Kleine Codeoptimierungen + #### 01.02.2020 - Kompatibilität zu Redesign des Onetz E-Paper-Bereichs diff --git a/newspaper.py b/newspaper.py index 0d7972c..fe11d38 100755 --- a/newspaper.py +++ b/newspaper.py @@ -46,7 +46,7 @@ # Interne Konstanten -VERSION = '2.0' +VERSION = '2.1' LOGIN_URL_PREFIX = 'https://epapersso.onetz.de/auth/authorize' LOGIN_URL = LOGIN_URL_PREFIX + '?client_id=epaper' # Onetz Login-URL EPAPER_ARCHIVE_URL = 'https://zeitung.onetz.de/shelfDisplay.act?dateTo=%s&widgetIdStr=1040®ion=%s' # Pfad zum Abholen der verfügbaren E-Paper @@ -139,7 +139,7 @@ def download(configFile, timestamp, overwrite): return # Prüfen, ob PDF schon vorhanden ist - pdfFile = config['pdf_base'] + timestamp + '.pdf' + pdfFile = os.path.join(config['pdf_base'], timestamp + '.pdf') if not overwrite and os.path.isfile(pdfFile): print('E-Paper für ' + timestamp + ' wurde bereits heruntergeladen -> Abbruch') return @@ -232,7 +232,7 @@ def tryGetEPaper(href, title, timestamp, edition): m = A_HREF_PATTERN.match(href) if m is None: return None - + # Auslesen der JS-Paramter issueId = m.group(1) mutation = m.group(2)