Tento skript slúži na spracovanie vydaných faktúr, ktoré máš:
- exportované v jednom PDF súbore (napr. z e-shopu, Shoptetu, účtovného systému),
- pričom jedna faktúra môže mať 1 alebo viac strán,
- a pre účtovníctvo / import do Doklado ich potrebuješ rozdeliť na samostatné PDF súbory
→ 1 faktúra = 1 PDF súbor.
❓ Problém, ktorý to rieši
Veľmi častý scenár:
- systém vyexportuje všetky vydané faktúry naraz (napr. za mesiac),
- výsledok je jeden veľký PDF súbor (desiatky strán),
- manuálne delenie je:
- zdĺhavé,
- náchylné na chyby,
- nepraktické pri väčšom objeme.
👉 Tento skript to vyrieši automaticky.
🧠 Ako skript funguje (jednoducho vysvetlené)
- Prejde každú stranu PDF
- načíta text z každej strany (nie OCR, ale skutočný text v PDF).
- Na každej strane hľadá číslo faktúry
- napr.
202500243, - používa sa regulárny výraz (vzor), ktorý zodpovedá číslovaniu faktúr.
- napr.
- Rozpozná, kde začína nová faktúra
- ak sa číslo faktúry zmení → začína nová faktúra,
- ak je číslo rovnaké → strany patria k sebe.
- Zoskupí strany podľa čísla faktúry
- funguje aj pri:
- 1-stranových faktúrach,
- 2-stranových (alebo viacstranových) faktúrach.
- funguje aj pri:
- Vytvorí samostatné PDF súbory
- každý súbor má názov podľa čísla faktúry, napr.:
Faktura_202500243.pdf Faktura_202500244.pdf - výsledok je pripravený na nahratie do Doklado alebo účtovníctva.
- každý súbor má názov podľa čísla faktúry, napr.:
✅ Výhody tohto riešenia
- ✔️ nevyžaduje manuálne delenie
- ✔️ funguje aj pri viacstranových faktúrach
- ✔️ názvy súborov sú automaticky správne
- ✔️ vhodné pre e-shopy, firmy, účtovníkov
- ✔️ použiteľné ako:
- Python skript,
- alebo portable EXE bez inštalácie Pythonu
⚠️ Dôležité upozornenie
- PDF musí byť textové (nie iba naskenovaný obrázok).
- Ak máš skeny → najprv treba urobiť OCR (napr. Acrobat, PDF-XChange, ocrmypdf).
📦 Použitie v praxi (Doklado)
Typický workflow:
- export vydaných faktúr za obdobie do jedného PDF,
- spustenie skriptu / EXE,
- vzniknú samostatné PDF faktúry,
- hromadný import do Doklado.