Tento skript slúži na spracovanie vydaných faktúr, ktoré máš:

  • exportované v jednom PDF súbore (napr. z e-shopu, Shoptetu, účtovného systému),
  • pričom jedna faktúra môže mať 1 alebo viac strán,
  • a pre účtovníctvo / import do Doklado ich potrebuješ rozdeliť na samostatné PDF súbory
    1 faktúra = 1 PDF súbor.

❓ Problém, ktorý to rieši

Veľmi častý scenár:

  • systém vyexportuje všetky vydané faktúry naraz (napr. za mesiac),
  • výsledok je jeden veľký PDF súbor (desiatky strán),
  • manuálne delenie je:
    • zdĺhavé,
    • náchylné na chyby,
    • nepraktické pri väčšom objeme.

👉 Tento skript to vyrieši automaticky.


🧠 Ako skript funguje (jednoducho vysvetlené)

  1. Prejde každú stranu PDF
    • načíta text z každej strany (nie OCR, ale skutočný text v PDF).
  2. Na každej strane hľadá číslo faktúry
    • napr. 202500243,
    • používa sa regulárny výraz (vzor), ktorý zodpovedá číslovaniu faktúr.
  3. Rozpozná, kde začína nová faktúra
    • ak sa číslo faktúry zmení → začína nová faktúra,
    • ak je číslo rovnaké → strany patria k sebe.
  4. Zoskupí strany podľa čísla faktúry
    • funguje aj pri:
      • 1-stranových faktúrach,
      • 2-stranových (alebo viacstranových) faktúrach.
  5. Vytvorí samostatné PDF súbory
    • každý súbor má názov podľa čísla faktúry, napr.: Faktura_202500243.pdf Faktura_202500244.pdf
    • výsledok je pripravený na nahratie do Doklado alebo účtovníctva.

✅ Výhody tohto riešenia

  • ✔️ nevyžaduje manuálne delenie
  • ✔️ funguje aj pri viacstranových faktúrach
  • ✔️ názvy súborov sú automaticky správne
  • ✔️ vhodné pre e-shopy, firmy, účtovníkov
  • ✔️ použiteľné ako:
    • Python skript,
    • alebo portable EXE bez inštalácie Pythonu

⚠️ Dôležité upozornenie

  • PDF musí byť textové (nie iba naskenovaný obrázok).
  • Ak máš skeny → najprv treba urobiť OCR (napr. Acrobat, PDF-XChange, ocrmypdf).

📦 Použitie v praxi (Doklado)

Typický workflow:

  1. export vydaných faktúr za obdobie do jedného PDF,
  2. spustenie skriptu / EXE,
  3. vzniknú samostatné PDF faktúry,
  4. hromadný import do Doklado.