No description
Find a file
2026-01-27 12:06:28 +00:00
.gitignore Up up up 2026-01-27 12:06:28 +00:00
azada.py Up up up 2026-01-27 12:06:28 +00:00
deps.sh Up up up 2026-01-27 12:06:28 +00:00
LICENSE Initial commit 2025-12-20 22:31:09 +00:00
museiza2.py Up up up 2026-01-27 12:06:28 +00:00
orejas.py Up up up 2026-01-27 12:06:28 +00:00
README.md Up up up 2026-01-27 12:06:28 +00:00
requirements.txt Up up up 2026-01-27 12:06:28 +00:00
siega.png Up up up 2026-01-27 12:06:28 +00:00

siega

siega

Definición Del lat. secāre 'cortar'.

f. Acción y efecto de segar.

f. Tiempo en que se siega.

f. Conjunto de mieses segadas.

DRAE

Procesos de Dependencias

( XD )

Para facilitar la instalación de las herramientas de este directorio, se incluye:

  • requirements.txt con dependencias de Python
  • deps.sh (opcional) para instalar paquetes del sistema (Debian/Ubuntu) y las dependencias de Python

Instalación rápida (Debian/Ubuntu):

Paquetes del sistema (poppler, ffmpeg, mediainfo)
bash siega/deps.sh

Instalación manual:

Python
python3 -m pip install -r siega/requirements.txt
Torch para Whisper: seguir instrucciones oficiales según CPU/GPU
https://pytorch.org/get-started/locally/

Sistema (ejemplo Debian/Ubuntu)
sudo apt-get update
sudo apt-get install -y poppler-utils ffmpeg mediainfo

Resumen de dependencias por herramienta:

  • azada (PDF -> PNG):

    • Opción A (recomendada): PyMuPDF (pymupdf)
    • Opción B: utilidades Poppler (pdftoppm, pdfinfo) — paquete poppler-utils
  • orjeas (Sincronización y STT):

    • typer
    • openai-whisper (CLI whisper)
    • PyTorch (torch) — instalar según tu entorno
    • ffmpeg
    • mediainfo

orejas

Copia ficheros de audio y los transcribe a texto.

Uso:

  • ./siega/orejas.py sync: Copia los ficheros.
  • ./siega/orejas.py stt: Renombra y transcribe los audios.
  • ./siega/orejas.py all: sync + stt.

digitalizacion de imagenes

azada

de pdf a pngs por página con nombre Obra - N / M con N página actual, M número total de páginas

museiza2

de un directorio, de manera recursiva, crea un fichero index.md en el que están enlazados, al estilo de obsidian y wikimedia, los subdirectirios y las imagenes. Para las imagenes, se extrae la fecha del nombre de fichero.