| .gitignore | ||
| azada.py | ||
| deps.sh | ||
| LICENSE | ||
| museiza2.py | ||
| orejas.py | ||
| README.md | ||
| requirements.txt | ||
| siega.png | ||
siega
siega
Definición Del lat. secāre 'cortar'.
f. Acción y efecto de segar.
f. Tiempo en que se siega.
f. Conjunto de mieses segadas.
DRAE
Procesos de Dependencias
( XD )
Para facilitar la instalación de las herramientas de este directorio, se incluye:
- requirements.txt con dependencias de Python
- deps.sh (opcional) para instalar paquetes del sistema (Debian/Ubuntu) y las dependencias de Python
Instalación rápida (Debian/Ubuntu):
Paquetes del sistema (poppler, ffmpeg, mediainfo)
bash siega/deps.sh
Instalación manual:
Python
python3 -m pip install -r siega/requirements.txt
Torch para Whisper: seguir instrucciones oficiales según CPU/GPU
https://pytorch.org/get-started/locally/
Sistema (ejemplo Debian/Ubuntu)
sudo apt-get update
sudo apt-get install -y poppler-utils ffmpeg mediainfo
Resumen de dependencias por herramienta:
-
azada (PDF -> PNG):
- Opción A (recomendada): PyMuPDF (pymupdf)
- Opción B: utilidades Poppler (pdftoppm, pdfinfo) — paquete poppler-utils
-
orjeas (Sincronización y STT):
- typer
- openai-whisper (CLI whisper)
- PyTorch (torch) — instalar según tu entorno
- ffmpeg
- mediainfo
orejas
Copia ficheros de audio y los transcribe a texto.
Uso:
./siega/orejas.py sync: Copia los ficheros../siega/orejas.py stt: Renombra y transcribe los audios../siega/orejas.py all: sync + stt.
digitalizacion de imagenes
azada
de pdf a pngs por página con nombre Obra - N / M con N página actual, M número total de páginas
museiza2
de un directorio, de manera recursiva, crea un fichero index.md en el que están enlazados, al estilo de obsidian y wikimedia, los subdirectirios y las imagenes. Para las imagenes, se extrae la fecha del nombre de fichero.