Extraer contenido con File Juicer
File Juicer es una aplicación (Mac, shareware 12 euros) con la que puedes extraer los contenidos de varios tipos de archivos File Juicer es uno de esos programa que te puede salvar el día o, como poco, ahorrarte un montón de tiempo. Básicamente lo que hace es extraer contenidos de diversos tipos de documentos contenedores: textos, imágenes, sonidos…, guardándolos bien organizados en carpetas.
Cómo funciona
Puedes utilizarlo con muchos tipos de archivos porque File Juicer busca formatos específicos de información incorporados en los documentos. De este modo puedes hacer cosas como extraer el texto (con y sin formato) e imágenes de documentos Word o PDF, por poner un ejemplo muy habitual. Aparte de eso, el desarrollador dice que el programa puede recuperar información de archivos dañados, de la caché del navegador, de tarjetas Flash borradas, animaciones Flash de ejecutables para Windows y otras utilidades.

El funcionamiento es muy sencillo: abres el programa y arrastras sobre su ventana los documentos que quieres examinar. El resultado aparecerá en unos segundos. En la configuración estándar se generará una carpeta con el material que haya sido posible extraer de cada archivo, organizado en carpetas por formatos.
Algunas limitaciones
Ojo. Ten en cuanta que File Juicer no hace milagros. Por ejemplo, no puede extraer el texto de una imagen, o recortar parte de ella. Los resultados que obtengas dependen en buena medida de las condiciones del documento original.
Es posible que tengas que hacer algunos retoques a los resultados, especialmente los textos, aunque el trabajo es muchísimo menor que si te ves en la obligación de cortar y pegar.

En las preferencias puedes escoger qué tipos de archivos buscar (por ejemplo, sólo las imágenes) y de qué forma organizar los resultados obtenidos. Además se incorpora una acción de Automator con lo que sería posible, por ejemplo, crear flujos automatizados de trabajo.
Casos
Nosotros lo hemos usado con éxito en varias situaciones.
Extraer texto de varios documentos de Word para maquetar en Pages. Simplemente arrastramos los documentos al programa, después de especificar en las preferencias que sólo queríamos extraer el texto sin formato.
Extraer imágenes de varios PDF en escala de gris para colorearlas y utilizarlas en otros trabajos. Básicamente lo mismo: arrastramos los documentos y obtuvimos las imágenes deseadas. Las pasamos luego por Graphic Converter para eliminar los grises y unificar el formato y luego en Painter Essentials para darles color.
Extraer texto de varios documentos PDF para reescribirlos. Necesitábamos reescribir unos documentos que sólo estaban disponibles en PDF. De nuevo los arrastramos sobre FileJuicer y obtuvimos el texto en RTF listo para abrir en nuestro procesador de textos habitual.