вторник, 3 ноября 2009 г.

Фильтры для преобразования ms excel и ms powerpoint в html и текст

Вот и еще пара нужных фильтров, притом шустрых и без ветвистых зависимостей.

application/vnd.ms-excel

#!/bin/sh

nice -n19 xlhtml "$1" | \
grep -v 'Created with <a href="http://chicago.sf.net/xlhtml">xlhtml 0.5.1' \
|w3m \
-o indent_incr=0 \
-o multicol=false \
-o no_cache=true \
-o use_cookie=false \
-o display_charset=utf8 \
-o system_charset=utf8 \
-o follow_locale=false \
-o use_language_tag=true \
-o ucs_conv=true \
-T text/html \
-dump



application/vnd.ms-office

#!/bin/sh

nice -n19 ppthtml "$1" \
|grep -v 'Created with <a href="http://chicago.sf.net/xlhtml">pptHtml' \
|w3m \
-o indent_incr=0 \
-o multicol=false \
-o no_cache=true \
-o use_cookie=false \
-o display_charset=utf8 \
-o system_charset=utf8 \
-o follow_locale=false \
-o use_language_tag=true \
-o ucs_conv=true \
-T text/html \
-dump


И все больше не понимаю, чем руководствуются разработчики поисковых систем, использующие, например, gnumeric для преобразования Excel файлов (в частности, tracker делает именно так). Чем-то мне это напоминает песенку "я тебя слепила из того, что было". Что интересно, для консольных почтовых клиентов есть прекрасные фильтры, например, одна из вышеприведенных утилит используется в модуле к emacs, где я ее и нашел. Понятно, там нужно просматривать вложения к сообщениям, а они бывают самые разные. Притом с электронной почтой работали еще тогда, когда программирование было искусством, а не ремеслом.

Комментариев нет:


(C) Alexey Pechnikov aka MBG, mobigroup.ru