Konvertierung / Filterung einer grösseren datenmenge als pdf

19 Sep 2003

      -----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Hallo !

Folgendes Problem "beschäftigt" mich beruflich bedingt :

In meiner firma wird in regelmässigen Abständen ( 1x Woche ) eine Lagerliste
durch unser System generiert - als PDF - File ...

Meine Arbeit würde sich erheblich erleichtern , wenn ich diese Daten filtern
könnte und zwar wie folgt :

in dieser Liste befinden sich öfters doppelt belegte lagerplätze ( 1 artikel >
2 - x plätze )

das ist jedoch nur anhand der artikelnummer herauszufinden.

da die liste ( ca 4000 artikel , 200 A4 seiten ) nicht gerade klein ist, fällt
ein manuelles löschen der unwichtigen zeilen flach.

ideal wäre zb folgendes :
pdf > konvertieren, zb html oder besser ascii pur
dann zb via grep ( falls es da ne möglichkeit gibt )
alle zeilen löschen lassen, die in der 2. spalte  nur 1x genannt werden , so
das nur noch die zeilen übrig bleiben , die ein x-faches ( meist 2x , aber
auch 3-4 mal kann vorkommen ) vorkommen haben, übrig bleiben.

nur : meines wissens ist grep dazu nicht in der lage ( also das die häufigkeit
einer ziffer in einer bestimmten "spalte" zu prüfen und wenn dieser wert =1
ist, die betreffende zeile zu löschen )

und eine andere filtermethode , die man ev als script verwenden könnte, kenne
ich nicht.
und auch mit der konvertierung habe ich zweifel - pdf2html ist das einzige so
auf anhieb, das mir da einfallen würde ( nur müsste ich dann vermutlich die
htmlbefehle auch rausfiltern, dürfte aber grep-tauglich sein )

das schwierigere problem stellt sich für mich die möglichst einfache filterung
dar, da ich das zb über nacht machen möchte - um dann bei arbeitsbeginn eine
"fertige" miniliste habe ( ev. 1-2 A4 seiten ) die dann zum drucker kann.

und falls jemand nicht weiß was ich will  *G* >>>

- --------Lagerliste original -----
010101	10010010001	Beschreibung Artikel
020102	10010010002	Beschreibung Artikel
010403	10010010003	Beschreibung Artikel
071101	10010010004	Beschreibung Artikel
193308	10010010004	Beschreibung Artikel
163203	10010010005	Beschreibung Artikel
147705	10010010006	Beschreibung Artikel
- --------------
nach "filterung" :
- --------
071101	10010010004	Beschreibung Artikel
193308	10010010004	Beschreibung Artikel
- -------

nun meine frage : da die konvertierung ja das vermutlich kleinere problem ist
...
ist eine solche "filterung" machbar ???

- --
Shaw's Principle:
	Build a system that even a fool can use, and only a fool will
want to use it.

- --------------------------------------------------------
Registierter Linux - User #177159
ICQ - UIN : 51735624

HP : http://www.LinuxCobra.de
eBay : http://members.ebay.de/aboutme/linuxcobra

PGP-Key Server : http://blackhole.pca.dfn.de
- --------------------------------------------------------
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.2-rc1-SuSE (GNU/Linux)

iD8DBQE/a34lkAiRDZSEUCwRAtPqAJsGuVeMIcwmAzG40XIRKG6buUkryQCfV5FG
tBzv/rBMse39G3zWhrjqiHs=
=VC2t
-----END PGP SIGNATURE-----

Marco Jäger

Dr. Jürgen Vollmer

Michael Siefritz

Marco Jäger

Andreas Winkelmann

Andreas Winkelmann

tags

participants (4)