From h.pahlke@nexgo.de Thu Nov 1 17:04:56 2001 From: "Heinz W. Pahlke" To: users-de@lists.opensuse.org Subject: Verzeichnis greppen Date: Thu, 01 Nov 2001 18:06:01 +0100 Message-ID: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2782662554065863888==" --===============2782662554065863888== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit Hallo, ich sitze immer noch an dem Problem, Verzeichnisse mit txt-, html- und aw-Dateien sinnvoll greppen zu wollen. Nach dem Studium diverser manpages bin ich zwar ein gutes Stueck weiter gekommen, aber nutzbare Ergebnisse habe ich noch nicht. find . -type f -name '*.html' -exec lynx -dump {} \; | grep -H Suchwort wirft zwar alle Zeilen mit dem Suchwort aus, nennt aber (zugegebenermassen nicht ganz ueberraschend) als Quelle stdio :-( Beim folgenden Ansatz grep -ilH "" * | xargs lynx -dump {} | grep -iH Suchwort bleibt gleich ein doppeltes Problem. Auch hier wird als Quelle stdio genannt, und zudem wird nur die erste (?) html-Datei aus dem Verzeichnis gegreppt, alle weiteren werden ignoriert :-(( Und als dritter Versuch: fmt -w 60 *.html | grep -iH Suchwort Aber auch hier als Quelle (natuerlich) stdio :-((( Irgendwie muss es doch aber einen Weg geben, am Schluss der Kette auch die Namen der Dateien zu erhalten, in denen das Suchwort vorkommt. Einen schoenen Abend, Heinz. -- E-Mail: Heinz W. Pahlke This message was sent by means of XFMail via SuSE Linux --===============2782662554065863888==-- From Matthias.Kleine@prs.de Thu Nov 1 18:19:33 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 19:19:26 +0100 Message-ID: <3BE1922E.E91D1839@prs.de> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8262470698571577343==" --===============8262470698571577343== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit "Heinz W. Pahlke" wrote: > ich sitze immer noch an dem Problem, Verzeichnisse mit txt-, html- und > aw-Dateien sinnvoll greppen zu wollen. > > Nach dem Studium diverser manpages bin ich zwar ein gutes Stueck weiter > gekommen, aber nutzbare Ergebnisse habe ich noch nicht. > > find . -type f -name '*.html' -exec lynx -dump {} \; | grep -H Suchwort Uff! Entweder ich verstehe das Problem nicht, oder die Lösung lautet grep -Hr Suchwort * (minimal) grep -Hirn Suchwort * (erweitert) Letzteren auch greppen mit Hirn genannt ;-). - Matthias --===============8262470698571577343==-- From th@monochrom.at Thu Nov 1 19:25:03 2001 From: Thomas Hofer To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 20:23:49 +0100 Message-ID: <200111011926.fA1JQH250244@mailbox.univie.ac.at> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============4670423685386089935==" --===============4670423685386089935== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Heinz W. Pahlke wrote (Donnerstag, 1. November 2001 18:06): > find . -type f -name '*.html' -exec lynx -dump {} \; | grep -H > Suchwort > > wirft zwar alle Zeilen mit dem Suchwort aus, nennt aber > (zugegebenermassen nicht ganz ueberraschend) als Quelle stdio :-( Dieses Problem kann man so lösen, daß man den Filename nicht gleich von grep ausgeben läßt, sondern per seaparatem echo, wenn der exit-code von grep "true" ist (und das ist er, wenn es etwas gefunden hat). Wenn man mit der exec-Option etwas komplizierteres als einen simplen Befehl aufrufen will, gibt's massig Ärger - also lieber eine sub-bash aufrufen und das {} per Parameter übergeben (innerhalb der Subshell kann man dann per $0 drauf zugreifen): find . -type f -name "*.html" -exec bash -c 'lynx -dump $0 \ | grep -i openbsd >/dev/null && echo $0' {} \; > Beim folgenden Ansatz > > grep -ilH "" * | xargs lynx -dump {} | grep -iH Suchwort > > bleibt gleich ein doppeltes Problem. Auch hier wird als Quelle stdio > genannt, und zudem wird nur die erste (?) html-Datei aus dem > Verzeichnis gegreppt, alle weiteren werden ignoriert :-(( Du mußt ja nicht alles durch's selbe Rohr schicken. for x in `grep -rilH "" *`; do lynx -dump $x \ | grep -i Suchwort >/dev/null && echo $x ; done ...oder wenn man auch die gefundenen Zeilen ausgeben will (und zwar *nach* dem Filenamen): for x in `grep -rilH "" *`; do z=`lynx -dump $x \ | grep -i Suchwort` && echo -e "Filename: $x\n$z\n" ; done Alle Angaben ohne Gewehr. Thomas. --===============4670423685386089935==-- From th@monochrom.at Thu Nov 1 19:25:05 2001 From: Thomas Hofer To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 20:22:53 +0100 Message-ID: <200111011926.fA1JQD250242@mailbox.univie.ac.at> In-Reply-To: <3BE1922E.E91D1839@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============5355112719683268022==" --===============5355112719683268022== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Matthias Kleine wrote (Donnerstag, 1. November 2001 19:19): > "Heinz W. Pahlke" wrote: > > ich sitze immer noch an dem Problem, Verzeichnisse mit txt-, html- > > und aw-Dateien sinnvoll greppen zu wollen. > > > > Nach dem Studium diverser manpages bin ich zwar ein gutes Stueck > > weiter gekommen, aber nutzbare Ergebnisse habe ich noch nicht. > > > > find . -type f -name '*.html' -exec lynx -dump {} \; | grep -H > > Suchwort > > Uff! Entweder ich verstehe das Problem nicht, oder die Lösung lautet > > grep -Hr Suchwort * (minimal) > grep -Hirn Suchwort * (erweitert) tee mist.html >/dev/null <

Blöd gelaufen

EOF grep -Hirn "Blöd" mist.html || echo davon hab ich noch nie was gehört... lynx -dump mist.html | grep -n "Blöd" && echo da ist ja doch was! Thomas. --===============5355112719683268022==-- From yoo@vranx.de Thu Nov 1 19:31:06 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 20:14:37 +0100 Message-ID: <20011101201437.N5703@eumel.yoo.net> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1145827818721046399==" --===============1145827818721046399== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit Moin, * Heinz W. Pahlke [01-11-01 18:06]: >Irgendwie muss es doch aber einen Weg geben, am Schluss der Kette auch >die Namen der Dateien zu erhalten, in denen das Suchwort vorkommt. Benutze 'grep -q' und 'find -print'. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============1145827818721046399==-- From kleine_matthias@gmx.de Thu Nov 1 20:04:58 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 21:05:31 +0100 Message-ID: <20011101200224.BA7F8E6426@ns1.suse.com> In-Reply-To: <200111011926.fA1JQD250242@mailbox.univie.ac.at> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3184575598243543804==" --===============3184575598243543804== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Am Donnerstag, 1. November 2001 20:22 schrieb Thomas Hofer: > Matthias Kleine wrote (Donnerstag, 1. November 2001 19:19): > > "Heinz W. Pahlke" wrote: > > > ich sitze immer noch an dem Problem, Verzeichnisse mit txt-, html- > > > und aw-Dateien sinnvoll greppen zu wollen. > > > > > > Nach dem Studium diverser manpages bin ich zwar ein gutes Stueck > > > weiter gekommen, aber nutzbare Ergebnisse habe ich noch nicht. > > > > > > find . -type f -name '*.html' -exec lynx -dump {} \; | grep -H > > > Suchwort > > > > Uff! Entweder ich verstehe das Problem nicht, oder die Lösung lautet > > > > grep -Hr Suchwort * (minimal) > > grep -Hirn Suchwort * (erweitert) > > tee mist.html >/dev/null < > >

Blöd gelaufen

> > > EOF > grep -Hirn "Blöd" mist.html || echo davon hab ich noch nie was gehört... > lynx -dump mist.html | grep -n "Blöd" && echo da ist ja doch was! Na ich bitte Dich, wir können doch mit Regular Expressions umgehen: $ echo blöd > file1.txt $ echo bl\ö\;d > file2.txt $ egrep -Hrn '(ö)|(ö)' * file1.txt:1:blöd file2.txt:1:blöd - Matthias -- LPI Level 1 Certified http://www.selflinux.de --===============3184575598243543804==-- From yoo@vranx.de Thu Nov 1 20:15:08 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 21:22:10 +0100 Message-ID: <20011101212210.S5703@eumel.yoo.net> In-Reply-To: <20011101200224.BA7F8E6426@ns1.suse.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6915102652261295725==" --===============6915102652261295725== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-01 21:05]: >Na ich bitte Dich, wir können doch mit Regular Expressions umgehen: Was ist denn das für eine Lösung? Wenn Du das weiterverfolgst, wirst Du kaum vermeiden können, 'lynx -dump' nachzuprogrammieren. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============6915102652261295725==-- From h.pahlke@nexgo.de Thu Nov 1 21:18:46 2001 From: "Heinz W. Pahlke" To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 22:19:54 +0100 Message-ID: In-Reply-To: <20011101201437.N5703@eumel.yoo.net> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============5627157646154534575==" --===============5627157646154534575== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit On 01-Nov-2001 Thorsten Haude wrote: > * Heinz W. Pahlke [01-11-01 18:06]: >>Irgendwie muss es doch aber einen Weg geben, am Schluss der Kette >>auch >>die Namen der Dateien zu erhalten, in denen das Suchwort vorkommt. > Benutze 'grep -q' und 'find -print'. Wie ich das nutzen soll, ist mir zwar noch nicht ganz klar, aber vielleicht finde ich ja eine sinnvolle Kombination. Guten Abend, Heinz. -- E-Mail: Heinz W. Pahlke This message was sent by means of XFMail via SuSE Linux --===============5627157646154534575==-- From h.pahlke@nexgo.de Thu Nov 1 21:18:46 2001 From: "Heinz W. Pahlke" To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 22:19:47 +0100 Message-ID: In-Reply-To: <3BE1922E.E91D1839@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3118077487617855666==" --===============3118077487617855666== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit On 01-Nov-2001 Matthias Kleine wrote: > Uff! Entweder ich verstehe das Problem nicht, oder die Lösung lautet > > grep -Hr Suchwort * (minimal) > grep -Hirn Suchwort * (erweitert) Meine heutige Frage schloss an meine Frage von Montag an. In html-Dateien gehen fuer grep "Zeilen" eben ueber mehrere Zeilen, so dass die Ausgabe eben schnell sehr unuebersichtlich wird. Hilfreich waere es deshalb, sie auf tatsaechlich eine Zeilen zu verkuerzen. Guten Abend, Heinz. -- E-Mail: Heinz W. Pahlke This message was sent by means of XFMail via SuSE Linux --===============3118077487617855666==-- From h.pahlke@nexgo.de Thu Nov 1 21:18:46 2001 From: "Heinz W. Pahlke" To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 22:19:53 +0100 Message-ID: In-Reply-To: <200111011926.fA1JQH250244@mailbox.univie.ac.at> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2624922201607459568==" --===============2624922201607459568== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit On 01-Nov-2001 Thomas Hofer wrote: > find . -type f -name "*.html" -exec bash -c 'lynx -dump $0 \ >| grep -i openbsd >/dev/null && echo $0' {} \; Irre :-) Und wenn ich das ">/dev/null" weglasse, entspricht es sogar voll meinen Vorstellungen. Ich hatte es mit "-exec xterm" versucht, aber das war nichts. > for x in `grep -rilH "" *`; do lynx -dump $x \ >| grep -i Suchwort >/dev/null && echo $x ; done > > ...oder wenn man auch die gefundenen Zeilen ausgeben will (und zwar > *nach* dem Filenamen): > > for x in `grep -rilH "" *`; do z=`lynx -dump $x \ >| grep -i Suchwort` && echo -e "Filename: $x\n$z\n" ; done Warum tue ich mich mit "for ... do" nur immer so schwer? Wenn ich es lese, finde ich es voellig logisch, bloss wenn ich selbst darauf kommen soll... Vielen Dank und einen schoenen Abend, Heinz. -- E-Mail: Heinz W. Pahlke This message was sent by means of XFMail via SuSE Linux --===============2624922201607459568==-- From yoo@vranx.de Thu Nov 1 22:20:40 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 22:52:24 +0100 Message-ID: <20011101225224.B8206@eumel.yoo.net> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1383478827628046395==" --===============1383478827628046395== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Heinz W. Pahlke [01-11-01 22:19]: >On 01-Nov-2001 Thorsten Haude wrote: >> * Heinz W. Pahlke [01-11-01 18:06]: >>>Irgendwie muss es doch aber einen Weg geben, am Schluss der Kette >>>auch die Namen der Dateien zu erhalten, in denen das Suchwort >>>vorkommt. >> Benutze 'grep -q' und 'find -print'. >Wie ich das nutzen soll, ist mir zwar noch nicht ganz klar, aber >vielleicht finde ich ja eine sinnvolle Kombination. Überlaß die Ausgabe find, dann kannst Du grep innerhalb von finds -exec betreiben und bekommst keine Probleme mit den Pipes. Ich hab's gerade nochmal versucht, bin aber nicht darauf gekommen. Schreib mal bitte, wie die Lösung aussieht, wenn Du sie hast. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============1383478827628046395==-- From th@monochrom.at Thu Nov 1 22:52:34 2001 From: Thomas Hofer To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Thu, 01 Nov 2001 23:22:18 +0100 Message-ID: <200111012253.fA1Mrm2104418@mailbox.univie.ac.at> In-Reply-To: <20011101212210.S5703@eumel.yoo.net> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3301406841710781669==" --===============3301406841710781669== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit > * Matthias Kleine [01-11-01 21:05]: > >Na ich bitte Dich, wir können doch mit Regular Expressions umgehen: > > $ egrep -Hrn '(ö)|(ö)' * Thorsten Haude wrote (Donnerstag, 1. November 2001 21:22): > Was ist denn das für eine Lösung? Wenn Du das weiterverfolgst, wirst > Du kaum vermeiden können, 'lynx -dump' nachzuprogrammieren. Ja, denn das Problem ist, daß es außer "ö" (in iso-8859-1 codierung, was man auch nicht vergessen sollte) und "ö" auch noch andere Repräsentationen für diesen Buchstaben gibt, beispielsweise "ö". Und wie ist es mit einer Suche nach "heiß und fettig"?

nein!

:-) Thomas. --===============3301406841710781669==-- From th@monochrom.at Thu Nov 1 23:20:00 2001 From: Thomas Hofer To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 00:16:20 +0100 Message-ID: <200111012321.fA1NLI2101486@mailbox.univie.ac.at> In-Reply-To: <20011101225224.B8206@eumel.yoo.net> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1324952789960994847==" --===============1324952789960994847== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote (Donnerstag, 1. November 2001 22:52): >>> Benutze 'grep -q' und 'find -print'. > Überlaß die Ausgabe find, dann kannst Du grep innerhalb von finds > -exec betreiben und bekommst keine Probleme mit den Pipes. Ja, diese Variation sieht vielleicht sogar ein bißchen cleaner aus. find . -type f -name "*.html" -exec bash -c 'lynx -dump $0 \ | grep "suchbegriff"' {} \; -print Um diesen sub-bash Aufruf kommen wir halt nicht herum, weil wir den Text ja erst durch lynx pumpen müssen. Der Returncode von grep wird über die sub-bash an das exec von find zurückgereicht und die aktuelle Iteration von find terminiert vor dem print, wenn dieser false ist (d.h., wenn nichts gefunden wurde). Andernfalls wird über -print der aktuelle Filename ausgegeben. Mit einem -q für grep kann man die Ausgabe der gefundenen Zeilen unterdrücken. Thomas. --===============1324952789960994847==-- From kleine_matthias@gmx.de Thu Nov 1 23:42:44 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 00:44:05 +0100 Message-ID: <20011101234107.4E1BBE6361@ns1.suse.com> In-Reply-To: <20011101212210.S5703@eumel.yoo.net> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1686546261833427884==" --===============1686546261833427884== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: quoted-printable Am Donnerstag, 1. November 2001 21:22 schrieb Thorsten Haude: > * Matthias Kleine [01-11-01 21:05]: > >Na ich bitte Dich, wir k=C3=B6nnen doch mit Regular Expressions umgehen: > > Was ist denn das f=C3=BCr eine L=C3=B6sung?=20 Eine modulare L=C3=B6sung. Ich kannte Heinz' Ausgangsfragestellung nicht, da = ich=20 sein Posting vom Montag, das er erw=C3=A4hnt, nicht gelesen hatte. Daher war = f=C3=BCr=20 mich die Aufgabenstellung: "Suche rekursiv (=C3=BCber einen Teilbaum) nach=20 bestimmtem Ausdruck". Hierf=C3=BCr gibt es grep und Verwandte. Ich verstehe =C3=BCbringens die Aufgabenstellung auch jetzt noch nicht, nachd= em=20 ich Heinz' urspr=C3=BCngliches Posting vom Montag gelesen habe. grep liefert = die=20 Ergebnisse zeilenweise. Textdateien sind unter Unix je Zeile durch Newline=20 begrenzt, daran orientiert sich grep. Die L=C3=A4nge des Kontextes l=C3=A4=C3= =9Ft sich mit=20 -A einstellen. Was ist hier so anders an HTML-Dateien? Heinz hat auch nach=20 wie vor kein Beispiel gepostet.=20 > Wenn Du das weiterverfolgst, wirst Du kaum vermeiden k=C3=B6nnen, 'lynx -du= mp'=20 > nachzuprogrammieren.=20 Wie sagt Larry Wall - "You can do it in more then one way." Regular=20 Expressions f=C3=BChren meist zu einfacheren L=C3=B6sungen, die nur komplizie= rter=20 aussehen. Die ganze lynx -dump Mimik wirkt jedenfalls ziemlich verwegen, aber= =20 vielleicht funktionierts ja ;-). - Matthias --=20 LPI Level 1 Certified http://www.selflinux.de --===============1686546261833427884==-- From yoo@vranx.de Thu Nov 1 23:54:52 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 01:03:24 +0100 Message-ID: <20011102010324.G8206@eumel.yoo.net> In-Reply-To: <20011101234107.4E1BBE6361@ns1.suse.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6054305755306013210==" --===============6054305755306013210== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: quoted-printable Moin, * Matthias Kleine [01-11-02 00:44]: >Am Donnerstag, 1. November 2001 21:22 schrieb Thorsten Haude: >> * Matthias Kleine [01-11-01 21:05]: >> >Na ich bitte Dich, wir k=C3=B6nnen doch mit Regular Expressions umgehen: >> Was ist denn das f=C3=BCr eine L=C3=B6sung?=20 >Eine modulare L=C3=B6sung. Ein Modul pro HTML-Entity? >> Wenn Du das weiterverfolgst, wirst Du kaum vermeiden k=C3=B6nnen, 'lynx -d= ump'=20 >> nachzuprogrammieren.=20 >Wie sagt Larry Wall - "You can do it in more then one way." Regular=20 >Expressions f=C3=BChren meist zu einfacheren L=C3=B6sungen, die nur komplizi= erter=20 >aussehen. Die ganze lynx -dump Mimik wirkt jedenfalls ziemlich verwegen, abe= r=20 >vielleicht funktionierts ja ;-). =C3=84h, danke, ich habe auch schonmal eine Regex gesehen. Hier ging es mir darum, da=C3=9F man die HTML-Entities nicht alle mit Regexen suchen will, zumal sie ggf. nicht benutzt werden. Lynx macht das alles viel besser. Thorsten --=20 They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============6054305755306013210==-- From h.pahlke@nexgo.de Fri Nov 2 07:06:50 2001 From: "Heinz W. Pahlke" To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 08:07:49 +0100 Message-ID: In-Reply-To: <20011101234107.4E1BBE6361@ns1.suse.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8958962060684305299==" --===============8958962060684305299== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit On 01-Nov-2001 Matthias Kleine wrote: > Ich verstehe übringens die Aufgabenstellung auch jetzt noch nicht, > nachdem > ich Heinz' ursprüngliches Posting vom Montag gelesen habe. grep > liefert die > Ergebnisse zeilenweise. Textdateien sind unter Unix je Zeile durch > Newline > begrenzt, daran orientiert sich grep. Die Länge des Kontextes läßt > sich mit > -A einstellen. Was ist hier so anders an HTML-Dateien? Heinz hat auch > nach > wie vor kein Beispiel gepostet. Weil vermutlich jeder irgendwelche html-Dateien auf seinem Rechner rumliegen hat. Aber okay, ich verstosse dann eben doch mal gegen die Listen-Etikette und haenge ein Minimalbeispiel als Attachement ran. (Per Copy and Paste in den Mailbody einfuegen ist leider nicht, weil spaetestens dein MUA Zeilenumbrueche einfuegt. Da ich sonst keine derartigen Attachements verschicke, hoffe ich nur, dass ich bei der Kodierung keinen Mist gemacht habe.) Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus :-( Wenn in dem Verzeichnis aber mehrere html-Dateien und womoeglich noch grosse Dateien mit haeufigerem Auftreten des Suchbegriffs liegen, ist das Ergebnis dadurch ausgesprochen unuebersichtlich. Mit den vorgeschlagenen sub-bash-Loesungen sieht es dann eben sehr viel besser aus. Beste Gruesse, Heinz. -- E-Mail: Heinz W. Pahlke This message was sent by means of XFMail via SuSE Linux --===============8958962060684305299== Content-Type: application/octet-stream Content-Transfer-Encoding: base64 Content-Disposition: attachment; filename="versuch.html" MIME-Version: 1.0 PEhUTUw+CiA8SEVBRD4KIDxUSVRMRT48L1RJVExFPgogPC9IRUFEPgogPHA+V2VyIHNpZWh0IGRp ZSBOZXViYXV0ZW4gYW4gZGVyIENoYXVzc2Vlc3RyYd9lLCBkaWUgbWl0IEhvbHpsYW1lbGxlbiB1 bmQgZ3Jv32VuIEZlbnN0ZXJuIHp3aXNjaGVuIHN0dWNrdmVyemllcnRlbiBBbHRiYXV0ZW4gZ+Ru emxpY2ggbW9kZXJuIHNpbmQsIGFscyBGcmVtZGv2cnBlciBpbiBkZXIgU3RhZHQgYW4/IERlbm5v Y2g6IERlciBWZXJsYWcgQmVydGVsc21hbm4gbORzc3QgVW50ZXIgZGVuIExpbmRlbiBkYXMgaW0g S3JpZWcgemVyc3T2cnRlIHByZXXfaXNjaGUgJnF1b3Q7S29tbWFuZGFudGVuaGF1cyZxdW90OyBy ZWtvbnN0cnVpZXJlbjsgZGFzIHNw5HRiYXJvY2tlIFBvdHNkYW1lciBTY2hsb3NzIHVuZCBkaWUg QmF1YWthZGVtaWUgc29sbGVuIHdpZWRlcmF1ZmVyc3RlaGVuLCBuYWNoIGRlbSBNb2RlbGwgZGVz IERyZXNkbmVyIFJva29rby1QYWxhaXMgQ29zZWw6IEJldG9uIHVuZCBlaW56ZWxuZSByZXBy5HNl bnRhdGl2LWhpc3RvcmlzdGlzY2hlIFPkbGUgaW5uZW4sIGF132VuIFN0dWNrZGVrb3IuIFVuZCBh biBkZXIgTfxuY2huZXIgTWF4aW1pbGlhbnN0cmHfZSB3aXJkIGRhcyAtIGplZGVzIEhpc3Rvcmlz bXVzIHVudmVyZORjaHRpZ2UgLSBCZXJsaW5lciBC/HJvIEdld2VycywgS/xobiB1bmQgS/xobiB2 b3IgZWluZSBLb21wb3NpdGlvbiBhdXMgYWJzdHJha3RlbiBHbGFzYmF1dGVuIGRpZSBpbSBLcmll ZyB6ZXJzdPZydGUsIG5ldWdvdGlzY2hlIEZhc3NhZGUgZGVzIEL8cmtsZWluYmF1ZXMgc3RlbGxl bi4gCiAKIDwvQk9EWT48L0hUTUw+Cgo= --===============8958962060684305299==-- From corsepiu@faw.uni-ulm.de Fri Nov 2 08:04:09 2001 From: Ralf Corsepius To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 09:05:25 +0100 Message-ID: <1004688239.6473.243.camel@mccallum> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============4536597256314767832==" --===============4536597256314767832== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Am Fre, 2001-11-02 um 08.07 schrieb Heinz W. Pahlke: > > On 01-Nov-2001 Matthias Kleine wrote: > > > Ich verstehe übringens die Aufgabenstellung auch jetzt noch nicht, > > nachdem > > ich Heinz' ursprüngliches Posting vom Montag gelesen habe. grep > > liefert die > > Ergebnisse zeilenweise. Textdateien sind unter Unix je Zeile durch > > Newline > > begrenzt, daran orientiert sich grep. Die Länge des Kontextes läßt > > sich mit > > -A einstellen. Was ist hier so anders an HTML-Dateien? Heinz hat auch > > nach > > wie vor kein Beispiel gepostet. > > Weil vermutlich jeder irgendwelche html-Dateien auf seinem Rechner > rumliegen hat. > > Aber okay, ich verstosse dann eben doch mal gegen die Listen-Etikette > und haenge ein Minimalbeispiel als Attachement ran. (Per Copy and Paste > in den Mailbody einfuegen ist leider nicht, weil spaetestens dein MUA > Zeilenumbrueche einfuegt. Da ich sonst keine derartigen Attachements > verschicke, hoffe ich nur, dass ich bei der Kodierung keinen Mist > gemacht habe.) > > Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus Nein, es wirft Dir die gesamte Zeile aus! Aus man grep: grep, egrep, fgrep - print lines matching a pattern Dein

.*Verlag.* ist eine einzige Zeile, Dein grep -i Ergebnis ist also lediglich eine Folge der Formatierung der HTML-Datei und hat weder mit HTML an sich noch mit Verzeichnissen etwas zu tun. D.h. je nach Standpunkt ist entweder grep für Dein Ziel nicht das richtige Werkzeug, oder aber deine Daten (*html) sind nicht geeignet formatiert. Ralf --===============4536597256314767832==-- From h.pahlke@nexgo.de Fri Nov 2 08:19:29 2001 From: "Heinz W. Pahlke" To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 09:20:31 +0100 Message-ID: In-Reply-To: <1004688239.6473.243.camel@mccallum> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8474046295052100563==" --===============8474046295052100563== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit On 02-Nov-2001 Ralf Corsepius wrote: > Am Fre, 2001-11-02 um 08.07 schrieb Heinz W. Pahlke: >> Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag >> aus > Nein, es wirft Dir die gesamte Zeile aus! Und die umnfasst dunmnerweise den ganzen p-tag. > Dein

.*Verlag.* ist eine einzige Zeile, Dein grep -i Ergebnis ist > also lediglich eine Folge der Formatierung der HTML-Datei und hat > weder > mit HTML an sich noch mit Verzeichnissen etwas zu tun. Wo habe ich das behauptet? > D.h. je nach Standpunkt ist entweder grep für Dein Ziel nicht das > richtige Werkzeug, oder aber deine Daten (*html) sind nicht geeignet > formatiert. Nur, es gibt nichts anderes als grep. Und die zu greppenden Dateien liegen nun einmal im html-Format vor. Da sie zum Teil auch "echte" Tabellen enthalten, kann ich sie dummerweise nicht einfach alle unbesehen in txt-Dateien umwandeln. Dann gaebe es das Problem natuerlich nicht. Aber mit dem Umweg ueber die Bash bringt ja grep auch eine Ausgabe, wie ich sie mir vorstelle. Nur auf die Bash-Idee muss man erst einmal kommen. Einen schoenen Tag, Heinz. -- E-Mail: Heinz W. Pahlke This message was sent by means of XFMail via SuSE Linux --===============8474046295052100563==-- From Matthias.Kleine@prs.de Fri Nov 2 10:31:30 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 11:31:26 +0100 Message-ID: <3BE275FE.DAF79C37@prs.de> In-Reply-To: <20011102010324.G8206@eumel.yoo.net> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============4712895077666328510==" --===============4712895077666328510== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote: > >Eine modulare Lösung. > Ein Modul pro HTML-Entity? Sorry, ich dachte hier geht es um das greppen nach einem Suchwort. Wieviele Entities enthält denn das Suchwort? - Matthias --===============4712895077666328510==-- From Matthias.Kleine@prs.de Fri Nov 2 11:52:29 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 12:52:24 +0100 Message-ID: <3BE288F8.A35CF11A@prs.de> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8896179538768531422==" --===============8896179538768531422== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit "Heinz W. Pahlke" wrote: > Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus > :-( Das Problem hier ist nicht der

-Tag, sondern die Zeilenlänge, sprich das Newline kommt erst nach ein paar hundert Zeichen. grep interpretiert das als einzelne Zeile (was ja auch korrekt ist) und gibt sie aus. Hier müßte man dann das Ergebnis in ein Tool pipen, mit dem man die jede Zeile abschneiden, irgend so ein Teil aus den gnutools, aber im Moment fällt mir da auch keins ein. Vielleicht kommst Du mit fmt weiter, weiß nicht. - Matthias --===============8896179538768531422==-- From yoo@vranx.de Fri Nov 2 12:12:23 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 13:16:20 +0100 Message-ID: <20011102131620.E1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE288F8.A35CF11A@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============9097836095859157055==" --===============9097836095859157055== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 12:52]: >"Heinz W. Pahlke" wrote: >> Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus >Hier müßte man dann das Ergebnis in ein Tool pipen, mit dem man die >jede Zeile abschneiden Ich schlage Lynx vor. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============9097836095859157055==-- From Matthias.Kleine@prs.de Fri Nov 2 12:26:22 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 13:26:17 +0100 Message-ID: <3BE290E9.7099BB66@prs.de> In-Reply-To: <20011102131620.E1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3688130078205300845==" --===============3688130078205300845== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote: > >> Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus > >Hier müßte man dann das Ergebnis in ein Tool pipen, mit dem man die > >jede Zeile abschneiden > Ich schlage Lynx vor. Nur damit ich das nochmal nachvollziehen kann: Wir schicken also die Zeile durch lynx -dump, um sie dann nach grep zu pipen? Oder wie sieht die Lösung des Problems mit lynx nun aus? - Matthias --===============3688130078205300845==-- From yoo@vranx.de Fri Nov 2 12:56:42 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 13:59:46 +0100 Message-ID: <20011102135946.H1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE290E9.7099BB66@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============5278629121179972052==" --===============5278629121179972052== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 13:26]: >Thorsten Haude wrote: >> >> Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus >> >Hier müßte man dann das Ergebnis in ein Tool pipen, mit dem man die >> >jede Zeile abschneiden >> Ich schlage Lynx vor. >Nur damit ich das nochmal nachvollziehen kann: Wir schicken also die >Zeile durch lynx -dump, um sie dann nach grep zu pipen? Oder wie sieht >die Lösung des Problems mit lynx nun aus? Wie genau man die Befehle zusammenpipen muß, habe ich mir nicht angesehen (dh. ich hab's mir schon angesehen, aber nichts gefunden), aber prinzipiell müßte folgendes gehen: HTML -> Lnyx -> grep Vorteil: Die Übersetzung von HTML in Plain Text (inkl. langer Zeilen, Entities, Tabellen) erledigt Lynx. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============5278629121179972052==-- From B.Brodesser@t-online.de Fri Nov 2 13:37:00 2001 From: B.Brodesser@t-online.de To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 13:39:13 +0100 Message-ID: <20011102133913.B12137@b.brodesser.dialin.t-online.de> In-Reply-To: <3BE288F8.A35CF11A@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============7727491894758494985==" --===============7727491894758494985== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: quoted-printable * Matthias Kleine schrieb am 02.Nov.2001: > "Heinz W. Pahlke" wrote: >=20 > > Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag aus > > :-( >=20 > Das Problem hier ist nicht der

-Tag, sondern die Zeilenl=C3=A4nge, spric= h das > Newline kommt erst nach ein paar hundert Zeichen. grep interpretiert das als > einzelne Zeile (was ja auch korrekt ist) und gibt sie aus. Hier m=C3=BC=C3= =9Fte man > dann das Ergebnis in ein Tool pipen, mit dem man die jede Zeile abschneiden= ,=20 > irgend so ein Teil aus den gnutools, aber im Moment f=C3=A4llt mir da auch > keins ein. Vielleicht kommst Du mit fmt weiter, wei=C3=9F nicht. Du meinst fold. Bernd --=20 Umsteiger von Microsoft Windows xx?=20 Hast Du schon file://usr/doc/howto/de/DE-DOS-nach-Linux-HOWTO.txt gelesen? Auch file://usr/doc/Books/Linuxhandbuch.dvi ist zu empfehlen. |Zufallssignatur 1 --===============7727491894758494985==-- From Matthias.Kleine@prs.de Fri Nov 2 13:45:51 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 14:45:40 +0100 Message-ID: <3BE2A384.50E5068B@prs.de> In-Reply-To: <20011102135946.H1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============4889509324168334729==" --===============4889509324168334729== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote: > Wie genau man die Befehle zusammenpipen muß, habe ich mir nicht > angesehen (dh. ich hab's mir schon angesehen, aber nichts gefunden), > aber prinzipiell müßte folgendes gehen: > HTML -> Lnyx -> grep > Vorteil: Die Übersetzung von HTML in Plain Text (inkl. langer Zeilen, > Entities, Tabellen) erledigt Lynx. Das funktioniert nicht, denn was geschieht, wenn lynx die Zeile mitten im Suchwort abschneidet? Dann findet grep, das zeilenweise arbeitet, das Suchwort nicht. Vielleicht solltest Du Deine Tips doch mal ausprobieren. - Matthias --===============4889509324168334729==-- From Matthias.Kleine@prs.de Fri Nov 2 13:52:23 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 14:52:18 +0100 Message-ID: <3BE2A512.E6BB53B1@prs.de> In-Reply-To: <20011102133913.B12137@b.brodesser.dialin.t-online.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3122609878816220732==" --===============3122609878816220732== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: quoted-printable Bernd Brodesser wrote: > > einzelne Zeile (was ja auch korrekt ist) und gibt sie aus. Hier m=C3=BC= =C3=9Fte man > > dann das Ergebnis in ein Tool pipen, mit dem man die jede Zeile abschneid= en, > > irgend so ein Teil aus den gnutools, aber im Moment f=C3=A4llt mir da auch > > keins ein. Vielleicht kommst Du mit fmt weiter, wei=C3=9F nicht. >=20 > Du meinst fold. Nein, leider auch nicht. fold bricht um, schneidet aber nicht ab. Das hei=C3=9Ft, wenn Du eine 100 Zeichen breite Zeile mit fold -w10 formatierst, erh=C3=A4lst Du 10 Zeilen a 10 Zeichen. Ich will aber nur die ersten 10 Zeichen und den Rest abschneiden. - Matthias --===============3122609878816220732==-- From yoo@vranx.de Fri Nov 2 14:35:58 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 15:32:11 +0100 Message-ID: <20011102153211.R1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2A384.50E5068B@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1918015412089555798==" --===============1918015412089555798== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 14:45]: >Thorsten Haude wrote: >> Wie genau man die Befehle zusammenpipen muß, habe ich mir nicht >> angesehen (dh. ich hab's mir schon angesehen, aber nichts gefunden), >> aber prinzipiell müßte folgendes gehen: >> HTML -> Lnyx -> grep >> Vorteil: Die Übersetzung von HTML in Plain Text (inkl. langer Zeilen, >> Entities, Tabellen) erledigt Lynx. >Das funktioniert nicht, denn was geschieht, wenn lynx die Zeile mitten >im Suchwort abschneidet? Dann findet grep, das zeilenweise arbeitet, >das Suchwort nicht. Wenn Du nach Phrasen suchst, liegt das in der Natur der Sache. In HTML ist das Problem allerdings noch größer. Ich würde mich freuen, wenn Du mir die Perfekte Lösung beschreiben würdest; bis dahin macht es nicht viel Sinn, wenn Du meinem Vorschlag mangelnde Perfektion nachweist. >Vielleicht solltest Du Deine Tips doch mal ausprobieren. Klar, sobald ich bezahlt werde. Daß ich es nicht getestet hatte, hatte ich dazu geschreiben. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============1918015412089555798==-- From yoo@vranx.de Fri Nov 2 14:42:12 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 15:32:59 +0100 Message-ID: <20011102153259.S1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2A512.E6BB53B1@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6727223196970768357==" --===============6727223196970768357== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 14:52]: >Nein, leider auch nicht. fold bricht um, schneidet aber >nicht ab. Das heißt, wenn Du eine 100 Zeichen breite >Zeile mit fold -w10 formatierst, erhälst Du 10 Zeilen >a 10 Zeichen. Ich will aber nur die ersten 10 Zeichen >und den Rest abschneiden. Nimm Perl. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============6727223196970768357==-- From Matthias.Kleine@prs.de Fri Nov 2 15:08:22 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 16:08:17 +0100 Message-ID: <3BE2B6E1.F38CCE31@prs.de> In-Reply-To: <20011102153211.R1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2859209334387242133==" --===============2859209334387242133== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote: > >Das funktioniert nicht, denn was geschieht, wenn lynx die Zeile mitten > >im Suchwort abschneidet? Dann findet grep, das zeilenweise arbeitet, > >das Suchwort nicht. > Wenn Du nach Phrasen suchst, liegt das in der Natur der Sache. In HTML > ist das Problem allerdings noch größer. Es liegt in der Natur der Sache, wenn ich nach einer Phrase suche, diese auch vorhanden ist, ich sie aber nicht finde, weil das falsche Kommando verwende? > Ich würde mich freuen, wenn Du mir die Perfekte Lösung beschreiben > würdest; bis dahin macht es nicht viel Sinn, wenn Du meinem Vorschlag > mangelnde Perfektion nachweist. grep -Hrl Suchwort Verzeichnis Wenn der das gefundene Suchwort mit in die Ausgabe soll, muß ich die Ausgabe formatieren, um unschöne lange Zeilen zu vermeiden. Das sieht so aus: grep -Hrl Suchwort Verzeichnis | fmt -w80 Wenn ich diese Ausgabe weiter verschönern will - man fmt. - Matthias --===============2859209334387242133==-- From yoo@vranx.de Fri Nov 2 15:21:08 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 16:26:31 +0100 Message-ID: <20011102162631.W1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2B6E1.F38CCE31@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============9206744222770706578==" --===============9206744222770706578== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 16:08]: >Thorsten Haude wrote: >> Ich würde mich freuen, wenn Du mir die Perfekte Lösung beschreiben >> würdest; bis dahin macht es nicht viel Sinn, wenn Du meinem Vorschlag >> mangelnde Perfektion nachweist. >grep -Hrl Suchwort Verzeichnis Das funktioniert nicht, denn was geschieht, wenn der Text die Zeile mitten im Suchwort abschneidet? Dann findet grep, das zeilenweise arbeitet, das Suchwort nicht. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============9206744222770706578==-- From Matthias.Kleine@prs.de Fri Nov 2 15:34:31 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 16:34:21 +0100 Message-ID: <3BE2BCFD.583BD85D@prs.de> In-Reply-To: <20011102162631.W1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============7856530304594161946==" --===============7856530304594161946== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: quoted-printable Thorsten Haude wrote: > >grep -Hrl Suchwort Verzeichnis > Das funktioniert nicht, denn was geschieht, wenn der Text die Zeile > mitten im Suchwort abschneidet? Dann findet grep, das zeilenweise > arbeitet, das Suchwort nicht. echo \ ddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd= diiiddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd= ddddd > test.txt $ lynx -dump ./test.txt | grep iii $ grep iii ./test.txt ddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd= diiiddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd= ddddd Wie wir sehen, findet die lynx -dump Mimik den gesuchten String iii nicht, we= il: lynx -dump ./test.txt ddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd= di iiddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd= dd d der String iii umgebrochen wurde. grep hingegen, das zeilenweise arbeitet, findet den String problemlos. - Matthias --===============7856530304594161946==-- From yoo@vranx.de Fri Nov 2 15:48:18 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 16:55:05 +0100 Message-ID: <20011102165505.X1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2BCFD.583BD85D@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1106395813617467455==" --===============1106395813617467455== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit Moin, * Matthias Kleine [01-11-02 16:34]: >Thorsten Haude wrote: >> >grep -Hrl Suchwort Verzeichnis >> Das funktioniert nicht, denn was geschieht, wenn der Text die Zeile >> mitten im Suchwort abschneidet? Dann findet grep, das zeilenweise >> arbeitet, das Suchwort nicht. >grep hingegen, das zeilenweise arbeitet, findet den String problemlos. Liest Du eigentlich gelegentlich, was Du schreibst? Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============1106395813617467455==-- From Matthias.Kleine@prs.de Fri Nov 2 16:14:59 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 17:14:54 +0100 Message-ID: <3BE2C67E.3533109F@prs.de> In-Reply-To: <20011102165505.X1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8029788612790825528==" --===============8029788612790825528== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit Thorsten Haude wrote: > >> >grep -Hrl Suchwort Verzeichnis > >> Das funktioniert nicht, denn was geschieht, wenn der Text die Zeile > >> mitten im Suchwort abschneidet? Dann findet grep, das zeilenweise > >> arbeitet, das Suchwort nicht. > >grep hingegen, das zeilenweise arbeitet, findet den String problemlos. > Liest Du eigentlich gelegentlich, was Du schreibst? Klar. Und im Gegensatz zu Dir teste ich es sogar. - Matthias --===============8029788612790825528==-- From th@monochrom.at Fri Nov 2 16:25:37 2001 From: Thomas Hofer To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 17:24:50 +0100 Message-ID: <200111021626.fA2GQq277386@mailbox.univie.ac.at> In-Reply-To: <3BE2B6E1.F38CCE31@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============4560572373702806181==" --===============4560572373702806181== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Matthias Kleine wrote (Freitag, 2. November 2001 16:08): > Thorsten Haude wrote: > > >Das funktioniert nicht, denn was geschieht, wenn lynx die Zeile > > > mitten im Suchwort abschneidet? Dann findet grep, das zeilenweise > > > arbeitet, das Suchwort nicht. > > > > Wenn Du nach Phrasen suchst, liegt das in der Natur der Sache. In > > HTML ist das Problem allerdings noch größer. > > Es liegt in der Natur der Sache, wenn ich nach einer Phrase suche, > diese auch vorhanden ist, ich sie aber nicht finde, weil das falsche > Kommando verwende? > > > Ich würde mich freuen, wenn Du mir die Perfekte Lösung beschreiben > > würdest; bis dahin macht es nicht viel Sinn, wenn Du meinem > > Vorschlag mangelnde Perfektion nachweist. > > grep -Hrl Suchwort Verzeichnis cat > heiss.html <

heiß und fettig

EOF grep -Hrl "fettig" heiss.html || echo nichts. grep -Hrl "heiß" heiss.html || echo nichts. grep -Hrl "heiß und fettig" heiss.html || echo nichts. grep -Hrl "heiß und fettig" heiss.html || echo auch nichts. lynx -dump heiss.html | grep "heiß" && echo gefunden. lynx -dump heiss.html | grep "fettig" && echo gefunden. lynx -dump heiss.html | grep "heiß und fettig" && echo gefunden. Thomas. --===============4560572373702806181==-- From yoo@vranx.de Fri Nov 2 16:25:51 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 17:33:27 +0100 Message-ID: <20011102173327.Z1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2C67E.3533109F@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8794826128891769075==" --===============8794826128891769075== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit Moin, * Matthias Kleine [01-11-02 17:14]: >Thorsten Haude wrote: >> Liest Du eigentlich gelegentlich, was Du schreibst? >Klar. Und im Gegensatz zu Dir teste ich es sogar. Dann vergleich doch mal Dein Argument in <3BE2A384.50E5068B(a)prs.de> mit meinem in <20011102162631.W1374(a)acp1130.ac1.dsh.de>. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============8794826128891769075==-- From Matthias.Kleine@prs.de Fri Nov 2 16:34:53 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 17:34:43 +0100 Message-ID: <3BE2CB23.D15466CD@prs.de> In-Reply-To: <20011102173327.Z1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6913303928716523183==" --===============6913303928716523183== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote: > >> Liest Du eigentlich gelegentlich, was Du schreibst? > >Klar. Und im Gegensatz zu Dir teste ich es sogar. > Dann vergleich doch mal Dein Argument in <3BE2A384.50E5068B(a)prs.de> mit > meinem in <20011102162631.W1374(a)acp1130.ac1.dsh.de>. [ ] Du hast dieses Argument auch wirklich verstanden. [ ] Du hast das ausführliche Beispiel nachvollzogen. [x] Du hast Dich in unnötig in Deine lynx -dump Mimik verrannt. Wenn Du das Beispiel in meiner letzten Mail mal in Deine Shell gepastet hättest, wüßtest Du, was gemeint war. lynx erzeugt Zeilenumbrüche, die den Suchbegriff zerstören können. Die Rede war nicht von Suchbegriffen, die schon in der Originaldatei umgebrochen sind. Daß diese so nicht gefunden werden können, ist ohnehin klar und war nicht gemeint. - Matthias --===============6913303928716523183==-- From Matthias.Kleine@prs.de Fri Nov 2 17:05:32 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 18:05:26 +0100 Message-ID: <3BE2D256.D7FC54AA@prs.de> In-Reply-To: <200111021626.fA2GQq277386@mailbox.univie.ac.at> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============1766174301639437592==" --===============1766174301639437592== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thomas Hofer wrote: > lynx -dump heiss.html | grep "heiß" && echo gefunden. > lynx -dump heiss.html | grep "fettig" && echo gefunden. > lynx -dump heiss.html | grep "heiß und fettig" && echo gefunden. Wo gefunden? In welcher Datei? Du hast rekursiv gesucht, über 1000 Dateien. Gut zu wissen, daß _irgendwo_ gefunden wurde, aber noch schöner wäre doch zu wissen, wo? Und wenn Deine Entity zufällig von lynx am Zeilenende umgebrochen worden wäre, hättest Du ebensowenig gefunden. - Matthias --===============1766174301639437592==-- From yoo@vranx.de Fri Nov 2 17:07:54 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 18:13:19 +0100 Message-ID: <20011102181319.C1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2CB23.D15466CD@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3303745054282147148==" --===============3303745054282147148== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 17:34]: >Thorsten Haude wrote: >> >> Liest Du eigentlich gelegentlich, was Du schreibst? >> >Klar. Und im Gegensatz zu Dir teste ich es sogar. >> Dann vergleich doch mal Dein Argument in <3BE2A384.50E5068B(a)prs.de> mit >> meinem in <20011102162631.W1374(a)acp1130.ac1.dsh.de>. >[ ] Du hast dieses Argument auch wirklich verstanden. >[ ] Du hast das ausführliche Beispiel nachvollzogen. >[x] Du hast Dich in unnötig in Deine lynx -dump Mimik verrannt. Darf ich mitspielen? [ ] Du hast dieses Argument auch wirklich verstanden. [ ] Du hast das ausführliche Beispiel nachvollzogen. [x] Du hast Dich in unnötig in Deine anti-lynx -dump Mimik verrannt. [ ] Du kennst den Unterschied zwischen Text und Quelltext >Wenn Du das Beispiel in meiner letzten Mail mal in Deine Shell gepastet >hättest, wüßtest Du, was gemeint war. Das weiß ich auch, ohne etwas zu pasten. >lynx erzeugt Zeilenumbrüche, die den Suchbegriff zerstören können. Ja. >Die Rede war nicht von Suchbegriffen, die schon in der Originaldatei >umgebrochen sind. Daß diese so nicht gefunden werden können, ist >ohnehin klar Siehe dazu die Mail von Thomas. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============3303745054282147148==-- From Matthias.Kleine@prs.de Fri Nov 2 17:11:23 2001 From: Matthias Kleine To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 18:11:18 +0100 Message-ID: <3BE2D3B6.A011873B@prs.de> In-Reply-To: <20011102181319.C1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============7985732932818124743==" --===============7985732932818124743== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Thorsten Haude wrote: > >lynx erzeugt Zeilenumbrüche, die den Suchbegriff zerstören können. > Ja. Warum schlägst Du dann eine Lösung mit lynx vor? > >Die Rede war nicht von Suchbegriffen, die schon in der Originaldatei > >umgebrochen sind. Daß diese so nicht gefunden werden können, ist > >ohnehin klar > Siehe dazu die Mail von Thomas. Siehe dazu meine Antwort. Die Diskussion hat keinen Nährwert mehr. Meinerseits EOT. - Matthias --===============7985732932818124743==-- From yoo@vranx.de Fri Nov 2 17:18:31 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 18:24:46 +0100 Message-ID: <20011102182446.D1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2D256.D7FC54AA@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============4764110116512963575==" --===============4764110116512963575== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 18:05]: >> lynx -dump heiss.html | grep "heiß" && echo gefunden. >> lynx -dump heiss.html | grep "fettig" && echo gefunden. >> lynx -dump heiss.html | grep "heiß und fettig" && echo gefunden. >Wo gefunden? In welcher Datei? Du hast rekursiv gesucht, >über 1000 Dateien. Gut zu wissen, daß _irgendwo_ gefunden >wurde, aber noch schöner wäre doch zu wissen, wo? Rückzugsgefecht. Jetzt hast Du nichts mehr gegen Lynx? Die Aufruf von Lynx sollte in ein find(1) eingebettet sein, schon vergessen? >Und wenn Deine Entity zufällig von lynx am Zeilenende >umgebrochen worden wäre, hättest Du ebensowenig gefunden. cf. meine Bemerkung zur perfekten Lösung. Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============4764110116512963575==-- From yoo@vranx.de Fri Nov 2 17:23:48 2001 From: Thorsten Haude To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Fri, 02 Nov 2001 18:30:16 +0100 Message-ID: <20011102183016.E1374@acp1130.ac1.dsh.de> In-Reply-To: <3BE2D3B6.A011873B@prs.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2510945282920734660==" --===============2510945282920734660== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Moin, * Matthias Kleine [01-11-02 18:11]: >Thorsten Haude wrote: >> >lynx erzeugt Zeilenumbrüche, die den Suchbegriff zerstören können. >> Ja. >Warum schlägst Du dann eine Lösung mit lynx vor? Weil es Lynx besser, nicht schlechter macht. >Die Diskussion hat keinen Nährwert mehr. Ehrlich wahr? Thorsten -- They that can give up essential liberty to obtain a little temporary safety deserve neither liberty nor safety. - Benjamin Franklin --===============2510945282920734660==-- From david@dhaller.de Sat Nov 3 05:05:32 2001 From: David Haller To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Sat, 03 Nov 2001 03:17:41 +0100 Message-ID: <20011103031741.B3060@dhaller.de> In-Reply-To: <20011102153259.S1374@acp1130.ac1.dsh.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============5266137784977253226==" --===============5266137784977253226== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Deja vu! On Fre, 02 Nov 2001, Thorsten Haude wrote: >* Matthias Kleine [01-11-02 14:52]: >>Nein, leider auch nicht. fold bricht um, schneidet aber >>nicht ab. Das heißt, wenn Du eine 100 Zeichen breite >>Zeile mit fold -w10 formatierst, erhälst Du 10 Zeilen >>a 10 Zeichen. Ich will aber nur die ersten 10 Zeichen >>und den Rest abschneiden. >Nimm Perl. Aehem, das Thema hatten wie doch erst. Und eine Loesung auch: Date: Mon, 29 Oct 2001 23:54:24 +0100 From: David Haller To: suse-linux(a)suse.com Subject: Re: html-Dateien greppen Message-ID: <20011029235424.C2853(a)dhaller.de> -dnh -- Und höhr auf Britney Spears zu imitieren. So Blond bist du auch wieder nicht. [WoKo in dag°] --===============5266137784977253226==-- From suse-linux@frodo.prima.de Sat Nov 3 18:20:30 2001 From: suse-linux@frodo.prima.de To: users-de@lists.opensuse.org Subject: Re: Verzeichnis greppen Date: Sat, 03 Nov 2001 19:20:00 +0200 Message-ID: <8CBqomArrWB@frodo.prima.de> In-Reply-To: MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2280711359822242026==" --===============2280711359822242026== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Hallo Heinz, Heinz W. Pahlke (h.pahlke(a)nexgo.de) wrote: >Weil vermutlich jeder irgendwelche html-Dateien auf seinem Rechner >rumliegen hat. > >Aber okay, ich verstosse dann eben doch mal gegen die Listen-Etikette >und haenge ein Minimalbeispiel als Attachement ran. (Per Copy and >Paste in den Mailbody einfuegen ist leider nicht, weil spaetestens >dein MUA Zeilenumbrueche einfuegt. Da ich sonst keine derartigen >Attachements verschicke, hoffe ich nur, dass ich bei der Kodierung >keinen Mist gemacht habe.) > >Ein "grep -i Verlag versuch.html" wirft dir dann den gesamten p-tag >aus :-( Ich will es auch mal versuchen. :-) perl -ne 'print "$ARGV: $&\n" if /.{1,20}verlag.{0,20}/i' versuch.html Als ersten Ansatz kann man versuch.html durch $(find . -type f) ersetzen, wobei es AFAIK bessere Ansätze gibt. -Falk --===============2280711359822242026==--