Hallo Zur Verfügung stehen Rechner mit devuan OS (daedalus) ohne PA. Ich hätte gerne eine Indizierung der Dokumente, die ich über die Zeit aus dem Internet geladen habe, und eine Klassifizierung,oder Empfehlung, welche Dokumente über die gleichen Themen sind. So dass ich sie einordnen kann. Jetzt ist das eher Kraut und Rüben. Was wäre die Empfehlung ? Eine Indizierung gibt es schon mit Recoll, d.h. wenn ich die Suchbegriffe habe, finde ich auch etwas Passendes. Was mir fehlt, ist eine Anzeige der "Informationsdichte" , so dass ich weiß, wie ich die ähnlichen Inhalte zusammen bringe. (z.B. Zum Thema "Benzin*" liegend 50% in Verzeichnis A, 15% in B usw. ) Gut wäre OCR , so dass auch grapghische pdfs gewandelt werden. Wünschen wert 1. aus der Distro, oder 2. Fremdquelle als Debian Paket oder 3. z.B. von git* und selbst Kompilieren, das gänge auch noch. Bitte Keine docker oder flatpaks oder snaps oder Container oder andere Paketierungssysteme einführen. Bin bisher schön ohne ausgekommen. .
Gruezi
On Tue, Jun 11, 2024 at 11:56:05PM -0000, erich_sysvinit erich_sysvinit wrote:
Hallo Zur Verfügung stehen Rechner mit devuan OS (daedalus) ohne PA. Ich hätte gerne eine Indizierung der Dokumente, die ich über die Zeit aus dem Internet geladen habe, und eine Klassifizierung,oder Empfehlung, welche Dokumente über die gleichen Themen sind. So dass ich sie einordnen kann. Jetzt ist das eher Kraut und Rüben. Was wäre die Empfehlung ? Eine Indizierung gibt es schon mit Recoll, d.h. wenn ich die Suchbegriffe habe, finde ich auch etwas Passendes. Was mir fehlt, ist eine Anzeige der "Informationsdichte" , so dass ich weiß, wie ich die ähnlichen Inhalte zusammen bringe. (z.B. Zum Thema "Benzin*" liegend 50% in Verzeichnis A, 15% in B usw. ) Gut wäre OCR , so dass auch grapghische pdfs gewandelt werden.
Oh. Weites Thema. Mir ist nichts bekannt, was Deine Bedürfnisse so "out-of-the-box" abdeckt. Du erwähnst recoll, was einfach eine hübsche GUI auf Xapian ist -- Xapian selbst könnte auch die Basis dessen sein, was Du suchst, aber ich fürchte, das geht nicht ganz, ohne selbst Hand anzulegen.
Xapian kann z.B. "faceted search" -- das scheint in Deine Richtung "Klassifikation" zu gehen.
Was OCR betrifft -- die Debian repos haben tesseract, ich gehe davon aus, dass es das bei Devuan auch gibt.
Wünschen wert 1. aus der Distro, oder 2. Fremdquelle als Debian Paket oder 3. z.B. von git* und selbst Kompilieren, das gänge auch noch. Bitte Keine docker oder flatpaks oder snaps oder Container oder andere Paketierungssysteme einführen. Bin bisher schön ohne ausgekommen. .
Ich bin auch kein Freund von Docker als "normales" Distributionswerkzeug.