Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

KDE, Gnome, Windowmanager, X11, Grafiktreiber und alles was dazu notwendig ist. Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von Stevo » 27.06.2022 18:10:32

Hallo zusammen,

ich hab schon viel gesucht und verglichen, aber kann es sein, dass unter einem Debian Bullseye die Gnome Suche keine Inhalte von ods-Dateien (Libreoffice Tabellendokumente) finden kann? odt Inhalte findet sie, pdf, txt usw.

Was ich bereits gemacht hab:

Das tritt auf verschiedenen Maschinen auf, selbes Verhalten, sogar eine ganz neu installierte

Tracker zeigt keine Fehler an, wenn ich mit "tracker extract" schaue, parst er den Dateiinhalt und findet keinen Inhalt (siehe Box unten). Der Dateiname hat einem Umlaut, das ist es aber nicht. Es tritt auch bei ods Dateien ohne Umlaut im Dateinamen auf.

Schau ich mit der Archivverwaltung in die Datei rein, ist in "content.xml" mein Suchbegriff vorhanden (logo).

So hab ich geschaut, was tracker mit der Datei macht.

Code: Alles auswählen

stefan@Stefan-A357:~$ tracker extract /home/stefan/Dokumente/Haushalt/Filtertüten.ods --verbosity=debug
Tracker-Message: 16:15:01.554: Set scheduler policy to SCHED_IDLE
Tracker-Message: 16:15:01.555: Setting priority nice level to 19
Tracker-Message: 16:15:01.557: Starting tracker-extract 2.3.5
Tracker-Message: 16:15:01.557: General options:
Tracker-Message: 16:15:01.557:   Verbosity  ............................  3
Tracker-Message: 16:15:01.557:   Sched Idle  ...........................  1
Tracker-Message: 16:15:01.557:   Max bytes (per file)  .................  1048576
Tracker-Message: 16:15:01.557: Set scheduler policy to SCHED_IDLE
Tracker-Message: 16:15:01.557: Setting priority nice level to 19
(tracker-extract:7445): dconf-DEBUG: 16:15:01.557: watch_established: "/org/freedesktop/tracker/extract/" (establishing: 1)
(tracker-extract:7445): GLib-GIO-DEBUG: 16:15:01.559: _g_io_module_get_default: Found default implementation gvfs (GDaemonVfs) for ‘gio-vfs’
Tracker-Message: 16:15:01.559: Loading extractor rules... (/usr/share/tracker-miners/extract-rules)
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.559:   Loaded rule '10-abw.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.559:   Loaded rule '10-bmp.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-comics.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-desktop.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-dvi.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-ebooks.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-epub.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-flac.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-gif.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-html.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-ico.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-jpeg.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-mp3.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-msoffice.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-oasis.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-pdf.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-png.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-ps.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-raw.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-svg.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-tiff.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-vorbis.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-xmp.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '10-xps.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '11-iso.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '11-msoffice-xml.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '15-gstreamer-guess.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.560:   Loaded rule '15-playlist.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.561:   Loaded rule '15-source-code.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.561:   Loaded rule '90-gstreamer-audio-generic.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.561:   Loaded rule '90-gstreamer-video-generic.rule'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.561:   Loaded rule '90-text-generic.rule'
Tracker-Message: 16:15:01.561: Extractor rules loaded
Tracker-Message: 16:15:01.562: MIME type guessed as 'application/vnd.oasis.opendocument.spreadsheet' (from GIO)
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.562: Using /usr/lib/x86_64-linux-gnu/tracker-miners-2.0/extract-modules/libextract-oasis.so...
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.562: Extracting OASIS metadata and contents from 'file:///home/stefan/Dokumente/Haushalt/Filtert%C3%BCten.ods'
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.562: Parsing 'meta.xml' XML file contained inside zip archive...
(tracker-extract:7445): Tracker-DEBUG: 16:15:01.567: Parsing 'content.xml' XML file contained inside zip archive...
@prefix nie: <http://www.semanticdesktop.org/ontologies/2007/01/19/nie#> .
@prefix nfo: <http://www.semanticdesktop.org/ontologies/2007/03/22/nfo#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

<file:///home/stefan/Dokumente/Haushalt/Filtert%C3%BCten.ods> nie:plainTextContent "" ;
  nie:generator "LibreOffice/7.0.4.2$Linux_X86_64 LibreOffice_project/00$Build-2" ;
  a nfo:PaginatedTextDocument ;
  nie:contentCreated "2009-04-16T11:32:48.39" .

stefan@Stefan-A357:~$ 
Indiziere ich sie erneut, wird auch kein Fehler ausgegeben

Code: Alles auswählen

stefan@Stefan-A357:~$ tracker index --file /home/stefan/Dokumente/Haushalt/Filtertüten.ods
(Erneute) Indizierung der Datei war erfolgreich
Kann es sein, dass das tatsächlich der aktuelle Stand ist, dass keine Inhalte von Libreoffice-Tabellendokumenten indexiert sind, welche aus den ms-office Dateien aber durchaus (die findet er, auch das hab ich ausprobiert).

Kann ich was tun um das zur reparieren? Unter "Protokolle" (Benutzer oder Systemprotokoll) finde ich auch nichts was dazu passend verdächtig aussieht).

Mehr als wie oben gezeigt reinzuschauen bringe ich nicht hin. Und aus der Ausgabe werd eich nicht schlau wo ich ansetzen müsste. Da ich im Haushalt fast alle PC auf Linux umgestellt habe würde ich ungerne noch ein separates Programm wie recoll installieren und erklären müssen wann diese und wann jenes zu verwenden ist. Gnome soll als Desktop bleiben.

Wenn mir jemand das Brett vor dem Kopf wegnimmt, meine Befürchtung bestätigt oder Abhilfe weiß .... gerne

Beste Grüße
Stefan

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von JTH » 27.06.2022 21:51:18

Moin,
Stevo hat geschrieben: ↑ zum Beitrag ↑
27.06.2022 18:10:32
Wenn mir jemand das Brett vor dem Kopf wegnimmt,
deine Beobachtung ist schon ganz richtig. In deiner Ausgabe von tracker extract sieht man, dass aus dem .ods kein Text extrahiert (und folglich auch nicht indiziert) wird:
Stevo hat geschrieben: ↑ zum Beitrag ↑
27.06.2022 18:10:32

Code: Alles auswählen

nie:plainTextContent ""

Stevo hat geschrieben: ↑ zum Beitrag ↑
27.06.2022 18:10:32
[…] meine Befürchtung bestätigt […]
Die muss ich leider bestätigen ;) Ich hab mich nach dem Lesen deines Beitrags etwas länger als geplant im tracker-Code verlaufen :? Das kein Text aus .ods durchsuchbar ist, ist ein Bug, der sich irgendwann mal eingeschlichen hat. Vor 3–4 Jahren müsste es schon einmal funktioniert haben.

Stevo hat geschrieben: ↑ zum Beitrag ↑
27.06.2022 18:10:32
[…] oder Abhilfe weiß .... gerne
Die ist in Arbeit :D Ich hab grad mal einen Patch an die tracker-Maintainer geschickt. Bis das allerdings in den tatsächlichen Paketen und im Debian-Repository ankommt, wirds wahrscheinlich bis zum nächsten Debian-Release dauern.
Manchmal bekannt als Just (another) Terminal Hacker.

eggy
Beiträge: 3331
Registriert: 10.05.2008 11:23:50

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von eggy » 27.06.2022 22:13:30

Wenn Du noch mehr Zeit versenken willst, vielleicht trifft "contain text:p" auch auf die anderen oo Formate zu? Mich würde es nicht wundern.

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von JTH » 27.06.2022 23:02:42

Das war schon mehr Zeit, als ich eigentlich wollte :D Der Bug und Fix betrifft auch die Grafikdateien .odg. Für die Textdateien .odt werden die zu durchsuchenden Tags explizit aufgelistet. Die unterschiedliche Handhabung mag ihren Grund (gehabt) haben. Weiter bin ich da auch nicht eingestiegen.
Manchmal bekannt als Just (another) Terminal Hacker.

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von Stevo » 27.06.2022 23:56:12

JT,

ganz herzlichen Dank!

Bis zum Lesen Deines Beitrags dachte ich, dass das doch schon jemandem aufgefallen hätte müssen. Ich hoffe nur, dass der Fix irgendwie seinen Weg auch zu Bullseye findet ...

@eggy: text:p ist
The <text:p> element represents a paragraph, which is the basic unit of text in an OpenDocument file.
Quelle: https://docs.oasis-open.org/office/Open ... schema.pdf TZ 5.1.3 Seite 108 von 782 (!). Untiefen ...

Übrigens hat ODF 1.2 von 2011 bis 2020 "gegolten" und dort das "Update" auf 1.3 erfahren, das wiederum im April 2021 ergänzt oder überarbeitet wurde. Sieht danach aus, als ob die Tracker-Änderungen auf diese Änderungen abheben.

Was mich wirklich "ärgert" ist, dass die MSOffice-Formate funktionieren....

Beste Grüße
Stefan

eggy
Beiträge: 3331
Registriert: 10.05.2008 11:23:50

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von eggy » 28.06.2022 00:13:56

Stevo hat geschrieben: ↑ zum Beitrag ↑
27.06.2022 23:56:12
Ich hoffe nur, dass der Fix irgendwie seinen Weg auch zu Bullseye findet ...
Notfalls selbst Paket bauen, bei so einer kleinen Änderung ist das auch relativ einfach.
apt-get source paketname, apt-get build-dep paketname, Änderungen machen, dpkg-buildpackage -us -uc (oder so ähnlich, kann sein, dass da noch was fehlt/falsch ist)

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von Stevo » 28.06.2022 09:53:12

Moin,
Notfalls selbst Paket bauen, bei so einer kleinen Änderung ist das auch relativ einfach.
Oje - dazu reichen meine Kenntnisse (noch?) nicht bzw sind die Tage zu kurz. :wink:

Ein ganz kurzer Blick in den ODF-Standard https://www.oasis-open.org/standards/ (filtern unter "Project/Comittee" auf "Open Document Format ..." auf das Dokument https://docs.oasis-open.org/office/Open ... schema.pdf zeigt zumindest mir, dass der Auszeichner"text:p" auf den eigentlichen Textinhalt verweist. Egal ob odt oder odf oder ..

Warum wie im Code sichtbar bei den odt Dateien die anderen Auszeichner so bearbeitet werden ist mir nicht klar, dazu reicht mein Wissen nicht.
Vielleicht nimmt sich jemand aus dem Libreoffice Umkreis der Sache an, es sollte gerade unter den Debian + Derivaten daran gelegen sein, dass Inhalte aus deren Dateiformat in der Suche indexiert werden.

Ich trau es ja fast nicht zu sagen, aber aktuell mach ich den workaround so, dass ich zu den zum Glück relativ statischen ods-Dokumenten beim Speichern automatisiert eine .xls-Version erzeuge, die dann dem Tracker den Inhalt liefert. Aber das freut mich nicht ..

Aber es ist gut, dass das Thema hochkam.

Beste Grüße
Stefan

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von JTH » 28.06.2022 11:06:46

Stevo hat geschrieben: ↑ zum Beitrag ↑
28.06.2022 09:53:12
Notfalls selbst Paket bauen, bei so einer kleinen Änderung ist das auch relativ einfach.
Oje - dazu reichen meine Kenntnisse (noch?) nicht bzw sind die Tage zu kurz. :wink:
Ach, das ist, wie eggy angerissen hat, für ein Paket, das es schon im Repo gibt, nicht so viel Aufwand. Du könntest auch der erstejetzt nur noch der zweite sein, der den Fix praktisch ausprobiert ;)

Als root vorbereiten:

Code: Alles auswählen

~# apt install --no-install-recommends devscripts quilt
~# mk-build-deps -ir tracker-extract && rm -f tracker-miners-build-deps*.{buildinfo,changes}
Bauen als Normalo:

Code: Alles auswählen

~$ apt source tracker-extract
~$ cd tracker-miners-x.y.z
tracker-miners-x.y.z$ wget https://gitlab.gnome.org/GNOME/tracker-miners/-/merge_requests/396.diff
tracker-miners-x.y.z$ quilt import 396.diff
tracker-miners-x.y.z$ DEB_BUILD_OPTIONS=noautodbgsym dpkg-buildpackage -b --no-sign
Und installieren (Pakete liegen im Elternverzeichnis von tracker-miners-x.y.z/):

Code: Alles auswählen

~# apt install ./tracker-*.deb
Beim Installieren ist ein Pfad mit / (absolut) oder ./ (relativ) vorne wichtig.
Zuletzt geändert von JTH am 28.06.2022 22:48:40, insgesamt 1-mal geändert.
Grund: s/der erste/der zweite/
Manchmal bekannt als Just (another) Terminal Hacker.

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von Stevo » 28.06.2022 16:41:30

Da ich mich auf den Rechnern die genutzt werden noch nicht getraut hab .... ein Versuch.

Datei woanders hinkopiert und sicherheitshalber Dateinamen geändert UND Extension auf ".odt" geändert.

Dann:

Code: Alles auswählen

stefan@Stefan-A357:~$ tracker extract /home/stefan/Downloads/FiltertütenEXT.odt --verbosity=debug
Tracker-Message: 16:33:17.658: Set scheduler policy to SCHED_IDLE
Tracker-Message: 16:33:17.658: Setting priority nice level to 19
Tracker-Message: 16:33:17.660: Starting tracker-extract 2.3.5
Tracker-Message: 16:33:17.660: General options:
Tracker-Message: 16:33:17.661:   Verbosity  ............................  3
Tracker-Message: 16:33:17.661:   Sched Idle  ...........................  1
Tracker-Message: 16:33:17.661:   Max bytes (per file)  .................  1048576
Tracker-Message: 16:33:17.661: Set scheduler policy to SCHED_IDLE
Tracker-Message: 16:33:17.661: Setting priority nice level to 19
(tracker-extract:8197): dconf-DEBUG: 16:33:17.661: watch_established: "/org/freedesktop/tracker/extract/" (establishing: 1)
(tracker-extract:8197): GLib-GIO-DEBUG: 16:33:17.663: _g_io_module_get_default: Found default implementation gvfs (GDaemonVfs) for ‘gio-vfs’
Tracker-Message: 16:33:17.663: Loading extractor rules... (/usr/share/tracker-miners/extract-rules)
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-abw.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-bmp.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-comics.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-desktop.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-dvi.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-ebooks.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-epub.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.663:   Loaded rule '10-flac.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-gif.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-html.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-ico.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-jpeg.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-mp3.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-msoffice.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-oasis.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-pdf.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-png.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-ps.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-raw.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-svg.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-tiff.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-vorbis.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-xmp.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '10-xps.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '11-iso.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '11-msoffice-xml.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '15-gstreamer-guess.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '15-playlist.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '15-source-code.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.664:   Loaded rule '90-gstreamer-audio-generic.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.665:   Loaded rule '90-gstreamer-video-generic.rule'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.665:   Loaded rule '90-text-generic.rule'
Tracker-Message: 16:33:17.665: Extractor rules loaded
Tracker-Message: 16:33:17.665: MIME type guessed as 'application/vnd.oasis.opendocument.text' (from GIO)
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.666: Using /usr/lib/x86_64-linux-gnu/tracker-miners-2.0/extract-modules/libextract-oasis.so...
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.666: Extracting OASIS metadata and contents from 'file:///home/stefan/Downloads/Filtert%C3%BCtenEXT.odt'
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.666: Parsing 'meta.xml' XML file contained inside zip archive...
(tracker-extract:8197): Tracker-DEBUG: 16:33:17.670: Parsing 'content.xml' XML file contained inside zip archive...
@prefix nie: <http://www.semanticdesktop.org/ontologies/2007/01/19/nie#> .
@prefix nfo: <http://www.semanticdesktop.org/ontologies/2007/03/22/nfo#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

<file:///home/stefan/Downloads/Filtert%C3%BCtenEXT.odt> nie:plainTextContent "StaubsaugertypFiltertyp bisher\"m\" = microvliesfilterGörlitztypStück /PackungPreis nettoAufschlag %Preis brutto Incl. MWStvomPersonSiemens Super XS dinoS11m3,170,003,77StefanTCM 03222Y16m4,210,005,01StefanMiele S323iM5m3,500,004,17StefanVorwerk Tiger 251V2505+1+14,070,004,84StefanMiele Complete C3M1mStefan0,00Multitec BSS 1600Y18M3,4036,005,50UdoVorwerk Kobold 135V13545,1414,507,00UdoMiele S711 Super AircleanM5/6m3,5032,005,50Udo32,000,00Miele Electronic S251iM5m3,5032,005,50IngeProgressSwirl Y50W16M3,5532,505,60Inge0,00Miele S5 EcolineM1m4,220,005,02GerhardSiemens Super 915S24,190,004,99GerhardElectrolux Z73/74/750,000,00GerhardColumbus ST2000W65,010,005,96GerhardFesto RS 2E0,000,00GerhardFesto RS 4E0,000,00GerhardBosch GAS 50MUK31M10 im \"Bündel\"15,950,0018,98GerhardAEG JetMaxxSwirl P86E5/PH5m3,504,17Gerhard0,00Vorwerk Tiger 2520,00BrigitteVK 140-1-KS0,00BrigitteVorwerk Kobold 121V11853,9625,005,89MicheAEG Öko VampyrinoSwirl A06A130m2,8020,004,00KarinAEG Vampyr electronicSwirl A07A126M3,3625,005,00KarinSiemens Super XS dino eSwirl S67S11m3,1719,004,49KarinHerstellerTypArtMieleS323iStaubsaugerMiele Complete C3 PowerlineStaubsaugerMieleSSB300-3 PQ TwisterParkettbürste Schonbürste MieleSSP10Saugpinsel mit flexiblem Drehgelenk" ;
  nie:generator "LibreOffice/7.0.4.2$Linux_X86_64 LibreOffice_project/00$Build-2" ;
  a nfo:PaginatedTextDocument ;
  nie:contentCreated "2009-04-16T11:32:48.39" .

stefan@Stefan-A357:~$ 
Probe

Code: Alles auswählen

stefan@Stefan-A357:~$ tracker search Vampyr
Ergebnisse:
  file:///home/stefan/Downloads/Filtert%C3%BCtenEXT.odt
  …VampyrinoSwirl A06A130m2,8020,004,00KarinAEG Vampyr electronicSwirl A07A126M3,3625,005,00KarinSiemens Super…


stefan@Stefan-A357:~$ 
Suche mit Nautilus-Suchbalken geht auch.


Mit dem vorhandenen Code für die "odt" (Libreoffice Writer) Dateien scheint es zu klappen... man müsste also ggf. gar nicht unterscheiden?

Beste Grüße
Stefan

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von JTH » 28.06.2022 17:05:17

Stevo hat geschrieben: ↑ zum Beitrag ↑
28.06.2022 16:41:30
Mit dem vorhandenen Code für die "odt" (Libreoffice Writer) Dateien scheint es zu klappen... man müsste also ggf. gar nicht unterscheiden?
Könnt auch sein, das diese Unterscheidung nach Dateityp gar nicht unbedingt notwendig ist. Die Textdateien können sicher die meisten verschiedenen Textelemente enthalten, vielleicht würde es reichen, alle Dateien wie diese zu behandeln. So weit wollt ich in den Standard und den restlichen Tracker-Code nicht einsteigen ;)

Dein Versuch scheint mir aber erstmal darauf hinzudeuten, dass sich Tracker beim Erkennen des Dateityps in erster Linie und einigermaßen leichtsinnig auf die Dateiendung verlässt, die du ja verändert hast.
Stevo hat geschrieben: ↑ zum Beitrag ↑
28.06.2022 16:41:30

Code: Alles auswählen

Tracker-Message: 16:33:17.665: MIME type guessed as 'application/vnd.oasis.opendocument.text' (from GIO)
Ob das jetzt gut ist, könnte man drüber streiten. Die .od*-Dateien enthalten auch ihren eigenen Mimetype als Datei „mimetype“, der wäre wohl verlässlicher. Ein zweiter Blick da hinein zur Bestätigung wäre sicher nicht verkehrt.

Du kannst ja nochmal ausprobieren, der Datei die Endung .pdf zu geben und dann nach dem Inhalt obiger Meldung gucken.
Manchmal bekannt als Just (another) Terminal Hacker.

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von Stevo » 28.06.2022 17:20:55

Oh je, je mehr man schaut, umso mehr Baustellen ;-)

In derauf "odt" umbenannten Datei steht natürlich noch der alte mimetyp drin in "mimetype" in der gepackten Datei.

Code: Alles auswählen

application/vnd.oasis.opendocument.spreadsheet
D.h. tracker verlässt sich auf gio. Aber die Tags intepretiert er korrekt. Natürlich nur, weil das OpenDocument Format diese in den verschiedenen Dateitypen bezüglich dem inhaltlichen Text gleich benutzt).

Beim pdf merkt er, dass es kein PDF ist. Das Wesentliche:

Code: Alles auswählen

Tracker-Message: 17:16:49.132: Extractor rules loaded
Tracker-Message: 17:16:49.133: MIME type guessed as 'application/pdf' (from GIO)
(tracker-extract:9084): Tracker-DEBUG: 17:16:49.152: Using /usr/lib/x86_64-linux-gnu/tracker-miners-2.0/extract-modules/libextract-pdf.so...
Poppler-INFO: 17:16:49.154: Syntax warning at position -1: May not be a PDF file (continuing anyway)
Poppler-INFO: 17:16:49.155: Syntax error at position -1: Couldn't find trailer dictionary
Poppler-INFO: 17:16:49.155: Syntax error at position -1: Couldn't find trailer dictionary
Poppler-INFO: 17:16:49.155: Syntax error at position -1: Couldn't read xref table

(tracker-extract:9084): Tracker-WARNING **: 17:16:49.155: Couldn't create PopplerDocument from uri:'file:///home/stefan/Downloads/Filtert%C3%BCtenEXT.pdf', PDF document is damaged
file:///home/stefan/Downloads/Filtert%C3%BCtenEXT.pdf: Es wurden keine Metadaten gefunden oder keine Entdecker, die mit dieser Datei umgehen können
stefan@Stefan-A357:~$ 

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von JTH » 28.06.2022 17:29:35

Hab mal eben tracker-extract wie beschrieben neu gebaut, installiert und ausprobiert. Klappt wie gewünscht :-)

Code: Alles auswählen

~$ tracker extract baz.ods 
Tracker-Message: 17:23:39.478: Set scheduler policy to SCHED_IDLE
Tracker-Message: 17:23:39.478: Setting priority nice level to 19
@prefix nie: <http://www.semanticdesktop.org/ontologies/2007/01/19/nie#> .
@prefix nfo: <http://www.semanticdesktop.org/ontologies/2007/03/22/nfo#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix nco: <http://www.semanticdesktop.org/ontologies/2007/03/22/nco#> .

<urn:contact:*snip*> nco:fullname "*snip*" ;
  a nco:Contact .

<file:///home/user/baz.ods> nco:publisher <urn:contact:*snip*> ;
  nie:plainTextContent "Foobar " ;
  nie:generator "LibreOffice/7.3.4.2$Linux_X86_64 LibreOffice_project/30$Build-2" ;
  a nfo:PaginatedTextDocument ;
  nie:contentCreated "2022-06-28T17:22:12.456678108" .

~$ tracker index -f baz.ods 
(Re)indexing file was successful
~$ tracker search Foobar
Results:
  file:///home/user/baz.ods
  Foobar 

Stevo hat geschrieben: ↑ zum Beitrag ↑
28.06.2022 17:20:55
Beim pdf merkt er, dass es kein PDF ist.
Aber glaubt tatsächlich erstmal der Dateiendung. Das ist … unglücklich.
Manchmal bekannt als Just (another) Terminal Hacker.

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von Stevo » 28.06.2022 22:35:25

Saubere Arbeit! Mal sehen ob ich mich traue ;-)

Zum Verlassen auf die Dateiendung /Extension. Man könnte bei den od*-Dokumenten auf die idee kommen, die Extension und den mimetyp gegeneinander zu prüfen - klar. Kann aber beides falsch sein und nicht zum Inhalt passen.Insofern bin ich da etwas emotionslos.

Wie die Tracker-Leute hier grundsätzlich vorgegangen sind, kann ich nicht beurteilen. Beim pdf prüft er ja dann doch auf Bestandteile eines PDF ab und findet sie hier nicht und meckert dann.

Schaun wir mal wann der Fix "ankommt". Wenn ich den Mumm hatte zu testen, melde ich mich

Beste Grüße
Stefan

JTH
Moderator
Beiträge: 3023
Registriert: 13.08.2008 17:01:41
Wohnort: Berlin

Re: Gnome Suche findet Inhalte von odt Dateien aber keine von ods Dateien

Beitrag von JTH » 08.08.2022 20:32:04

Stevo hat geschrieben: ↑ zum Beitrag ↑
28.06.2022 22:35:25
Schaun wir mal wann der Fix "ankommt".
Falls noch jemand hier über das Forum auf das Eingangsproblem stößt: Der Patch ist übernommen. Dauert aber wahrscheinlich bis zur Veröffentlichung von Bookworm, bis der in Debian verfügbar ist.
Manchmal bekannt als Just (another) Terminal Hacker.

Antworten