web-dev-qa-db-ja.com

トラッカーを使用してファイル(PDF)コンテンツの検索を有効にする

私の知る限り、gnomeの検索、そしておそらくnautilusの検索は、トラッカーによって駆動されるか、少なくとも拡張されます。 18.17にトラッカーをインストールして、Ubuntu 17.10で使用したコンテンツファイル検索機能を収集しました。そのとき、私はgnome-settingsに自分のフォルダーを追加することができ、実際にスキャンされています。しかし、ファイルのコンテンツではなく、名前のようなメタデータのみを使用しているようです:

~> tracker daemon -w
Ressourcen-Aktualisierungen der Datenbank werden nun überwacht
Alle Eigenschafte »nie:plainTextContent« werden ausgelassen

Drücken Sie Strg+C zum Anhalten

2行目は、プロパティ "nie:plainTextContent"がスキップされていることを示しています。私が望むのは、これを有効にすることです。方法を見つけようとしましたが、Webで検索するときに古い情報しか見つけられず、このプロパティを有効にする方法がわかりませんでした。

問題は、インデックス作成時にnie:plainTextContentのみをスキップするように見えることです。手動抽出により、要求されたプロパティが提供されます。

~> tracker extract ~/watched_folder/file.pdf 
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix nie: <http://www.semanticdesktop.org/ontologies/2007/01/19/nie#> .
@prefix nfo: <http://www.semanticdesktop.org/ontologies/2007/03/22/nfo#> .

<file:///home/user/watched_folder/file.pdf> nfo:pageCount 51 ;
  nie:title "Lecture_File" ;
  a nfo:PaginatedTextDocument ;
  nie:plainTextContent "long text from the pdf" # this is what I want to search in!

質問

Gnome概要検索および/またはnautilus検索でファイルコンテンツ検索を有効にする方法を知っていますか? nautilus検索とgnome Shell検索([アクティビティ]メニューに入力)は両方ともトラッカーによって駆動されますか?

4
verpfeilt

Nautilusのバグのようです。この問題とその回答を参照してください。

https://gitlab.gnome.org/GNOME/nautilus/issues/624

これがnautilusコードでは発生しない理由がわかります。そのシェル検索プロバイダーは、ファイル名のみが一致する「シンプル」モードに暗黙的に頼ります。 ( https://gitlab.gnome.org/GNOME/nautilus/issues/624#note_311228

1
verpfeilt

Gnome Shell検索は、ファイルを取得するためにnautilus検索に依存しています。トラッカーがインストールされていない場合、検索はファイル名検索に制限されます。トラッカーをインストールすると、ファイルの内容を検索できます。

Ubuntu 17.10および18.04では、Trackerはインストールされません。ファイル名検索では、Ubuntu 17.10および初期のUbuntu 18.04のホームフォルダー内のサブフォルダーからファイルを取得しませんでした。現在、これはうまく機能しています。

Trackerがインストールされている場合、ファイルコンテンツの検索がどの程度うまく機能するか疑問です。原則として、うまく機能するはずです。うまく機能することをお勧めします。

0
vanadium