Data Control の検索について

適用対象: WatchGuard Data Control

WatchGuard Data Control では、PII が含まれているファイルと含まれていないファイルの内容を検索することができます。インデックスには、各ファイルの内容が標準形式で保存されます。特定の PII コンテンツまたはその他の機密コンテンツが含まれているファイルを検索するには、ターゲット コンピュータが以下の条件を満たしている必要があります。

  • Data Control ライセンスが割り当てられている。
  • コンピュータでのデータ検索を許可 オプションが有効な状態で Data Control 設定プロファイルが割り当てられている。詳細については、Data Control 設定 を参照してください。

検索の作成方法については、次を参照してください:Data Control でファイルを検索する

検索の精度を変更する方法については、次を参照してください:Data Control で詳細なインデックス作成を構成する

検索の制限

Data Control の検索には、以下の制限があります。

  • 各ユーザー アカウントの管理 UI における同時検索の最大数は 10 となります。
  • 各ユーザー アカウントに保存できる検索の最大数は 30 となります。
  • 各検索の結果の合計最大数は 10,000 件となります。Data Control では、この数以上の結果は表示されません。
  • 各コンピュータの結果の最大数は、検索を実行しているコンピュータの数で 10,000 を割った値となります。たとえば、100 台のコンピュータからなるネットワークで検索を行う場合は、表示される結果の最大数は、各コンピュータで 10,000/100 = 100 件となります。
  • ネットワークにあるコンピュータの数に関係なく、各コンピュータに表示される結果の最小数は 10 となります。
  • 同時に検索を実行できるコンピュータの最大数は 50 台となります。Data Control の検索において、検索を実行するコンピュータの合計数が 50 台を超えた場合は、進行中の検索が完了するまで、追加の検索がキューに入れられます。

検索結果の正規化

Data Control では、インデックス付きデータを均質化するために、多数のルールが適用されます。実行される検索は、正規化されたデータを対象に実行されます。正規化により、不要な文字がすべて削除されます。こうしたルールにより、ダッシュボードに表示される結果に影響が出る可能性があります。

文字列の小文字への変換

Data Control では、文字列がデータベースに保存される前に、文字列が小文字に変換されます。

特殊文字

Data Control では、以下の特殊文字が単語間の区切り文字として検出されます。

  • キャリッジリターン:\r
  • 改行:\n
  • タブ キー:\t
  • 文字:" : ; ! ? - + _ * = ( ) [ ] { } , . | % \ / ’

Data Control では、こうした文字がデータタイプの一部になっていない限り、インデックスからこうした文字が削除されます。たとえば、「WatchGuard.Data(Control」は、句読点なしで「watchguard」、「data」、「control」という 3 つの別々の単語として保存されます。

PII データの正規化

PII データの正規化は、異なるルールに従って行われます。詳細については、次を参照してください:Data Control の検索構文

データ型分離文字

銀行口座番号

クレジット カード番号

個人 ID 番号

電話番号

運転免許番号

パスポート番号

社会保障番号

分離文字は削除されます。データの種類が 1 つのセットとしてインデックスに格納されます。

IP アドレス

電子メール アドレス

分離文字は維持されます。データの種類が 1 つのセットとしてインデックスに格納されます。

氏名

郵便住所

分離文字は区切り文字として使用されます。データの種類が複数の項目としてインデックスに格納されます。

PII データの正規化の例

  • 「1.42.67.116-C」は、IDCARD「14267116C」として保存されます。
  • 「192.168.1.1」は、IP「192.168.1.1」として保存されます。
  • 「Acme Company 51st Floor」については、インデックス作成方法が テキストのみインデックスする に設定されている場合は、「acme」、「company」、「floor」として保存されます。インデックス作成方法が すべてのコンテンツをインデックスする に設定されている場合は、「acme」、「company」、「5」、「1」、「floor」として保存されます。詳細については、次を参照してください:Data Control で詳細なインデックス作成を構成する

検索に関連する正規化のベストプラクティス

検索に関連する正規化プロセスに対応した検索を実現するには、以下の推奨事項を検討してください。

  • 小文字を使用する。
  • 銀行口座番号、クレジット カード番号、個人 ID 番号、社会保障番号、パスポート番号、運転免許証番号を検索する場合は、ハイフンなどの区切り文字を使用しない。
  • IP アドレスと電子メール アドレスを検索する場合は、必要に応じて、ピリオドや @ 文字を含めてすべての文字を入力する。
  • 電話番号を検索する場合は、区切り文字をすべて削除する。国コードは、必要に応じて、+ 文字を付けずに入力する。
  • 住所を検索する場合は、番号を使用しない。

インデックスを作成するコンテンツの種類に構成されている設定および除外ファイルのリストを確認することが勧められます。こうした設定により、検索結果の数に影響が出ます。

関連トピック

Data Control でファイルを検索する

Data Control での検索を管理する

Data Control で詳細検索を作成する

Data Control の検索構文