BigSearch

BigSearch

BigSearch ist ein Modul, das für die Durchführung von Massendatenoperationen auf sehr großen Dokumentensammlungen im Alfresco-System entwickelt wurde. Anstatt das System durch die einmalige Verarbeitung von Tausenden von Dateien zu belasten, teilt BigSearch die Daten intelligent in kleinere Pakete auf und verarbeitet sie parallel sowie sicher. Dabei wird der Lucene-Suchmechanismus genutzt, und die Operationen werden anhand eines vom Benutzer definierten JavaScript-Skripts ausgeführt. BigSearch eliminiert das Risiko einer Systemüberlastung und ermöglicht ein flexibles Dokumentenmanagement, selbst in Umgebungen mit sehr großen Datenvolumen.

Die wichtigsten Funktionen des Moduls:
  • Aufteilung großer Datenmengen in Pakete – wenn eine Lucene-Abfrage eine große Anzahl von Dokumenten zurückgibt, teilt BigSearch die Ergebnisse in kleinere Gruppen auf. Dadurch erfolgt die Verarbeitung in Etappen, ohne das System zu überlasten, was selbst bei der Arbeit mit Hunderttausenden von Dateien Stabilität gewährleistet.
  • Parallele Verarbeitung von Dokumenten in separaten Threads – jedes Dokumentenpaket wird in einem eigenen Thread verarbeitet, wodurch mehrere Operationen gleichzeitig ausgeführt werden können. Dies führt zu erheblichen Zeitersparnissen bei der Durchführung von Massendatenaufgaben.
  • Isolierte Transaktionen für jedes Paket – die Operationen auf jeder Dokumentengruppe erfolgen in einer separaten Transaktion. Im Fehlerfall wird nur dieses Paket übersprungen oder zurückgesetzt, ohne dass der übrige Prozess beeinträchtigt wird.
  • Flexible benutzerdefinierte JavaScript-Skripte – für jedes Paket wird ein vom Benutzer definiertes JavaScript-Skript in der Alfresco-Umgebung ausgeführt. Dies ermöglicht die Automatisierung beliebiger Aufgaben, wie z. B. die Änderung von Metadaten, das Verschieben von Dokumenten, das Ändern von Status oder das Löschen von Dokumenten.
  • Kompatibilität mit der Lucene-Suche – BigSearch basiert auf dem Lucene-Mechanismus, was die Erstellung von erweiterten Abfragen ermöglicht, die die Inhaltsstruktur und die Metadaten von Dokumenten mit hoher Präzision durchsuchen.
Nach oben scrollen