DE10297001B4 - Informations-Reproduktionssystem mit verbesserter Fehlererkennung und Rekonstruktion - Google Patents

Informations-Reproduktionssystem mit verbesserter Fehlererkennung und Rekonstruktion Download PDF

Info

Publication number
DE10297001B4
DE10297001B4 DE10297001.7T DE10297001T DE10297001B4 DE 10297001 B4 DE10297001 B4 DE 10297001B4 DE 10297001 T DE10297001 T DE 10297001T DE 10297001 B4 DE10297001 B4 DE 10297001B4
Authority
DE
Germany
Prior art keywords
data volume
data
database
host
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE10297001.7T
Other languages
English (en)
Other versions
DE10297001T5 (de
Inventor
Madhav Mutalik
Ajay Shekhar
Neil Schutzman
Thomas Dings
Ananthan K. Pillai
John E. Stockenberg
Michael H. Wright
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/894,422 external-priority patent/US7613806B2/en
Application filed by EMC Corp filed Critical EMC Corp
Publication of DE10297001T5 publication Critical patent/DE10297001T5/de
Application granted granted Critical
Publication of DE10297001B4 publication Critical patent/DE10297001B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Ein Informationswiederherstellungssystem (100) enthält einrichtbare Datenvolumenreproduktionen (110), die zur verbesserten Fehlererkennung und -korrektur untersucht werden können. Ein Informationswiederherstellungssystem sieht auch die Einrichtung von Teil-Datenbank-Reproduktionen, beispielsweise eines oder mehrerer ausgewählter Tabellenräume, vor. Bei dieser Anordnung kann ein Benutzer Tabellenräume für die Wiederherstellung aus einer Reproduktion einer Original-Datenbank auswählen.

Description

  • QUERBEZUG AUF ENTSPRECHENDE ANMELDUNGEN
  • Die vorliegende Anmeldung ist eine continuation-in-part-Anmeldung der am 28. Juni 2001 eingereichten US-Patentanmeldung Nr. 09/894,422, welche hier durch Bezugnahme eingeführt sei.
  • ERKLÄRUNG BEZÜGLICH BUNDESSTAATLICH GEFÖRDERTER FORSCHUNG
  • Nicht zutreffend.
  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung betrifft allgemein die Datenspeicherung und, im Einzelnen, Datenreproduktionssysteme.
  • HINTERGRUND DER ERFINDUNG
  • Die US 5889935 A offenbart ein Datenspeichersystem mit einem Fernkopierkontrollverfahren.
  • Weiter offenbart die US 6145088 A eine Vorrichtung und ein Verfahren zur Fernwiederherstellung von unzugänglichen Daten auf Computerspeichergeräten.
  • Zudem wird auf Stand der Technik verwiesen, welcher in dem Artikel des C't Magazins für Computertechnik zu finden ist: „Bögeholz, Harald, Siering, Peter. Mit dem Diskeditor auf Datensuche”, Hannover: Heise, 2000, Vol. 6, S. 116–129.
  • Wie in der Technik bekannt enthalten Rechnersysteme, welche große Mengen von Daten verarbeiten und speichern, typischerweise einen Prozessor oder mehrere Prozessoren in Verbindung mit einem anteilsmäßig benutzten Datenspeichersystem, in welchem die Daten gespeichert werden. Das Datenspeichersystem kann ein Speichergerät oder mehrere Speichergeräte, beispielsweise Plattenlaufwerke, enthalten. Um einen Datenverlust minimal zu halten, können Rechnersysteme auch ein Reservespeichersystem oder Backupspeichersystem in Verbindung mit dem primären Prozessor und dem Datenspeichersystem enthalten.
  • Bekannte Reservespeichersysteme können ein Reservespeichergerät (beispielsweise einen Bandspeicher oder irgendeinen anderen Speichermechanismus) zusammen mit einem System zum Einbringen der Daten in das Speichergerät und zur Wiedergewinnung der Daten aus dem Speichergerät enthalten. Um eine Reservehaltung durchzuführen, kopiert der Host Daten aus dem anteilsmäßig benutzten Datenspeichersystem über das Netzwerk in das Reservespeichersystem. Somit kann eine tatsächliche Datei über das Netzwerk zu dem Reservespeichergerät oder Backupspeichersystem übertragen werden.
  • Das anteilsmäßig benutzte Speichersystem entspricht dem tatsächlichen physikalischen Speicher. Für das Einschreiben der Reservedaten über das Netzwerk in das Reservespeichersystem durch den Host wandelt dieser erst die Reservedaten in Dateidaten um, d. h. der Host nimmt die Daten aus dem physikalischen Speichersystemlevel und wandelt die Daten in das Anwendungslevelformat (beispielsweise eine Datei) über einen Level eines logischen Speichervolumenmanagers, einen Dateisystemlevel und den Anwenderlevel um. Wenn das Reservespeichergerät die Datendatei empfängt, dann kann das Reservespeichersystem die Datei im Anwenderlevel aufnehmen und sie in ihr geeignetes Format für das Reservespeichersystem umwandeln. Wenn das Reservespeichersystem ein Bandspeichergerät ist, dann werden die Daten in ein Serienformat von Blöcken oder Segmenten umgewandelt.
  • Der EMC-Datenmanager (EDM) ist in der Lage, eine solche Reservehaltung und Rekonstruktion über ein Datennetz vorzunehmen, wie in zahlreichen Veröffentlichungen beschrieben ist, welche von Firma EMC, Hopkinton, Massachusetts erhältlich sind, einschließlich des EDM-Benutzerhandbuchs (Netzwerk) „Basic EDM Product Manual”. Ein Beispiel einer bekannten Reserve-Speicherarchitektur, bei welcher eine direkte Verbindung zwischen dem anteilsmäßig benutzen Speichersystem und dem Reservespeichersystem hergestellt wird, ist in dem US-Patent 6,047,294 beschrieben, das auf den Zessionar der vorliegenden Erfindung übertragen worden ist und den Titel „Logical Restore from a Physical Backup in Computer Storage System” trägt, wobei dieses Patent hier durch Bezugnahme eingeführt sei.
  • Für große Datenbanken können Datenreserve- und -rekonstruktionssysteme auf Bandbasis verwendet werden, welche in der Technik gut bekannt sind. Im allgemeinen werden Dateien, Datenbanken und dergleichen auf das Bandmedium zu bestimmten Zeiten kopiert. Typischerweise wird eine periodische Reservehaltung oder ein periodisches Backup der Daten durchgeführt, um den Verlust von Daten aufgrund von Softwarefehlern, menschlichen Fehlern und Hardwareausfällen zu verhindern. Bei Feststellung eines Fehlers in einer Online-Datenbank können beispielsweise die in Reserve gehaltenen Daten rekonstruiert werden, um eine Wiedergewinnung der Daten zu erreichen. Während die Rekonstruktion sich auf die Gewinnung der in Reserve gehaltenen Daten bezieht, bezieht sich die Datenrekonstruktion auf den gesamten Vorgang, bei welchem Anwendungen Zugriff auf die wiedergewonnenen Daten nehmen können und diese verwenden können. Transaktionen seit der Zeit der Reservehaltung können neuerlich durchgeführt werden, wobei sogenannte Wiederholungseintragungen verwendet werden.
  • Bandspeicher-Backup- und Rekonstruktionssysteme haben eine Anzahl von Nachteilen. Aufgrund der beträchtlichen Zeitmenge und des Aufwandes, der mit der Reservehaltung und Rekonstruktion von Daten auf dem Band verbunden ist, werden solche Operationen verhältnismäßig wenig häufig durchgeführt. Je länger die Zeit zwischen der Reservehaltung und der Rekonstruktion ist, desto komplizierter und zeitraubender wird der gesamte Wiedergewinnungsprozess, da beispielsweise dies dazu führt, daß es schwieriger wird, den Punkt zu bestimmen, an welchem ein Fehler aufgetreten ist. Zusätzlich führen Verbesserungen im Datenwiedergewinnungsprozess beispielsweise schnellere Bandzugriffszeiten, nur zu kleinen Fortschritten im gesamten Datenwiedergewinnungsprozess.
  • Weiter kann auf Daten auf einem Band nicht zugegriffen werden, bis sie auf einer Platte wiedereingerichtet sind. Nur dann wenn die Daten wieder so gespeichert sind, kann ein Hostrechner die Daten prüfen. Die Daten müssen für jeden Übergang zwischen dem Band und der Platte reformatiert werden, was beträchtlichen Verarbeitungsaufwand und Zeitverlust bedeutet.
  • Ein weiterer Nachteil, der mit Datenspeichersystemen auf Bandspeicherbasis verbunden ist, betrifft den Datenwiederherstellungsprozess selbst. Nachdem beispielsweise ein Fehler aufgetreten ist, beurteilt ein Operator, beispielsweise ein Datenbankadministrator, den Fehler in dem Bestreben, eine Korrekturmöglichkeit für den Fehler zu finden. Der Administrator muß sich jedoch mit den Beschränkungen befassen, die durch die Natur der Speicherung auf einem Band auferlegt sind. Für eine Datenbank, die entscheidend für große Aufgaben ist, kann es inakzeptabel teuer sein, die Datenbank abzuschalten, und eine Wiederherstellung und Wiedereinspeicherung vom Band vorzunehmen. Wenn überhaupt möglich wird der Administrator versuchen, eine Reparatur der Datenbank durchzuführen. Die Gefahren einer Zerstörung der gesamten Datenbank, welche zu zusätzlichen Fehlern führt, und der Möglichkeit, den Fehler nicht heilen zu können, sind jedoch beträchtlich.
  • Zusätzlich ist es nicht immer bekannt, zu welcher Zeit die Datenbank fehlerhaft geworden ist. In dem Falle, in welchem Daten von dem Band aus wiederhergestellt und wiedereingespeichert werden, kann die Korrektur des Fehlers ein zu wiederholender und zeitaufwendiger Prozeß sein. Der Administrator kann eine erste Gruppe von Bändern für die Wiederherstellung auswählen, wonach die Datenbank untersucht wird, um festzustellen, ob der Fehler korrigiert ist. Ist dies nicht der Fall, dann muß eine andere Gruppe von Bändern für die Wiederherstellung verwendet werden, welche typischerweise einer früheren Reservehaltungsmaßnahme entspricht. Die Datenuntersuchungsschritte werden dann durchgeführt, bis der Fehler korrigiert ist.
  • Ist der Fehler einmal korrigiert, dann kann der Fehler in die Datenbank wieder eingeführt werden, wenn spätere Reservehaltungsübertragungen aus Wiederholungseintragungen zur Datenbank hinzugefügt werden. Der Punkt an welchem der Fehler auftritt, muß identifiziert werden. Die Zeit und die Anstrengungen, die mit den zu wiederholenden Wiederherstellungen vom Band und mit der Fehleridentifizierung verbunden sind, können ganz erheblich sein.
  • Ein bekannter Versuch zur Identifizierung von Fehlern umfaßt die sogenannten Datenreinigungswerkzeuge. Diese Werkzeuge, welche periodisch laufen können, werden in dem Bestreben verwendet, Fehler so bald wie möglich zu entdecken. Während solche Werkzeuge oder Tools Fehler entdecken mögen, sind viele Produktionsdatenbanken, etwa solche, welche von Verkäufern im Internet verwendet werden, bezüglich ihrer Aufgabe kritisch und können nicht die Belastung handhaben, die für solche Werkzeuge erforderlich ist. In vielen Anwendungen sind Datenreinigungswerkzeuge und Datenreinigungstools keine praktisch wählbare Möglichkeit.
  • Außerdem gibt es Zeiten, zu welchen es erwünscht ist, nur einen Teil einer Datenbank wiederherzustellen. Bekannte Systeme ermöglichen jedoch nicht ohne weiteres eine Wiederherstellung von weniger als der gesamten Datenbank. Während eine Wiederherstellung eines Teiles einer Datenbank in Systemen mit herkömmlicher Datenreservehaltung und Datenwiederherstellung möglich sein mag, ist ein hoher Grad von Geschick erforderlich, um von Hand einen Teil einer Datenbank wiederherzustellen. Es ist daher wünschenswert, die zuvor diskutierten und andere Nachteile zu überwinden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Aufgabe der Erfindungen ist es, ein verbessertes Verfahren zum Auffinden und Korrigieren von Fehlern in einem Datenvolumen einer Produktionsdatenbank anzugeben.
  • Die vorliegende Erfindung schafft ein Datenwiederherstellungssystem mit einrichtbaren Kopieren von Datenvolumen, wobei das System beträchtlich die Fehlererkennung und die Korrektur in Vergleich zu herkömmlichen Daten-Reservehaltungssystemen verbessert. Während die Erfindung in erster Linie anhand der Wiederherstellung von Datenbanken gezeigt und beschrieben ist, versteht es sich, daß die Erfindung auf andere Systeme anwendbar ist, bei welchen es erwünscht ist, Fehler in gespeicherten Daten zu erkennen und zu beseitigen.
  • Gemäß einem Aspekt der Erfindung kopiert ein Informationswiederherstellungssystem ein Originaldatenvolumen oder mehrere Originaldatenvolumen zur Untersuchung der Unversehrtheit der kopierten Datenvolumen oder der Originaldatenvolumen. Bei Entdeckung eines Fehlers kann das System zur Korrektur des Fehlers durch Reparatur und/oder Datenwiederherstellung verwendet werden. Nach einer erfolgreichen Fehlererkennung können die Datenvolumen, welche immer noch den Fehler enthalten, dann korrigiert werden.
  • In einem weiteren Aspekt der Erfindung bewirkt ein Informationswiederherstellungssystem eine Einrichtung von Teil-Datenbank-Kopien beispielsweise einen ausgewählten Tabellenraum oder mehrere ausgewählte Tabellenräume. Bei dieser Anordnung kann ein Benutzer Tabellenräume für die Wiederherstellung aus einer Kopie einer ursprünglichen Datenbank auswählen. In einer Ausführungsform kann die teilweise Einrichtung in einer Vielfalt von Arten gestartet werden.
  • Gemäß einem anderen Aspekt der Erfindung bewirkt ein Informationswiederherstellungssystem die automatische Auswahl der Kopiespeicherung. Bei dieser Anordnung sucht das Informationswiederherstellungssystem automatisch mögliche Speicherräume, welche verwendet werden können, um ein existierendes Datenvolumen zu replizieren beispielsweise eine Datenbank, und wählt die Speicherung unter der Erfüllung vorbestimmter Anforderungen, um die Notwendigkeit für einen Datenbankadministrator zu vermeiden, von Hand den Speicher zu identifizieren. Während die Erfindung in erster Linie in Verbindung mit der Kopie von Datenbanken auf Platten, beispielsweise Oracle-Datenbanken gezeigt und beschrieben ist, versteht es sich, daß die Erfindung auf Speichersysteme allgemein anwendbar ist, bei welchen es wünschenswert ist, eine Reservehaltung von digitaler Information in verschiedenen Kopiertechnologien oder Replikationstechnologien für die nachfolgende Wiederherstellung vorzunehmen.
  • In einer Ausführungsform gewinnt ein IR Server eine Liste von möglichen Kopierspeicherplätzen, beispielsweise BCV's, Produktionsdatenvolumen beispielsweise Standardvolumen, von denen eine Reproduktion oder Kopie gewünscht worden ist. Ein Benutzer kann vorschreiben, daß bestimmte BCV's vorgeschriebene Kriterien aufweisen, beispielsweise eine BCV-Speicherung welche zuvor durch den Benutzer konfiguriert ist. Das System wählt dann mögliche BCV's für jedes Standardvolumen und beurteilt jedes Paar von Standardvolumen BCV. In einer Ausführungsform wird eine Bewertung des Paares basierend auf den Pegel der Arbeitsmittelbeanspruchung beispielsweise Plattenlaufwerkspindel, Bus, usw. für das Standardvolumen BCV-Paar bestimmt. Die Ressourcen können gewichtet werden, um den Pegel der Arbeitsweisenverschlechterung aufgrund der Beanspruchung der Ressource zu reflektieren. Eine Gruppenbewertung wird aus den Bewertungen der Paare für die Beurteilung bestimmt, ob eine akzeptable Speicherungslösung gefunden werden ist.
  • Es versteht sich, daß eine bestimmte Terminologie beispielsweise BCV, Standardvolumen und andere Ausdrücke verwendet werden, um das Verständnis der Erfindung zu erleichtern und doch sei hierdurch keine Beschränkung der Erfindung zum Ausdruck gebracht.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung wird noch vollumfänglicher aus der folgenden detaillierten Beschreibung in Verbindung mit den begleitenden Zeichnungen verständlich, in welchen:
  • 1 eine schematische Abbildung eines Informationswiederherstellungssystems gemäß der vorliegenden Erfindung zeigt;
  • 2 eine schaubildliche Darstellung eines Beispiels eines Schirmbildes für das System von 1 ist;
  • 3 eine schaubildliche Darstellung eines weiteren Beispiels eines Schirmbildes für das System von 1 zeigt;
  • 4 ein schematisches Blockdiagramm eines Datenspeichernetzwerkes ist, das Teil des Systems von 1 bilden kann;
  • 5 eine schematische Darstellung zeigt, welche weitere Details eines Datenspeichernetzwerkes erkennen läßt;
  • 6 ein Flußdiagramm ist, welches eine beispielsweise Folge von Schritten zur Aufzeichnung logischer gegenüber physikalischer Speichervolumen für das Backup oder die Reservehaltung und die Wiederherstellung in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung zeigt;
  • 7 ein Flußdiagramm einer beispielsweisen Folge von Schritten zur Aufzeichnung und Auffindung von Speichervolumeninformation in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung wiedergibt;
  • 8 ein Flußdiagramm darstellt, das eine beispielsweise Folge von Schritten zur Erzeugung einer Baumstruktur aus Speichervolumeninformation zeigt, welche für ein Informationswiederherstellungssystem gemäß der vorliegenden Erfindung gefunden wurde;
  • 9 ein Flußdiagramm wiedergibt, das eine beispielsweise Folge von Schritten zur Einrichtung und Aufteilung von Spiegeln in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung zeigt;
  • 10 ein Flußdiagramm darstellt, das eine beispielsweise Folge von Schritten für den Aufbau/die Einrichtung logischer Information in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung zeigt;
  • 11 ein Flußdiagramm ist, das eine beispielsweise Folge von Schritten für das Backup oder die Reservehaltung von Datenvolumen in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung wiedergibt;
  • 12 ein Flußdiagramm ist, das eine beispielsweise Folge von Schritten zur Wiederherstellung von Datenvolumen in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung wiedergibt;
  • 13 ein Flußdiagramm zeigt, das eine beispielsweise Folge von Schritten für den Speichervolumenabbau/die Ausräumung in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung zeigt;
  • 14 eine schaubildliche Darstellung der Erzeugung von Speichervolumen-Prüfungspunkten über der Zeit in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung ist;
  • 15 eine schaubildliche Darstellung der Erfassung und Korrektur von Fehlern in einem Datenvolumen in einem Informationswiederherstellungssystem gemäß der vorliegenden Erfindung ist;
  • 16 eine schaubildliche Darstellung einer beispielsweisen flexiblen Architektur für ein Informationswiederherstellungssystem gemäß der vorliegenden Erfindung zeigt;
  • 17 eine schematische Darstellung eines Informationswiederherstellungssystem mit Teil-Datenbank-Reproduktionsinstallation gemäß der vorliegenden Erfindung zeigt;
  • 18 eine weitere schematische Darstellung eines Informationswiederherstellungssystem mit Einrichtung einer Teil-Datenbank-Reproduktion auf einem Ziel-Einrichtungshost gemäß der vorliegenden Erfindung wiedergibt; und
  • 19 ein Flußdiagramm zeigt, daß eine beispielsweise Folge von Schritten zur Einrichtung einer teilweise reproduzierten Datenbank gemäß der vorliegenden Erfindung aufzeigt.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • Allgemein schafft das Informationswiederherstellungssystem nach der vorliegenden Erfindung für Benutzer die Möglichkeit, Reproduktionen von logischen Objekten, beispielsweise Datenbanken und Versandsystemen, herzustellen und die reproduzierten Objekte augenblicklich wiederherzustellen, d. h. so schnell wie die zugrundeliegende Speichertechnologie es erlaubt. Während die Erfindung in erster Linie in Verbindung mit einer beispielsweisen Speichertechnologie gezeigt und beschrieben ist, welche als „Symmetrix” von EMC Corporation, Hopkinton, Massachusetts, bekannt ist, versteht es sich, daß die erste Verbindung auf eine Vielfalt von Speichertechnologien und Betriebssystemen anwendbar ist. In einer besonderen Ausführungsform zielt das Informationswiederherstellungssystem auf verschiedene Datenbanken, beispielsweise Oracle- und SQL-Server-Datenbanken ab. Das System ermöglicht es Benutzern, eine Datenbank oder einen Teil davon, beispielsweise einen Tabellenraum oder mehrere Tabellenräume für die Reproduktion zu rekonfigurieren. Der konfigurierte Teil der Datenbank wird als Reproduktionsobjekt (RO) bezeichnet. Das bedeutet, das Reproduktionsobjekt (RO) beschreibt die zu reproduzierende Anwendung. Für jedes RO beschreibt eine Aktivität oder beschreiben mehrere Aktivitäten, wie die Reproduktion des Reproduktionsobjektes durchgeführt werden soll. Eine beispielsweise Information enthält, wie mit der Datenbank zu verkehren ist, beispielsweise online oder offline, vor der Einschreibung oder nach der Einschreibung, Installations- und Wiederherstellungsoptionen und Speicherauswahlkriterien. Die Aktivitäten können nach Bedarf oder für vorbestimmte Zeiten nach Fahrplan ablaufen. Installationseinzelheiten beispielsweise wo und wie, können während der Erzeugung der Aktivität definiert werden.
  • Eine Speicherung für die Aktivität kann durch das System in einer Vielfalt von Weisen ausgewählt werden. Beispielsweise kann das System nach freien oder zuvor eingerichteten Geschäftsfortsetzungs-Speichervolumen (BCV's) suchen. Gemäß dem hier gewählten Gebrauch bezeichnen Geschäftsfortsetzungs-Speichervolumen oder BCV's einen Spiegel eines Standardvolumens als Teil der Datenbank. Auch können Benutzer Attribute an BCV's definieren, um Speicherpools zu bilden und eine Speicherung entsprechend Attributen in der Aktivität zu wählen. Der Benutzer kann auch explizit BCV's zu Standardgeräten (STD's) zuordnen.
  • 1 zeigt ein Beispiel eines Informationwiederherstellungssystems 100 gemäß der vorliegenden Erfindung. Ein IR-Server 102, welcher einen dauerhaften Speicher 104 enthält, handhabt Aktivitätsanforderungen von IR-Benutzern von Tischgeräten 108. Ein Netzserver 102a bildet eine Schnittstelle zu einem Lokalbereichsnetzwerk (LAN) 106, um beispielsweise eine Verbindung mit den Benutzer-Tischgeräten 108 zu ermöglichen, welche eine Benutzerschnittstelle, beispielsweise einen Browser 108 und/oder eine Befehlsleitungsschnittstelle (CLI) 108b, und eine IR-Applikation 108c enthalten können. Der IR-Server 102 kann auch einen IR-Reproduktions-Politikmanager 102b innerhalb eines IR-Daemon 102c für die Steuerung und die Koordinierung der Reproduktionsaktivität für die Speichereinheiten 110a innerhalb eines Speicherbereichsnetzwerkes (SAN) 110 enthalten, welche für die jeweiligen Applikationshosts sichtbar sind. Der IR-Server 102 kann einen Reproduktions-Politikmanager oder eine Replikationsmaschine 102b für jede eingerichtete Reproduktionstechnologie enthalten, um Entscheidungen zu realisieren, welche die Frage betreffen, welcher Speicher für eine gegebene Reproduktion verwendet wird. In einer Ausführungsform ist die Verfahrensmaschine oder Politikmaschine 102b als eine dynamische Bibliothek vorgesehen, welche mit dem IR-Daemon verbunden ist. Statische Zustandsinformationen über existierende Produktionen und den entsprechenden Speicher sind in der IR-Datenbank 104 gespeichert, welche als eine SQL-Server-Datenbank vorgesehen sein kann.
  • Das System 100 enthält weiter Applikationshosts 112, beispielsweise Oracle-Datenbank-Server-Hosts, welche über einen Applikationsagenten 112b unter Kundensteuerung 112a stehen können, sowie ein Speicherdienstmodul 112c. Der Applikationsagent 112b in den IR-Applikationskundeneinheiten bearbeitet Benutzer-Datenbanken, welche sich in dem Speicherbereichsnetzwerk 110 befinden. Der genannte Kundensteuerungsmodul 112a kann als Daemon vorgesehen sein und handhabt Kundenoperationen und gibt diese aus. Die Applikationsagenten 112, beispielsweise Einstückeinheiten für jede durchführbare Applikation, handhaben Arbeitsanfragen. Die IR-Applikationskunden 112 können auch mit Drittverkäufern beispielsweise über Ausrufungen kommunizieren, um ein Produkt eines Dritten zu verwenden, um eine Reproduktion der Benutzerdatenbank einer Reservehaltung oder einem Backup zuzuführen. Es versteht sich, daß Hosts, welche zur Einrichtung von Reproduktionen verwendet werden, auch die Applikationshosts 112 sein können.
  • Während vorliegend drei gesonderte Hosts gezeigt sind, versteht es sich, daß sich auf einem einzelnen Host oder einer einzelnen Maschine ein Benutzer oder mehrere Benutzer, ein Applikationskunde oder mehrere Applikationskunden und ein IR-Server oder mehrere IR-Server befinden können. Es versteht sich weiterhin, daß die dargestellten Ausführungsbeispiele, Architekturen und Konfigurationen leicht vom Fachmann auf diesem Gebiete modifiziert werden können, um die Anforderungen einer bestimmten Applikation zu erfüllen, ohne daß hierdurch der Grundgedanke der Erfindung verlassen wird.
  • 2 zeigt ein beispielsweises Schirmbild 150 eines IR-Steuerpultes für ein Informationswiederherstellungssystem gemäß der vorliegenden Erfindung. Das Schirmbild 150 kann eine Hierarchie von Objekten 152 in dem IR-System enthalten, beispielsweise Benutzer, Applikations-Hosts, Applikationen, Speicher, den Fahrplan und Reproduktionsobjekte (RO's). In der beispielsweisen Darstellung ist ein Reproduktionsobjekt mit der Bezeichnung „Parts DB/TS1/TS2” 154 aufgefächert, um die Aktivitäten 156 und die Fälle 158 dieser Reproduktion aufzuzeigen. Die Aktivitäten umfassen den Eintrag 160a „Erzeuge CKP auf Jupiter”, den Eintrag 160b „Desaster CKP” und den Eintrag 160c „Regelmäßig im Plan”. Die Fälle 158 zeigen die Überprüfungspunkte oder Reproduktionen, welche für das Reproduktionsobjekt erzeugt wurden sind.
  • Im Allgemeinen werden die Hosts und die Applikationen für das System nach Einrichtung sichtbar. Wenn die Hosts und die Applikationen eingerichtet sind, werden sie in der IR-Daemon-Datenbank registriert.
  • 3 zeigt ein beispielsweises Schirmbild 200 zur Schaffung neuer Reproduktionsobjekte (RO's). Zur Erzeugung neuer Reproduktionsobjekte aktiviert der Benutzer ein Herunterladungsmenü und wählt „Datei”, „Neu” und „Reproduktionsobjekt”, um das neue Schirmbild 200 für die Reproduktionsobjekte zu erreichen. Der Benutzer spezifiziert dann den Applikationshost im Applikationshost-Feld 202a und die Applikation in dem Applikationsfeld 202b zur Konfiguration auf der Basis von Information von der IR-Daemon-Datenbank von eingerichteten Applikationshosts. Für einen gegebenen Host und eine gegebene Applikation kann jeder Fall der Applikation in dem Fall-Feld 202c wiedergegeben werden. Der Benutzer wählt einen Fall und ordnet dem neuen Reproduktionsobjekt einen Namen in dem Namensfeld 202d zu.
  • Zusätzliche Schirmbilder (nicht dargestellt) können den Benutzer nach zusätzlichen Informationen befragen. Beispielsweise kann ein weiteres Schirmbild den Benutzer zur Abgabe von applikationsspezifischer Informationen über das Reproduktionsobjekt auffordern, beispielsweise, wie Zugriff auf die Datenbank genommen werden soll (Benutzername und Paßwort), sowie welche Teile der Datenbank in Reservehaltung genommen werden sollen, beispielsweise die gesamte Datenbank, Tabellenräume für eine Oracle-Datenbank, u. s. w. Ein weiteres Schirmbild ermöglicht es dem Benutzer, Aktivitäten für das Reproduktionsobjekt zu schaffen. Es gibt viele Aktivitäten, welche individuell oder nach Plan für bestimmte Male laufen können. Genauer gesagt, eine Aktivität kann Reproduktionen nach regelmäßigem Fahrplan schaffen, kann eine entscheidungsstützende Datenbank schaffen und kann eine Desaster-Wiederherstellung tragen.
  • In einer Ausführungsform hat eine Reproduktion oder ein Prüfungspunkt eine Auslaufzeit, d. h., eine Zeit, über welche die Reproduktion gültig bleibt. Der Benutzer kann angeben, ob davon ausgegangen wird, daß der Prüfungspunkt (reproduzierte Datenbank) eingerichtet wird. Diese Information kann benötigt werden, wenn eine Reproduktionstechnologie (RT) gewählt wird, da nicht sämtliche Reproduktionstechnologien einrichtbare Kopien des Überprüfungspunktes ermöglichen. Wenn er die Speicherungsauswahl trifft, kann der Benutzer eine Reproduktionstechnologie wählen oder kann zulassen, daß das System die Reproduktionstechnologie wählt, wie oben erwähnt wurde.
  • Zusätzlich kann für jede Aktivität der Benutzer Attribute vorsehen, welche für die Einrichtung, die Speicherung und die Applikation beschreibend sind. Einrichtungsattribute definieren, was mit dem Objekt geschehen soll, wenn es eingerichtet ist, beispielsweise das Wiederherstellen der Datenbank, das Laufenlassen eines Prüfprogrammes und die Durchführung einer Reserveaufnahme auf Band. Speicherattribute legen fest, welcher Speicher verwendet werden soll, um die Reproduktion herzustellen. Applikationsattribute legen fest, wann die Reproduktion gemacht wird und welche applikationsspezifischen Dinge durchgeführt werden müssen, beispielsweise das Versetzen der Datenbank in den Online-Reservenahmemodus und die Verwendung einer Benutzerschrift zum Abschalten der Datenbank.
  • Das Auswählen der Einrichtungsoptionen für das Reproduktionsobjekt gestattet es dem Benutzer, Dinge festzulegen, welche durchgeführt werden, nachdem eine Reproduktion hergestellt wurden ist. Dieselbe Gruppe von Optionen kann dem Benutzer dargestellt werden, wenn der Benutzer von Hand die Einrichtung einer Reproduktion auswählt. Eine Option, welche der Benutzer hat, besteht darin, ob die Reproduktion eingerichtet und wiederhergestellt wird und wo sie sichtbar gemacht wird. Das Laufenlassen einer Aktivität kann die Einrichtung der Reproduktion umfassen, welche vollständig oder teilweise eingerichtet wird.
  • Nach dem Wählen, wie die Applikation eingerichtet werden soll, kann der Benutzer die Wahl treffen, was mit der Applikation geschehen soll, beispielsweise durch Wählen, welches Programm laufen soll, durch Laufenlassen einer Reservenahme und Einrichten der Applikation nach Vollendung. Vielfache Programme oder Reservenahmen können für die Durchführung gewählt werden. Ein Ausbauen umfaßt das Herunterfahren der Applikation und die Entfernung jeder Speicherbezugnahmen, welche geschaffen wurden, um die Reproduktion in dem Ziel-Betriebssystem sichtbar zu machen.
  • Die Speicherung kann dem IR-System ausdrücklich bekannt gemacht werden, entweder durch Zuordnung von Attributen zur Speicherung oder durch ausdrückliches Zuordnen von Standards zu der Reproduktionsspeicherung. In einer besonderen Ausführungsform wird in dem Schirmbild zum Definieren von Attributen der Speicherung dem Benutzer eine Liste von BCV's geboten, welche bei dem Datenspeichergerät, beispielsweise Symmetrix, angefügt an die Kundenmaschinen, zu finden ist. Der Benutzer kann dann ein BCV oder mehrere BCV's auswählen und ihnen Attribute zuordnen.
  • 4 zeigt weitere Einzelheiten eines Informationswiederherstellungssystems 300 mit einem Datenspeichersystem 302 gemäß der vorliegenden Erfindung. In einer Ausführungsform kann das Datenspeichersystem 302 (,welches innerhalb des Speicherbereichsnetzwerkes 110 von 1 gelegen sein kann,) auf einem Symmetrix Integrated CacheDisk Array System basieren, das von Firma EMC Corporation Hopkinton, Massachusetts, erhältlich ist. Ein solches Datenspeichersystem und seine Verwirklichung ist voll umfänglich in dem U.S.-Patent 6,101,497 , erteilt am 8. August 2000, und auch in dem U.S.-Patent 5,206,939 , erteilt am 27. April 1993, beschrieben, welche beide auf Firma EMC, nämlich den Zisionar der vorliegenden Erfindung, übertragen sind und welche hier durch Bezugnahme einbezogen seien.
  • Allgemein gesagt wird ein örtliches Volumen in einem Arbeitsfortsetzungsvolumen (BCV) reproduziert. Ein örtliches System, welches eine Spiegelung verwendet und Zugriff zu den Produktionsvolumina während der Durchführung des Backup oder der Reserveaufnahme gestattet, ist ebenfalls in dem U.S.-Patent 6,101,497 beschrieben, das hier durch Bezugnahme einbezogen wurde. Das Datenspeichersystem 302 enthält einen Systemspeicher 304 und Sätze oder Mehrzahlen von Mehrfach-Datenspeichergeräten oder Datenspeichern 306a, 306b. In einer beispielsweisen Ausführungsform enthält der Systemspeicher 304 einen Puffer oder einen Cache-Speicher. Die Speichergeräte 306 können Plattenspeichergeräte oder optische Speichergeräte und dergleichen sein. In einer beispielsweisen Ausführungsform sind jedoch die Speichergeräte Plattenspeichergeräte. Das Speichergerät 306 repräsentiert eine Gruppe von Speichergeräten in irgendeiner aus einer Vielfalt bekannter Konfigurationen.
  • Host-Adapter (HA) 308a, 308b bilden die Verbindung zwischen den Hostsystem 310a, 310b und dem Systemspeicher 304, und Plattenadapter (DA) 312a, 312b bilden die Pfade zwischen dem Systemspeicher 304 und den Speichergerätegruppen 306a, 306b. Ein Bus 314 verbindet den Systemspeicher 304, die Host-Adapter 308 und die Plattenadapter 312 miteinander. Jeder Systemspeicher wird durch verschiedene Elemente innerhalb der jeweiligen Systeme benutzt, um Informationen zu übertragen und eine Zusammenarbeit zwischen den jeweiligen Host-Adaptern und Plattenadaptern zu bewirken.
  • Ein fakultatives Backup-Speichersystem oder Reservehaltungssystem 350 kann mit dem Datenspeichersystem 302 verbunden werden. Das Backup-Speichersystem kann als ein EMC-Datenmanager '(EDM) vorgesehen sein, der mit dem Datenspeichersystem verbunden ist, wie in dem Benutzerhandbuch „Symmetrix Connect Userguide, P/N 200-113-591, Rev. C, December 1997”, erhältlich von Firma EMC Corporation, beschrieben ist. Die direkte Verbindung zwischen dem anteilsmäßig benutzten Speichersystem und dem Backup-Speichersystem kann als ein Hochgeschwindigkeits-Datenkanal 352 ausgebildet sein, beispielsweise als SCSI-Kabel oder als ein Faserkanalkabel oder mehrere Faserkanalkabel. In diesem System kann dem Benutzer ermöglicht werden, Daten über das Netzwerk oder die direkte Verbindung in Reserve zu nehmen.
  • Das Backup-System 350 enthält einen Backup-/Wiederherstellungsserver 354, eine Logik 356 als Teil des Servers und eine Speicherband-Bibliothekseinheit 358, welche ein bandförmiges Medium (nicht dargestellt) und einen Roboter-Aufsuchmechanismus (ebenfalls nicht gezeigt) enthalten kann, wie dies bei dem bevorzugten EDM-System vorgesehen ist.
  • Im Allgemeinen arbeitet das Datenspeichersystem 302 in Abhängigkeit von Befehlen von den Hostsystemen 310 über die Hostadapter 308. Die Hostadapter 308 übertragen Befehle an einen Befehlspuffer, der Teil des Systemsspeichers 304 ist. Der Befehlspuffer speichert Datenstrukturen und beschreibt Anforderungen, welche die Hostadapter erzeugen. Die Plattenadapter oder Diskadapter 312 reagieren durch Ausführung einer entsprechenden Operation unter Verwendung der Information in einem Befehlspuffer. Der ausgewählte Plattenadapter initiiert dann eine Datenoperation. Leseoperationen übertragen Daten von den Speichergeräten 306a, 306b an den Systemspeicher 304 über einen entsprechenden Plattenadapter 312a 312b und einen darauffolgenden Datentransfer von dem Systemspeicher 304 zu dem entsprechenden Hostadapter 308a, 308b, wenn das Hostsystem 310 den Datenschreibvorgang initiiert.
  • Es versteht sich, daß die Rechnerhostsysteme 310 irgendwelche herkömmlichen Rechnersysteme sein können, wobei jedes ein Betriebssystem hat, beispielsweise Systeme, welche von Sun Microsystems erhältlich sind und das Solaris-Betriebsystem (eine Version von Unix) verwenden, ein HP-System, welches mit HP-UX läuft (ein Hewlett-Packard-Kunde, der mit einer Hewlett-Packard-Version des Unix-Betriebsystems läuft), oder ein IBM-System, das mit dem AIX-Betriebssystem läuft (eine IBM-Version von Unix), oder irgendein anderes System mit einem zugehörigen Betriebssystem, beispielsweise dem WINDOWS NT-Betriebssystem. Das Speichersystem kann irgendein herkömmliches Speichersystem sein, einschließlich eines Symmetrix-Speichersystems, wie oben beschrieben wurde.
  • Es sei nun eine kurze Beschreibung von Konzepten gegeben, welche für das Verständnis der vorliegenden Erfindung hilfreich sind und auf diesem Gebiete der Technik bekannt sind. Eine körperliche Platte wird in ein „körperliches Volumen” für den Gebrauch durch Management Software formatiert, beispielsweise die Software Logical Volume Manager (LVM), welche von Firma EMC erhältlich ist. Jedes körperliche Volumen wird in einzelne Blöcke aufgespalten, welche als körperliche Abschnitte oder als körperliche Teilbereiche zu bezeichnen sind. Körperliche Volumen werden zu einer „Volumengruppe” kombiniert. Eine Volumengruppe ist somit eine Sammlung von Platten, welche als ein großer Speicherbereich behandelt werden. Ein „logisches Volumen” besteht aus einer bestimmten Zahl von körperlichen Abschnitten bzw. Teilbereichen, welche aus einer einzigen Volumengruppe stammen. Ein „Dateisystem” bezieht sich auf eine Struktur oder Sammlung von Dateien.
  • Nachfolgend wird kurz eine weitere zweckmäßige Terminologie beschrieben, welche mehr ins Einzelne gehend durch Bezugnahme auf das hier einbezogene 497 -Patent verständlich wird. Wenn ein Spiegel eingerichtet wird, erzeugt das Datenspeichersystem 119 ein Spiegelbild (eine Kopie oder Reproduktion) eines Quellenvolumens oder Standardvolumens. Wird das bevorzugte Symmetrix-Speichersystem verwendet, dann wird ein solcher Spiegel als ein Arbeitsfortsetzungsvolumen (BCV) bezeichnet, allgemein auch als eine gespiegelte Platte benannt, und ist in diesem Zusammenhang als ein BCV-Gerät zu bezeichnen. Wenn sich Daten in dem Standardvolumen ändern, dann werden dieselben Änderungen unmittelbar auch auf der gespiegelten Platte vorgenommen.
  • Wenn ein Spiegel „abgespalten” wird, dann isoliert das Symmetrix-Datenspeichersystem die gespiegelte Version der Platte und es werden keine weiteren Änderungen an dem gespiegelten Volumen vorgenommen. Nach Vervollständigung einer Abspaltung kann die primäre Platte weiterhin Änderungen erfahren, doch der Spiegel behält die Daten des Zeitpunktes, welche zu der Zeit der Abspaltung existierten. Spiegel können in jeder Richtung „synchronisiert” werden (d. h. von dem BCV zum Standard oder umgekehrt). Beispielsweise können Änderungen am Standardvolumen, welche aufgetreten sind, nachdem eine Abspaltung zu dem Spiegel erfolgte, an dem BCV-Volumen oder der gespiegelten Platte vorgenommen werden. Dies bringt die gespiegelte Platte in Übereinstimmung mit dem Standardvolumen. Bei einer Synchronisation in der anderen Richtung kann die primäre Platte zu dem Spiegel passend gemacht werden. Dies ist oft der letzte Schritt während einer Wiederherstellung.
  • Der Betrieb eines BCV-Gerätes und seines entsprechenden BCV-Volumens oder seiner entsprechenden BCV-Volumina wird leichter anhand von Datensätzen verständlich, welche in logischem Volumen gespeichert sind und dies erweist sich hilfreich für das Verständnis der vorliegenden Erfindung. Irgendein gegebenes logisches Volumen kann in einem Teil oder in der Gesamtheit eines körperlichen Plattenlaufwerkes oder zwei oder mehr Plattenlaufwerken gespeichert werden.
  • Es sei auf 5 Bezug genommen. Bei dieser besonderen Ausführungsform werden Operationen in einer Reihe von körperlichen Platten in Größen logischer Volumina gesteuert. Die Segmentierung oder Übersetzung von körperlichen Platten in logische Volumen ist in der Technik bestens bekannt. Ein Plattenadapter (nicht dargestellt) bildet die Schnittstelle von den logischen Volumen 360 zu dem Bus des Datenspeichersystems. Jedes dieser Volumen 360 ist als ein Arbeitsfortsetzungsvolumen (Business Continuation Volume) definiert und einem BCV-Gerät zugeordnet. Jedes BCV-Gerät enthält eine Standard-Plattensteuereinrichtung und zugehörige Plattenspeichergeräte, welche so konfiguriert sind, daß sie unabhängig Applikationen und Prozesse unterstützen. Die Verwendung dieser BCV-Geräte ermöglicht es einem Host, beispielsweise dem Host 310a, der von jetzt an als das „Quellen”-Hostrechnersystem bezeichnet wird, augenblicklich Kopien der Daten in den Standardvolumen 362 zu benutzen. In einem konventionellen Betrieb ist typischerweise mindestens ein BCV-Volumen jedem der Hostgeräte zugeordnet, welche einen Datensatz gleichzeitig bearbeiten. Wie jedoch weiter unten erklärt wird, können die BCV-Volumen, die für die Verwendung durch einen Host eingerichtet sind, durch einen anderen Host, beispielsweise den Host 310b verwendet werden, der von jetzt an als das „Ziel”-Hostrechnersystem bezeichnet wird.
  • Der Quellen-Host 310a kann eine Online-Transaktions-Verarbeitung (beispielsweise Datenbank-Transaktions-Verarbeitung) oder eine andere Verarbeitung fortsetzen, ohne daß dies einen Einfluß oder eine Belastung für die Standardvolumen 362 hat, während ihre jeweiligen Spiegelbilder in den BCV's 360 dazu verwendet werden, eine Datenreservehaltung oder ein Datenbackup in Zusammenwirkung mit dem Backup-System 302 einzurichten. Die BCV's können jedoch für die Verwendung auf einem anderen Host im Wesentlichen automatisch unter Steuerung durch ein Rechnerprogramm eingerichtet werden, ohne daß der Eingriff eines Operators über den ganzen Weg hin erforderlich ist.
  • Die Richtung des Datenflusses für die Reserveeinrichtung oder das Backup geht von dem Datenspeichersystem 302 zu dem Backup-System 350, wie durch den Pfeil 364 angedeutet ist. Die Richtung des Datenflusses zur Wiederherstellung geht zu dem Datenspeichersystem in der entgegengesetzten Richtung, doch können die BCV's 360 an einem anderen Host eingerichtet werden, welcher von demjenigen der ursprünglichen Einrichtung gemäß dem Verfahren nach der vorliegenden Erfindung verschieden ist.
  • Das fakultative Backup-System 350, beispielsweise das EDM-System, bietet verschiedene Optionen zur Steuerung des Spiegelungsverhaltens vor und nach einem Backup oder einer Wiederherstellung. Spiegelungsverfahren sind für den Fachmann auf diesem Gebiet bestens bekannt. Beispiele von Optionen mit Spiegelung vor dem Backup umfassen das Herunterfahren der Spiegel, das Feststellen, daß die Spiegel heruntergefahren sind, das Herunterfahren der Spiegel bei Bedarf und das Herunterfahren der Spiegel nach der Installation; und die Optionen der Spiegel nach dem Backup umfassen das Aktivieren oder Hochfahren der Spiegel, das Belassen der Spiegel im deaktivierten Zustand und das Belassen der Spiegel, wie sie vorgefunden werden.
  • Das System erzeugt eine Kopie oder mehrere gespiegelte Kopien von Daten (BCV's), welche Kopien von einem Volumen oder mehreren Volumen von Daten (Standardvolumen) sind. Die BCV's werden in herkömmlicher Weise eingerichtet, wie dies in dem hier angezogenen 497 -Patent beschrieben ist. Die BCV's werden von dem jeweiligen Volumen oder den jeweiligen Volumen von Daten in herkömmlicher Weise getrennt oder abgespalten, wie dies ebenfalls in dem angezogenen 497 -Patent angegeben ist.
  • Das System sucht die logische Information, die zu den Standardvolumen in Beziehung steht, welche Teil der Volumengruppe auf dem Quellen-Rechnersystem 310a sind. Eine Aufzeichnung der logischen Informationen auf körperlichen Geräten im Quellen-Rechnersystem wird erzeugt. In einer Ausführungsform kann die Aufzeichnung als eine XML-Nachricht vorgesehen werden. Alternativ nimmt die Aufzeichnung die Gestalt einer Einheitsdatei an, die in eine Baumstruktur umgewandelt werden kann, um eine rasche Prüfung der logischen Information zu ermöglichen. Diese Aufzeichnung dient zum Aufbau einer im wesentlichen identischen logischen Konfiguration auf dem Ziel-Rechnersystem 310B; vorzugsweise nach Überprüfung der logischen Information durch Verwendung einer Baumstrukturkonfiguration der logischen Information.
  • Die logische Konfiguration dient zur Errichtung eines Duplikates der BCV's auf dem Ziel-Rechnersystem (als installierte Ziel-BCV's bezeichnet). Die neuerlich eingerichteten Ziel-BCV's werden dann Teil einer zweiten Volumengruppe auf dem Ziel-Rechnersystem 310b.
  • Vor der Datenübertragung führt das Backup-System eine Reihe von Funktionen durch. Eine Auffindungs-/Aufzeichnungsfunktion bewirkt eine Nachsuchung und Aufzeichnung von logischen Gegenständen zu körperlichen Geräten auf dem Quellen-Host 310a und enthält Informationen, wie körperliche Volumen und logische Volumen, Volumengruppen und Dateisysteminformationen. Eine Einrichtungs-/Abspaltungsfunktion errichtet BCV's oder spaltet diese von Standardvolumen ab, je nach den Vor- und Nachspiegelungsverfahren, welche auf dem Quellen-Host 310a wirksam sind.
  • Eine Aufbau-/Einbaufunktion exportiert die BCV's, welche auf dem Quellen-Host 310a eingerichtet sind, zu dem Ziel-Host 310b. Sie erzeugt Volumengruppen, logische Volumen und Dateisystemgegenstände auf dem Ziel-Hostrechnersystem.
  • Eine fakultative Backup-/Wiederherstellungs-Funktion führt ein Backup der Ziel-Host-BCV-Daten durch, welche exportiert oder von dem Quellen-Host überführt wurden sind. Die Abbau-/Löschfunktion entfernt sämtliche Volumengruppen, logische Volumen und Dateisystemgegenstände aus dem Ziel-Host.
  • 6 zeigt einen Überblick über den Gesamt-Reproduktions-Einrichtungsprozeß. Im Schritt 400 nimmt das System eine Aufzeichnung von logischen Gegenständen in körperliche Geräte auf dem Quellen-Host vor. Im Schritt 402 nimmt die Logik eine Einrichtung und nachfolgende Abspaltung von Standardvolumen in BCV's gemäß dem Spiegelungsverfahren vor, welches auf dem Quellen-Host wirksam ist (, was durch einen Aufruf einer anderen Funktion an Datenspeichersystemen erreicht werden kann). Im Schritt 404 nimmt das System einen Aufbau und einen Einbau an dem Ziel-Host vor, so daß die BCV's exportiert oder zu dem Ziel-Host übertragen werden. Der Schritt 408 ist ein Aufräumschritt, bei welchem sämtliche Volumengruppen, logische Volumen und Dateisystemgegenstände aus dem Zielserver entfernt werden.
  • 7 ist ein Überblick der Schritte des Aufzeichnungs- und Nachsuchungsprozesses. In dem Schritt 500 beginnt an dem Quellen-Host der Nachsuchungs-/Aufzeichnungsprozeß. An dem Quellen-Host wird im Schritt 502 das Dateisystem gesucht und im Schritt 504 wird das logische Volumen gesucht. Die Volumengruppeninformation wird an dem Quellen-Host im Schritt 506 gesucht. Im Schritt 508 kann die Aufzeichnung als eine Einheitsdatei oder eine andere relativ wirkungsvolle Datenstruktur für den Zusammentrag und die Verwendung der Information erzeugt werden.
  • Es sei nun auf 8 Bezug genommen. Bei einer Ausführungsform wird im Schritt 600 die aufgefundene logische Volumeninformation, welche einer Einheitsdatei entsprechen kann, zur Erzeugung einer Baumstruktur verwendet. Diese Struktur kann durch einen UNIX-Funktionsaufruf von Informationen in den Aufzeichnungsdateien aufgebaut werden, wie oben beschrieben wurde. Sie kann sowohl an dem Ziel-Hostrechnersystem als auch dem Quellen-Hostrechnersystem aufgebaut werden. Die Struktur wird als Baum bezeichnet, da die Volumengruppeninformation als die Wurzel des Baumes eingesetzt wird und die Zweige die Geräteinformation innerhalb der Gruppe und die logischen Volumen innerhalb der Gruppe repräsentieren. Die Baumstruktur dient in dem Schritt 602 zur Prüfung der Genauigkeit der Aufzeichnungsdatei, bevor diese zu dem Ziel-Host gesandt wird. Der Baum wird in eine Aufzeichnung vorzugsweise als Einheitsdatei in dem Schritt 604 umgeformt. Diese Einheitsdateiaufzeichnung wird dann in dem Schritt 606 zu dem Ziel-Host zurückgesandt.
  • Alternativ geschieht die Nachsuchung in einer Art ähnlich derjenigen, wie sie durch den EMC-Datenmanager (EDM) durchgeführt wird, der dem Fachmann auf diesem Gebiet gut bekannt ist. In einer Ausführungsform wird die Aufzeichnung als eine XML-Nachricht versandt.
  • Es sei auf 9 Bezug genommen. Der Vorgang der Einrichtung und Abspaltung bei einem Backup-System startet mit dem Schritt 700. Eine Spiegelungspolitik, wenn eine vorhanden ist, wird im Schritt 702 geprüft. Im Schritt 704 wird eine Anfrage vorgenommen, um festzustellen, ob BCV's gemäß der Spiegelungspolitik eingerichtet worden sind. Lautet die Antwort „nein”, dann werden in dem Schritt 706 BCV's eingerichtet. Die BCV's werden von dem Quellen-Host in dem Schritt 708 abgespalten. Die BCV's werden in dem Schritt 710 für den Host nicht bereitstehend gemacht.
  • Nun sei 10 betrachtet. Der Prozeß des Beginnens des Aufbauens/Einbauens von logischer Information derart, daß die BCV's an dem Ziel-Host eingebaut werden können, setzt im Schritt 800 ein. Die Volumengruppen werden im Schritt 802 auf dem Ziel-Host erzeugt. Logische Volumen werden auf dem Ziel-Host im Schritt 804 überprüft. Das Dateisystem wird geprüft und auf dem Ziel-Host in Lauf gesetzt, was im Schritt 806 geschieht. Der Gegenstandeinbau kann nun in dem Schritt 808 mit der logischen Information vervollständigt werden, die sich auf die BCV's auf dem Ziel-Host bezieht.
  • Wie in 11 gezeigt ist, können die neuerlich eingebauten Ziel-BCV's nun fakultativ auf Band in Reservehaltung genommen werden, was im Schritt 900 gezeigt ist. Die Applikation wird dann in dem Schritt 902 auf dem Ziel-Host abgeschaltet. Folgend auf das Backup der Ziel-BCV's finden im Schritt 904 Aufräumschritte und Benachrichtigungsschritte statt.
  • Wenn die Softwareapplikation auf dem Ziel-Host und dem Quellen-Host eine Datenbank ist, dann kann die Information, die sich auf die Daten bezieht, auch einem Backup unterzogen werden, mit dem Effekt, daß im Wesentlichen die gesamte Datenbank in Reservehaltung genommen oder einem Backup unterzogen wird. Wichtige Information von der Datenbank umfaßt jedwede Transaktionsdaten, welche durch die Datenbankoperationen dargestellt werden, sowie zugehörige Steuerdateien, Tabellenräume und Archive/Wiederholungseintragungen.
  • Bezüglich der Datenbanken seien nun weitere Terminologie diskutiert. Während die Terminologie für eine Oracle-Datenbank verwendet wird, erkennt der Fachmann, daß andere Datenbanken verwendet werden können, ohne daß von dem Gedanken der Erfindung abgewichen wird.
  • Steuerdateien enthalten Informationen über die Oracle-Datenbank einschließlich Informationen, welche die Stelle beschreiben, an dem sich die Datendateien und Eintragungsdateien befinden. Datendateien können Dateien im Dateisystem des Betriebsystems sein. Ein Tabellenraum ist die unterste logische Schicht einer Oracle-Datenspeicherstruktur. Der Tabellenraum enthält eine Datendatei oder mehrere Datendateien. Der Tabellenraum liefert die feinste Unterteilung für die Anordnung von Daten über Datendateien hin.
  • In der Datenbank befinden sich Archivdateien, welche als Wiederholungseintragungsdateien oder einfach als Wiederholungseintragungen bekannt sind. Hier ist es, wo sämtliche Informationen, welche wiederherzustellen sind. aufbewahrt werden. Ohne die Wiederholungseintragungsdatei würde ein Systemausfall die Daten unwiederherstellbar machen. Wenn eine Eintragungsschaltung auftritt, dann werden die Eintragungsaufzeichnungen in der gefüllten Wiederholungseintragungsdatei zu einer Archiv-Eintragungsdatei hin kopiert, wenn eine Archivierung möglich ist.
  • Es sei nun 12 betrachtet. Hier beginnt, wie gezeigt ist, der Prozeß für die Wiederherstellung von Quellen-Standardvolumen im Schritt 1000 für das fakultative Backup-System. Im Schritt 1002 stellt das System eine Anfrage, um festzustellen, ob die Wiederherstellung von den BCV's auf dem Ziel-Host oder von irgendwo anders her geschehen soll. Gemäß der Antwort werden die Standardvolumen von den auf dem Ziel-Host eingerichteten BCV's oder dem Band beispielsweise in den Schritten 1004 bzw. 1006 synchronisiert. Mit dem Schritt 1008 beginnen die Benachrichtigungs- und Aufräumschritte, welche allgemein in 11 angegeben sind.
  • Wie in 13 gezeigt beginnt im Schritt 1100 der Aufräum-/Abbauprozeß. Die BCV's werden im Schritt 1102 aus dem Ziel-Host ausgebaut. Dies kann beispielsweise mit einem UNIX-Abbaubefehl erreicht werden. Die Gegenstände, die sich auf eine Volumengruppe, logische Volumen und Dateisysteme beziehen, werden aus dem Ziel-Host in den Schritten 1104 und 1106 entfernt. Die Aufräumung oder die Löschung wird im Schritt 1108 vervollständigt. Die BCV's werden im Quellen-Host wieder errichtet (d. h., werden für den Host bereitstehend gemacht), was im Schritt 1110 geschieht.
  • 14 zeigt ein Beispiel einer Prüfliste oder einen Reproduktionsfahrplan für ein Informationswiederherstellungssystem gemäß der vorliegenden Erfindung. Um etwa 8:00, wird ein Standardvolumen STD, welche beispielsweise eine Oracle-Datenbank enthalten kann, auf einer entsprechenden BCV, CHKP A, wie oben im Einzelnen beschrieben, reproduziert. Um 12:00 tritt der nächste fahrplanmäßige Prüfungszeitpunkt auf, zu welchem das Standardvolumen auf einer weiteren BCV, nämlich CHKP B, reproduziert wird. Um etwa 1:00 wird ein Fehler entdeckt, etwa durch ein Datenreinigungswerkzeug, so daß um etwa 2:00, nach einer gewissen Beurteilungsperiode, das Standardvolumen auf eine Bedarfs-BCV, CHKP OD reproduziert wird. Der 4:00-Prüfungszeitpunkt zur nächsten BCV, CHKP C kann fahrplanmäßig auftreten, vorausgesetzt, der Fehler wird korrigiert und das Standardvolumen STD ist aktuell. Weitere Bedarfsprüfungspunkte können nach Wunsch, wie oben beschrieben, vorgesehen werden.
  • 15 zeigt einen beispielsweisen Prozeß einer Wiederherstellung von einem Datenfehler, beispielsweise einem Transaktionsfehler in einer Datenbank gemäß der vorliegenden Erfindung. Ein Datenfehler tritt zu einer Zeit Te auf, wonach das System für eine Zeit TLE weiterläuft, während der Fehler verborgen ist, d. h., für die Systembetreiber, beispielsweise den Datenbankadministrator, unbekannt ist. Wie dem Fachmann auf diesem Gebiet wohl bekannt ist, können die Fehler eine Vielfalt von Ursachen haben, einschließlich Softwarefehler, Hardwarefehler und/oder Ausfälle, sowie menschliches Versagen.
  • In einer Ausführungsform befindet sich eine Datenvolumenreproduktion, beispielsweise eine Kopie der Datenbank, auf einer Platte als BCV, welches auf einem entfernten Host installiert ist und mit sogenannten Datenreinigungswerkzeugen überprüft wird. Datenreinigungswerkzeuge zur Untersuchung der Datenunversehrtheit sind dem Fachmann wohl bekannt. Während beispielsweise verständlich ist, daß eine Vielfalt von Datenreinigungswerkzeugen verwendet werden kann, um die Unversehrtheit der Reproduktionen zu beurteilen, kann ein geeignetes Datenreinigungswerkzeug aus der Patrol-Produktfamilie von Firma BMC Software of Redwood Shores, Kalifornien, bezogen werden. Da die Daten gemäß der vorliegenden Erfindung nun auf Platte gespeichert sind, kann die Datenreinigung wesentlich die Zeit des Verborgenseins des Fehlers reduzieren, d. h., die Zeit, während welcher Fehler unentdeckt bleiben.
  • Im Gegensatz hierzu wird bei vielen konventionellen Systemen der Fehler nicht entdeckt, bis eine Person, beispielsweise ein Kunde, den Datenbankoperator beispielsweise bezüglich einer Unregelmäßigkeit im Kundenkonto anspricht. Wie dem Fachmann auf diesem Gebiet bekannt, können Daten, die auf Band gespeichert sind, nicht ohne Datenwiedereinrichtung und Wiederherstellung überprüft werden.
  • Nach der Bestätigung, daß ein Fehler aufgetreten ist, verstreicht eine Zeit TEE, in welcher der Fehler beurteilt wird, um mögliche Korrekturmaßnahmen festzulegen. Beispielsweise kann eine Bedienungsperson oder ein Operator die Art des Fehlers beurteilen, kann beurteilen, wie der Fehler aufgetreten ist, wie verbreitet der Fehler ist, was die Wirkung des Fehlers ist, wann der Fehler aufgetreten ist und wie der Fehler korrigiert werden kann. Die Grad der Erfahrung des Operators, beispielsweise des Datenbankadministrators bestimmt in starker Maße die Zeit, die für die Beurteilung des Fehlers benötigt wird.
  • Während der Fehlerbeurteilung kann das System eine Bedarfskopie der Datenbank zur Einrichtung auf einem anderen Host erzeugen. Dies ermöglicht die Durchführung mehrfacher Beurteilungen parallel durch ein Beurteilungsteam oder mehrere Beurteilungsteams. Zusätzlich können destruktive Untersuchungen auf anderen Hosts durchgeführt werden, da die Produktionsdatenbank für weitere Reproduktionen zur Verfügung steht.
  • Nach Beurteilung des Fehlers entscheidet ein Operator im Allgemeinen, den Fehler während einer TCE zu korrigieren. Der Operator kann Backup-Daten (vom Prüfungspunkt) wiedereinrichten oder kann versuchen, die Produktionsdatenbank zu reparieren. Durch Erzeugung einer weiteren Reproduktion vor dem Versuch der Reparatur kann der Operator einen freien Versuch zur Reparatur der lebenden Datenbank unternehmen. Das bedeutet, der Operator kann Reparaturversuche mit risikoreichem „Schuß ins Dunkle” unternehmen, da mehrfache Prüfungspunkt-Backupdaten existieren. In dem Fall, in welchem der Lösungsversuch des Operators nicht die Reparatur des Fehlers erreichen kann oder den Fehler noch schlimmer macht, können die Backupdaten von einem Prüfungspunkt leicht wieder eingerichtet, hergestellt und aus den Wiederholungseintragungen aktualisiert werden. Eine weitere Kopie der Datenbank kann verwendet werden, um zusätzliche mögliche Lösungsversuche zu unternehmen. Alternativ können Lösungen an einer Kopie der Datenbank vor der Modifikation der Produktionsdatenbank versucht werden.
  • Wenn einer Wiedereinrichtung gegenüber einer Reparatur der Verzug gegeben wird, dann muß der Benutzer entscheiden, welche Backupdaten wieder eingespeichert werden sollen. Im Idealfall ist dies das jüngste Backup vor einem Fehlerhaftwerden der Datenbank. Wenn die genaue Zeit, zu welcher der Fehler aufgetreten ist, nicht bekannt ist, dann muß der Benutzer abschätzen, welche Backupdaten wieder eingerichtet werden sollen.
  • In bekannten Systemen mußte der Benutzer eine Wiedereinrichtung von den ausgewählten Backupdaten vornehmen. Nach Vervollständigung der Wiedereinrichtung, welche viele Stunden später gegeben sein kann, kann der Benutzer prüfen, ob die ausgewählten Backupdaten frei von Fehlerhaftigkeit sind. Ist dies nicht der Fall, dann muß der Benutzer eine weitere Wiederherstellung von weiteren Backupdaten vornehmen. Solche mehrfachen Wiederherstellungen oder Wiedereinrichtungen werden durch das IR-System nach der vorliegenden Erfindung unnötig gemacht, da der Benutzer die ausgewählten Backupdaten auf einem anderen Host installieren kann und diese Backupdaten nach Fehler untersuchen kann. Sobald fehlerfreie Backupdaten gefunden sind, kann eine einzige Wiedereinrichtung erfolgen.
  • In vielen bekannten Systemen ist die sogenannte chirurgische Reparatur der Produktionsdatenbank die bevorzugte Möglichkeit aufgrund des Zeit- und Arbeitsaufwandes, die mit der Wiedereinrichtung der Daten vom Band verbunden ist. Für verhältnismäßig große Datenbanken, beispielsweise mehr als ein Terabyte, kann die Datenwiederherstellung vom Band viele Stunden beanspruchen. Zusätzlich ist für bestimmte Datenbanken mit kritischen Aufgaben die chirurgische Reparatur praktisch die einzige Möglichkeit angesichts der ungeheuren Kosten, die mit einer Abschaltung einer Datenbank verbunden sind. Die einhergehenden Risiken der Beschädigung einer solchen Datenbank bei dem Reparaturversuch an einem Fehler sind jedoch ohne weiteres ersichtlich.
  • Nach einer Zeit TRF nach Wiedereinrichtung der Prüfpunktdaten versucht der Vorwärtsrollprozeß die Datenbank mit Transaktionen zu aktualisieren, welche aufgetreten sind, seit die Kopie der Datenbank eingefroren wurde, und welche in der Wiederholungseintragung RL aufgezeichnet sind. Der Vorwärtsrollprozeß wiederholt sich, da die Datenbank nach Fehlern untersucht werden sollte, während die aufgezeichneten Transaktionen in die Datenbank eingegeben werden. Durch inkrementelles Vorwärtsrollen oder Vorwärtsblättern kann die Datenbank an bestimmten Punkten aktualisiert werden. Wenn ein Fehler entdeckt wird, muß der Vorwärtsrollprozeß nur zu dem letzten fehlerfreien Punkt zurück laufen. Konventionelle Systeme auf Speicherbandbasis bieten aufgrund der nicht kompatiblen Formate zwischen Band und Platte diese Möglichkeit.
  • Es versteht sich, daß ein Operator leicht die besonderen Fehlererkennungs- und Korrekturschritte abhängig von den Anforderungen einer bestimmten Applikation variieren kann. Beispielsweise können Prüfpunkte nach veränderlichem Fahrplan und nach Bedarf für die Verwendung beim Auffinden einer Fehlerkorrekturlösung erzeugt werden.
  • 16 zeigt eine beispielsweise Architektur eines Informationswiederherstellungssystems, welches flexibel leicht einer Vielfalt von Applikationsagenten, Betriebssystemen und Reproduktionstechnologien arbeitet. Im Allgemeinen kommuniziert ein IR-Kern mit einer grafischen Benutzerschnittstelle (GUI) oder einer Befehlsleitungsschnittstelle (CLI) über eine Applikationsprogrammierschnittstelle (API) zur Einschaltung der Informationsrekonstruktion. Verschiedene Applikationsagenten A, B und C kommunizieren mit dem IR-Kern über eine Unternehmensapplikation API. Der IR-Kern kann mit vielerlei Kunden-Betriebssystemen und Reproduktionstechnologien arbeiten. Eine Trennung von Applikationen und Reproduktionstechnologien mit einer gemeinsamen Schnittstelle zu dem Kern ermöglicht die Zuführung neuer Applikationen und Reproduktionstechnologien ohne eine Änderung des Kerns. Beispielsweise können neue Reproduktionstechnologien, welche neue Hardware, neue Software der Produktionen auf Host-Basis und/oder Kopien von dritter Seite umfassen, beispielsweise SCSIXCOPY-Geräte, leicht hinzugefügt werden. Neue Datenbanken und Applikationen können auch leicht hinzugefügt werden, einschließlich neuer Dateisysteme, neuer Relations-Datenbankmanagementsysteme (RDBMS) und neuer finanzieller Applikationen und e-mail-Applikationen. Neue Benutzerschnittstellen, neue Schriftformeln und neue Host-Plattformen können ebenfalls leicht unterhalten werden.
  • In einem weiteren Aspekt der Erfindung kann ein Teil einer Datenbankreproduktion in einem Hostrechner eingebaut werden. Während die Erfindung nur in Verbindung mit Tabellenräumen in einer Oracle-Datenbank beschrieben ist, versteht es sich, daß die Erfindung auf weitere Datenbankarten und Datenbankkomponenten anwendbar ist. Außerdem versteht es sich, daß die Oracle-Ausdrücke verwendet werden, um das Verständnis der Erfindung zu erleichtern, woraus jedoch keine Beschränkung der Erfindung auf eine bestimmte Datenbankart oder Konfiguration abzuleiten ist.
  • Die 17 und 18, welche eine gewisse Ähnlichkeit zu 1 haben, zeigen ein Beispiel eines IR-Systems 1200 mit der Installation einer Reproduktion eines Datenbankteiles gemäß der vorliegenden Erfindung. Der IR-Server 1202 enthält einen IR-Daemon 1204 zur Handhabung von Reproduktionsanfragen von Hostrechnern, beispielsweise IR-Benutzer 1206. IR-Applikationskunden 1208 arbeiten als ein Datenbankserver DBS (18) für Applikationen, beispielsweise Oracle-Datenbanken, welche in Volumengruppen VGS in dem Speicherbereichsnetzwerk SAN gespeichert sind. Ein IR-Benutzer 1206 oder ein Einrichtungshost MH (18) hat Sicht auf eine reproduzierte Datenbank RDB, welche von einer Originaldatenbank ODB reproduziert worden ist.
  • In der dargestellten Ausführungsform befindet sich die Produktionsdatenbank oder Originaldatenbank ODB in einem Speicherbereichsnetzwerk SAN und läuft auf dem Datenbankserver-Host DBS. Die Originaldatenbank ODB enthält einen ersten, einen zweiten und einen dritten Tabellenraum TS1, TS2, TS3 zusammen mit der Systeminformation SYS. Die Reproduktionsdatenbank RDB der Originaldatenbank ODB enthält auch entsprechende Tabellenräume TS1R, TS2R, TS3R und die Systeminformation SYSR. Die Erzeugung der Datenbankreproduktion ist im Einzelnen oben beschrieben wurden. Die Reproduktionsdatenbank ODB ist für einen IR-Benutzer, beispielsweise den Einrichtungshost MH (18) sichtbar. Es versteht sich, daß der Einrichtungshost MH und der Datenbankserver DBS im Wesentlichen gleich sind, beispielsweise mit dem selben Betriebssystem laufen, u. s. w.
  • Wie oben beschrieben läuft der IR-Daemon 1204 auf dem IR-Server 1202. Die Reproduktionsinformation, beispielsweise Aufzeichnungsdateien, ist in der IR-Datenbank 1210 enthalten. Die IR-Datenbank ha die Information, die zum Einbau und zum Start einer Reproduktion erforderlich ist. Diese Information wird während der Schaffung der Reproduktion gewonnen, wie ebenfalls oben beschrieben wurde.
  • Der Kunden-Steuermodul oder Daemon 1212 (17) läuft auf dem Datenbankserver DBS und dem Einrichtungshost MH. Der Kunden-Steuermodul, der auf dem Einrichtungshost läuft, empfängt die Datenvolumen-Aufzeichnungsdatei zusammen mit anderen notwendigen Informationen von dem IR-Server 1202, um die Reproduktionsdatenbank RDB einzurichten.
  • Im Allgemeinen kann das System eine teilreproduzierte Datenbank, beispielsweise Tabellenräume, welche in der oben beschriebenen Weise durch einen Benutzer ausgewählt wurden, in einer Vielfalt von Arten in Lauf setzen. Beispielsweise kann die Bedienungsperson den ersten Tabellenraum TS1 für den Start auswählen, so daß der zweite und der dritte Tabellenraum TS2, TS3 nicht beachtet werden. Nach der Einrichtung ist der erste Tabellenraum TS1 für die Verwendung durch einen Operator verfügbar.
  • In einer Ausführungsform kann eine teilreproduzierte Datenbank, beispielsweise der erste Tabellenraum TS1, in einem wiederhergestelltem Modus, in einem wiederhergestelltem Modus nur für das Lesen und in einem Modus ohne Wiederherstellung gestaltet werden, was nachfolgend beschrieben wird. Weitere Moden zur Erfüllung der Anforderungen einer bestimmten Applikation sind für den Fachmann ohne weiteres offenbar.
  • 19 zeigt eine beispielsweise Folge von Schritten zum Starten einer Reproduktion eines Teiles einer Datenbank gemäß der vorliegenden Erfindung. In dem Schritt 1300 gewinnt der Einrichtungshost der Aufzeichnungskartei der Reproduktionsdatenbank von der IR-Datenbank über den IR-Server. Ein Datenbankserver zur Steuerung der reproduzierten Datenbank wird dann im Schritt 1302 in dem Einrichtungshost geschaffen. Das Erzeugen des Datenbankservers kann beispielsweise das Importieren von Volumengruppen, das Starten von Volumen und das Einrichten von Dateisystemen umfassen. In dem Schritt 1303 kopiert das System die entsprechende Backup-Steuerdatei sowie Archiveintragungen, die init <sid> Datei und die Paßwortdatei zu dem erforderlichen Ort im Einrichtungshost hin. In dem Schritt 1304 wird die betreffende Datenbank, beispielsweise die reproduzierte Oracle-Datenbank, in dem Ziel-Einrichtungshost eingebaut, wie im Einzelnen oben beschrieben wurde. Es versteht sich, daß die Reproduktion in einen Ziel-Host eingebaut werden kann, in welchem die reproduzierte Datenbank nicht bereits existiert. Das bedeutet, das System erwartet, daß der Einbauhost die Oracle-Applikation installiert hat und daß das zu installierende Objekt nicht bereits auf dem Host läuft.
  • In einer Ausführungsform empfängt die Applikationsschicht des Kundensteuerdaemons eine Aufzeichnung oder eine Baumdatei, welche beschreibt, was wiederherzustellen ist. Der ursprüngliche Baum wird während der Reproduktion der Applikation erzeugt und wird in dem IRD-Katalog/Datenbank auf dem IR-Server gespeichert. Diese Aufzeichnung wird für die Kundensteuerung verfügbar gemacht, die auf dem Einrichtungshost läuft. Der Baum enthält, was einzurichten ist und ist aus den Benutzeranforderungen aufgebaut. Somit wählt der Benutzer einen partiellen Baum aus dem Originalbaum. Dieser partielle Baum wird mit dem Originalbaum verglichen, welcher beschreibt, was in der Reproduktionsdatenbank enthalten ist. Dies ermöglicht es dem Kundensteuerungsdaemon diejenigen Tabellenräume festzulegen, beispielsweise TS2 und TS3, welche nicht wiederhergestellt werden müssen. Die Eintragungsdateien können zu dem Ziel-Host ebenso wie andere Informationsdateien hinüber kopiert werden, beispielsweise für Oracle-Applikationen die initinstance.ora-Datei und zwei Backup-Steuerdateien (eine Version für Lesen allein und eine reguläre Version).
  • Für den Start im Wiederherstellungsmodus werden in dem Schritt 1306 die Datenbank-Volumengruppen und/oder Rohgegenstände gegenüber den ursprünglichen Hostnamen in neue Namen im Ziel-Einrichtungshost umbenannt. Beispielsweise werden Oracle-Feststellungen ausgeführt, um der Oracle-Datenbank die Namensänderungen gegenwärtig zu machen. Es versteht sich, daß die Paßwortdatei von der IR-Datenbank für die Reproduktion übertragen wird. In einer Ausführungsform werden die Backup-Steuerungsdateien automatisch von dem Ort kopiert, wo die echten Steuerdateien vermutet werden, so daß sie für die Verwendung durch Oracle bereit sind. Die Backup-Steuerdateien werden zu dem Archiveintragungsinhaltsverzeichnis auf den Einrichtungshost kopiert. Die Steuerdateien werden zu den Orten hin kopiert, welche durch die init <SID>.ora-Datei des Applikationshost für Oracle-Applikationen zu der Zeit der Reproduktion beschrieben werden. Die Beschreibung dieses Ortes wird tatsächlich zu der Zeit der Reproduktion katalogisiert, beispielsweise durch Befragung der Datenbank. Abhängig davon, ob es sich um eine Wiederherstellung nur bezüglich Lesen oder eine normale Wiederherstellung handelt, wird die geeignete Backup-Steuerdatei zu dem oben beschriebenen Ort hin kopiert. Nach Kopieren der Steuerdateien gibt die IR-Applikationsagentensoftware die entsprechenden Zulassungen und Inhaberschaft.
  • Nach Anwendung der wiederhergestellten Paßwortdatei wird im Schritt 1308 die unerwünschte Information, beispielsweise TS2, TS3, gelöscht, so daß nur die Tabellenräume, die zuvor für die Wiederherstellung durch den Benutzer ausgewählt worden sind, beispielsweise TS1, wiederhergestellt werden. Die Wiederherstellung des ersten Tabellenraumes TS1 wird dann in dem Schritt 1310 durchgeführt. Nach Kopieren der entsprechenden Steuerdateien wird die Datenbank eingerichtet und, falls notwendig, neu benannt. Unerwünschte Datendateien werden dann fallengelassen (durch Fallenlassen von Datendateien werden die Steuerdateien aktualisiert), und dann wird die gesamt Datenbasis wiederhergestellt. Oracle ignoriert die fallengelassenen Datendateien und stellt nur die Tabellenräume wieder her, welche für die Installation ausgewählt worden sind, wie dies durch die Steuerdateien definiert ist. In dem Schritt 1312 wird dann das Oracle-Datenbank-Niveau geöffnet und steht für die Verwendung zur Verfügung.
  • In dem Modus ohne Wiederherstellung gibt die Oracle-Schicht keine Oracle-Wiederherstellungsbefehle aus. Sie hält nur die Werkzeuge für den Benutzer verfügbar. Das bedeutet, die initinstance.ora-Datei, die Eintragungsdateien, die Datendateien und die Backup-Steuerdateien sind verfügbar. Der Benutzer kann dann eine Paßwortdatei erzeugen und die Wiederherstellung von Hand durchführen.
  • In dem Startmodus mit Lesen allein benimmt sich das System ähnlich wie beim Wiederherstellungsmodus, jedoch mit der Ausnahme, daß die Backup-Steuerdatei, welche zu dem echten Steuerdateiort hin kopiert wird, die Festwertversion ist und der Gegenstand im Bereitschaftsmodus wiederhergestellt und eröffnet wird.
  • Der Fachmann erkennt weitere Merkmale und Vorteile der Erfindung auf der Basis der oben beschriebenen Ausführungsformen. Demgemäß ist die Erfindung nicht auf das beschränkt, was im Einzelnen gezeigt und beschrieben wurde, außer wie durch die anliegenden Ansprüche definiert. Sämtliche Veröffentlichungen und Vergleichsliteratur, welche hier erwähnt wurde, sei ausdrücklich in der jeweiligen Gesamtheit durch Bezugnahme eingeführt.

Claims (14)

  1. Verfahren zum Auffinden von Fehlern in einem Datenvolumen einer Produktionsdatenbank mit folgenden Schritten: Speichern eines Original-Datenvolumens; Reproduzieren des Original-Datenvolumens; Untersuchen des reproduzieren Datenvolumens auf Fehler; Korrigieren eines Fehlers in dem Original-Datenvolumen basierend auf Information, die aus der Untersuchung eines entsprechenden Fehlers in dem reproduzierten Datenvolumen gewonnen wurde; welches weiter den Einbau und die Untersuchung des reproduzierten Datenvolumens mit einem Datenreinigungswerkzeug umfaßt, eine Beurteilung des in dem reproduzierten Datenvolumen entdeckten Fehlers ermöglicht, um eine Fehlerkorrekturstrategie zu bestimmen, wobei die Fehlerkorrekturstrategie eine Fehlerkorrektur auf dem Original-Datenvolumens oder einer Bedarfskopie des Original-Datenvolumens umfasst, ohne dass dabei das reproduzieren Datenvolumen korrigiert wird.
  2. Verfahren nach Anspruch 1, welches weiter folgende Schritte enthält: Speichern des Original-Datenvolumens auf einer ersten Anzahl von Platten; und Reproduzieren des Original-Datenvolumens auf einer zweiten Anzahl von Platten.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß es weiter einen Versuch, das reproduzierte Datenvolumen zu reproduzieren, ermöglicht.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß es weiter die Verwirklichung einer erfolgreichen Reparatur des reproduzierten Datenvolumens in dem Originaldatensatz auf der ersten Anzahl von Platten ermöglicht.
  5. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß es die Wiedereinspeicherung des reproduzierten Datenvolumens umfaßt.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß es die Aktualisierung des wiederhergestellten Datenvolumens mit Daten aus einer Wiederholungseintragung umfaßt.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß es die inkrementelle Untersuchung des wiederhergestellten Datenvolumens nach Fehlern umfaßt, wenn das wiedereingespeicherte und wiederhergestellte Datenvolumen aus der Wiederholungseintragung aktualisiert wird.
  8. Verfahren nach Anspruch 7, welches weiter die Aktualisierung des teilweise wiederhergestellten Datenvolumens an einem Punkt umfaßt, an dem keine Fehler entdeckt werden.
  9. Informationswiederherstellungssystem, dass nach einem Verfahren gemäß einem der Ansprüche 1 bis 8 arbeitet, welches folgendes enthält: ein Speicherbereichsnetzwerk; einen mit dem Speicherbereichsnetzwerk gekoppelten Server zum Empfangen einer Anfrage von einem ersten Host zur Reproduktion einer Datenvolumengruppe, welche von einem zweiten Host eingerichtet und nach Fehlern untersucht werden kann.
  10. System nach Anspruch 9, welches weiter eine Informationswiederherstellungsapplikation zur Erzeugung von Reproduktionsanfragen enthält.
  11. System nach Anspruch 10, bei welchem die Informationswiederherstellungsapplikation sich auf einem Hostrechner befindet, der mit dem Server über ein Netzwerk gekoppelt ist.
  12. System nach Anspruch 9, bei welchem die Datenvolumengruppe durch einen Applikationsagenten gesteuert ist.
  13. System nach Anspruch 12, bei welchem der Applikationsagent einer Oracle-Datenbank entspricht.
  14. System nach Anspruch 9, welches weiter eine Informationswiederherstellungsdatenbank enthält, die mit dem Server gekoppelt ist.
DE10297001.7T 2001-06-28 2002-05-29 Informations-Reproduktionssystem mit verbesserter Fehlererkennung und Rekonstruktion Expired - Lifetime DE10297001B4 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US09/894,422 US7613806B2 (en) 2001-06-28 2001-06-28 System and method for managing replication sets of data distributed over one or more computer systems
US09/894,422 2001-06-28
US09/946,078 US7096250B2 (en) 2001-06-28 2001-09-04 Information replication system having enhanced error detection and recovery
US09/946,078 2001-09-04
PCT/US2002/016871 WO2003003209A1 (en) 2001-06-28 2002-05-29 Information replication system having enhanced error detection and recovery

Publications (2)

Publication Number Publication Date
DE10297001T5 DE10297001T5 (de) 2004-07-01
DE10297001B4 true DE10297001B4 (de) 2015-07-23

Family

ID=27129086

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10297001.7T Expired - Lifetime DE10297001B4 (de) 2001-06-28 2002-05-29 Informations-Reproduktionssystem mit verbesserter Fehlererkennung und Rekonstruktion

Country Status (3)

Country Link
DE (1) DE10297001B4 (de)
GB (1) GB2393295B (de)
WO (1) WO2003003209A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7299376B2 (en) 2004-08-25 2007-11-20 International Business Machines Corporation Apparatus, system, and method for verifying backup data
JP5165206B2 (ja) 2006-03-17 2013-03-21 富士通株式会社 バックアップシステムおよびバックアップ方法
CN102081560B (zh) * 2011-03-03 2013-01-16 杭州电子科技大学 一种基于代理操作的备份方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889935A (en) * 1996-05-28 1999-03-30 Emc Corporation Disaster control features for remote data mirroring
US6145088A (en) * 1996-06-18 2000-11-07 Ontrack Data International, Inc. Apparatus and method for remote data recovery

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5177744A (en) * 1990-09-04 1993-01-05 International Business Machines Corporation Method and apparatus for error recovery in arrays
US5513192A (en) * 1992-08-28 1996-04-30 Sun Microsystems, Inc. Fault tolerant disk drive system with error detection and correction
EP0721162A2 (de) * 1995-01-06 1996-07-10 Hewlett-Packard Company Speicherplattenanordnung mit auf gespiegeltem Speicher basierten doppelten Steuergeräten
US5784548A (en) * 1996-03-08 1998-07-21 Mylex Corporation Modular mirrored cache memory battery backup system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889935A (en) * 1996-05-28 1999-03-30 Emc Corporation Disaster control features for remote data mirroring
US6145088A (en) * 1996-06-18 2000-11-07 Ontrack Data International, Inc. Apparatus and method for remote data recovery

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BÖGELHOLZ, Harald: SIERING, Peter: Datenpuzzle. Mit dem Diskeditor auf Datensuche. In: c't Magazin für Computertechnik. Hannover: Heise, 2000, Vol. 6, S. 116-129, Ausgedruckt aus c't-ROM 1990-2004 (Hier als Seiten 1-19 nummeriert) *
Oracle Backup und Recovery Anleitung. 21.04.2001 [recherchiert am 10.12.2014]. Im Internet: *
Oracle Backup und Recovery Anleitung. 21.04.2001 [recherchiert am 10.12.2014]. Im Internet: <URL: http://www.akadia.com/services/oraback/OracleBackupAndRecovery.html>

Also Published As

Publication number Publication date
GB2393295A (en) 2004-03-24
GB0327608D0 (en) 2003-12-31
DE10297001T5 (de) 2004-07-01
GB2393295B (en) 2005-06-08
WO2003003209A1 (en) 2003-01-09

Similar Documents

Publication Publication Date Title
DE112011100534B4 (de) Mehrstufiger Sicherungsprozess
US7076685B2 (en) Information replication system mounting partial database replications
DE112011100112B4 (de) Pufferspeicher-platte in blitzkopie-kaskade
DE102008015662B4 (de) Beseitigung von Daten
DE60212125T2 (de) Kopierprozeduren mit verifikation in datennetzwerken
DE60318687T2 (de) Herstellen einer gespiegelten kopie unter verwendung inkrementeller divergenz
DE60112462T2 (de) Wiederherstellung von dateisystemdaten in dateiservern mit gespiegelten dateisystemvolumen
DE60038364T2 (de) Computersystem und Speicherauszugsdatenverwaltungsverfahren
DE19982999B4 (de) Computersystem und Verfahren zum Transferieren von Daten
DE60312746T2 (de) Wiederherstellung nach fehlern in datenverarbeitungsanlagen
US7660832B2 (en) System recovery method and computer system using the same
DE60113586T2 (de) Übertragen von miteinander verbundenen Datenobjekten in einer verteilten Datenspeicherumgebung
US6978282B1 (en) Information replication system having automated replication storage
DE602005005610T2 (de) Planungs- und Implementierungssystem für eine externe Disaster-Recovery mit einem virtuellen Band eines Datenzentrums
DE10112941B4 (de) System und Verfahren für das parallele Lesen von primären und sekundären Sicherungen zur Wiederherstellung mehrerer gemeinsam benutzter Datenbankdateien
DE60304677T2 (de) Verfahren und vorrichtung zur bereitstellung einer inkrementellen wiederherstellung eines speichermediums bei datenverlust
DE102013215535B4 (de) Sicherung oder wiederherstellung von daten mit hilfe eines hauptspeichers und nichtflüchtiger speichermedien
DE112010004931B4 (de) Mehrphasige Wiederherstellung von Dateisystemen mit Selektiver Bedarfsweiser Verfügbarkeit von Daten
DE60213867T2 (de) Vorrichtung zur verwaltung von datenreplikation
DE602004008808T2 (de) Verfahren und vorrichtung zur durchführung von operationen an gewählten daten in einem speicherbereich
DE102005022192B4 (de) Datensicherungs-Laufwerk mit auswechselbaren Speichermedien zum Sichern von Daten eines Hostcomputers
DE602004002216T2 (de) Verfahren, system und programm für eine inkrementelle virtuelle kopie
DE112016001295T5 (de) Neusynchronisieren auf ein erstes Speichersystem durch Spiegeln des ersten Speichersystems nach einem Failover zu einem zweiten Speichersystem
DE60313468T2 (de) Speicherdienste und -systeme
DE10393771T5 (de) Schnelle Datensicherungsspeicherung und schnelle Datenwiederherstellung (FBSRD)

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law

Ref document number: 10297001

Country of ref document: DE

Date of ref document: 20040701

Kind code of ref document: P

8181 Inventor (new situation)

Inventor name: SCHUTZMAN, NEIL, MARLBOROUGH, MASS., US

Inventor name: PILLAI, ANANTHAN K., SHREWSBURY, MASS., US

Inventor name: WRIGHT, MICHAEL H., FRANKLIN, MASS., US

Inventor name: MUTALIK, MADHAV, SOUTHBOROUGH, MASS., US

Inventor name: DINGS, THOMAS, HOPKINTON, MASS., US

Inventor name: SHEKHAR, AJAY, MEDWAY, MASS., US

Inventor name: STOCKENBERG, JOHN E., NEWPORT, R.I., US

R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R071 Expiry of right