DE19715696A1 - Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird - Google Patents

Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird

Info

Publication number
DE19715696A1
DE19715696A1 DE19715696A DE19715696A DE19715696A1 DE 19715696 A1 DE19715696 A1 DE 19715696A1 DE 19715696 A DE19715696 A DE 19715696A DE 19715696 A DE19715696 A DE 19715696A DE 19715696 A1 DE19715696 A1 DE 19715696A1
Authority
DE
Germany
Prior art keywords
search
document
gateway
documents
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19715696A
Other languages
English (en)
Inventor
Toshio Kanoh
Gregory J Wolff
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE19715696A1 publication Critical patent/DE19715696A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/748Hypervideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/2871Implementation details of single intermediate entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/564Enhancement of application control based on intercepted application data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00206Transmitting or receiving computer data via an image communication device, e.g. a facsimile transceiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/327Initiating, continuing or ending a single-mode communication; Handshaking therefor
    • H04N1/32765Initiating a communication
    • H04N1/32771Initiating a communication in response to a request, e.g. for a particular document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/327Initiating, continuing or ending a single-mode communication; Handshaking therefor
    • H04N1/32765Initiating a communication
    • H04N1/32771Initiating a communication in response to a request, e.g. for a particular document
    • H04N1/32778Initiating a communication in response to a request, e.g. for a particular document using a mark-sheet or machine-readable code request
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0065Converting image data to a format usable by the connected apparatus or vice versa
    • H04N2201/0068Converting from still picture data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Description

Die vorliegende Erfindung betrifft das Gebiet von Dokumentbeschaffungssystemen; insbesondere betrifft die vorliegende Erfindung die Suche nach Dokumenten auf einem verbundenen Computernetzwerk, wie zum Beispiel dem World Wide Web oder einer ähnlichen Dokumentenresourcen-Versorgungseinrichtung bzw. Dokumen­ tenquellen-Versorgungseinrichtung, indem ein Faxgerät verwendet wird.
Eine wichtige Verwendung von Computern stellt die Übertragung von Information über ein Netzwerk dar. Gegenwärtig ist das größte existierende Computernetzwerk das Internet. Das Internet ist eine weltweite Verbindung von Computernetzwerken, die miteinander kommunizieren, indem ein gemeinsames Protokoll verwendet wird. Millionen von Computern von einem einfachen Personalcomputer bis zu einem hochtechnologischen Supercomputer sind an dem Internet angeschlossen.
Das Internet wuchs aus einer Arbeit, die in den 60ern durch die Advanced Research Projects Agency des U.S. Defense Department′s gegründet wurde. Für eine lange Zeit wurde Internet von Forschern in Universitäten und Nationalen Laboratorien verwendet, um Informationen auszutauschen. Als die Existenz des Internet breiter bekannt wurde, begannen viele Benutzer außerhalb der Akademiker/Forscher-Gemeinde (z. B. Angestellte von großen Firmen), das Internet zu benutzen, um elektronisch Post zu übermitteln.
1989 wurde ein neuer Typ von Informationssystem, das als das World Wide Web ("das Web") bekannt ist, auf dem Internet eingeführt. Eine frühe Entwicklung des Web fand am CERN statt, dem Europäischen Teilchenphysiklaboratorium bzw. "European Particle Physics Laboratory". Das Web ist ein weitflächiges Hypermedia- Informationsbeschaffungssystem, das darauf zielt, einen breiten Zugriff auf ein großes Universum von Dokumenten zu ermöglichen. Zu dieser Zeit war das Web nur der Akademiker/Forscher-Gemeinde bekannt und wurde von dieser genutzt. Es gab keine einfachen verfügbaren Mittel, die es einer technisch nicht ausgebildeten Person erlaubte, auf das Web zuzugreifen.
1993 gaben Forscher am National Center for Supercomputing Applications (NSCA) einen Web-Browser heraus, der "Mosiac" genannt wurde und der eine graphische Benutzerschnittstelle bzw. "graphical user interface" (GUI) implementierte. Die graphische Benutzerschnittstelle des Mosiac war einfach zu lernen und dennoch leistungsfähig. Der Mosiac-Browser erlaubt es einem Benutzer, Dokumente aus dem Web zu beschaffen, in dem einfache Zeige-und-Klickbefehle verwendet werden.
Die Architektur des Web folgt einem herkömmlichen Client-Server-Modell. Die Terme "Client" und "Server" werden verwendet, um auf die allgemeine Rolle des Computers als ein Abfrager bzw. Anforderer von Daten (der Client) oder als ein Bereitsteller von Daten (der Server) hinzuweisen. In der Web-Umgebung sind die Web-Browser Client und die Web-Dokumente befinden sich auf den Servern. Die Web-Clients und die Web-Server kommunizieren miteinander, indem ein Protokoll bzw. Übertragungsprotokoll verwendet wird, das Hypertext-Übertragungsprotokoll bzw. "Hypertext Transfer Protocol" (HTTP) genannt wird. Ein Browser öffnet eine Verbindung zu einem Server und löst eine Abfrage für ein Dokument aus. Der Server liefert das abgefragte Dokument, typischerweise in der Form eines Text- Dokumentes, das in einem Standardformat der Hypertext Markup Language (HTML) bzw. in einem Standardformat der Sprache zur Auszeichnung von Hypertext kodiert ist. Der Server übernimmt die passive Rolle. Er nimmt die Befehle von dem Client an und sendet die Daten zu dem Client, aber er kann nicht von dem Client fordern, irgendeine Aktion durchzuführen.
Abschnitte von Dokumenten, die auf dem Web angezeigt werden beinhalten Hypertextlinks. Die Hypertextlinks verbinden bzw. verknüpfen Graphiken oder Text auf einem Dokument mit einem anderen Dokument auf dem Web. Jeder Hyper­ textlink ist mit einem Universal Resource Locator (URL) bzw. mit einer genormten Methode zum Auffinden von Resourcen verbunden. Eine URL spezifiziert einen Server und ein bestimmtes Dokument auf dem Server. Wenn ein Benutzer einen Hypertextlink auswählt, indem zum Beispiel ein Cursor verwendet wird, stellt der graphische Browser eine Verbindung zu dem Server her und beschafft das Dokument bzw. die Dokumente, die durch die URL bzw. die URLs spezifiziert sind.
Manche Server stellen eine Einrichtung bereit, um eine Sammlung von Dokumenten bereitzustellen. Nach der anfänglichen Aufforderung liefert der Server ein Formular zu dem Browser. Der Benutzer gibt die Daten unter Verwendung des graphischen Browsers ein, wie zum Beispiel Schlüsselwörter, und zwar auf dieser Form bzw. diesem Formular, die bzw. das einen Teil einer Suchabfrage darstellt, und eröffnet dann eine neue Verbindung zu dem Server und legt diese Daten dem Server vor bzw. übersendet sie an diesen. Der Server antwortet auf diese Anfrage mit einer Auflistung neuer Dokumente, wobei manche oder alle der Dokumente mit jenen Schlüsselwörtern oder anderen Daten zusammenpassen, die durch den Browser angefordert wurden. Jedes normalerweise aufgelistete Dokument beinhaltet einen Hypertextlink zu dem aktuellen Dokument, so daß der Benutzer auf einfache Weise das Dokument beschaffen kann (wie dies jeder andere Link bzw. jede andere Verknüpfung machen würde).
Während Web-Server und Web-Clients, wie zum Beispiel Mosaic die Tür für On- Line-Veröffentlichungen und Nutzung von Information geöffnet haben, waren diese Dienste nur für jene verfügbar, die einen Internetanschluß hatten. Mit anderen Worten können einzelne Personen, die keinen direkten Internetanschluß, ein­ schließlich einen Computer und einen Datenkanal zu dem Internet haben, nicht nach Dokumenten und anderen Resourcen bzw. Quellen suchen, die über das Web verfügbar sind. Es ist wünschenswert, die Suche nach Dokumenten auf den Web (oder einem anderen derartigen Netzwerk) jenen einzelnen Personen zu erlauben, die nicht einen derartigen direkten Anschluß haben.
Die vorliegende Erfindung stellt einen Zugriff auf das Web einzelnen Personen bereit, die nicht einen Computer oder einen Anschluß an das Internet oder an eine andere Netzwerk/Resourcen-Versorgungseinrichtung haben. Die vorliegende Erfindung erlaubt es einzelnen Personen nach Dokumenten zu suchen (und sie zu beschaffen), und zwar auf dem Web, und zwar so, als ob sie tatsächlich mit dem Web individuell verbunden wären. Auf diese Art und Weise ermöglicht es die vorliegende Erfindung einzelnen Personen, die Fähigkeit von Clients zu entwickeln, wenn diese einzelne Person keinen direkten Anschluß an ein Netzwerk hat.
Die vorliegende Erfindung stellt ein Verfahren und ein Apparat bereit, um Dokumente zu beschaffen. Die vorliegende Erfindung weist ein Verfahren und einen Apparat auf, der eine Facsimileübertragung eines Dokuments mit wenigstens einem Suchterm empfängt. Die vorliegende Erfindung stellt ebenso ein Verfahren und ein Apparat bereit, um eine Suche, basierend auf Suchtermen, die sich auf dem empfangenen Dokument befinden, durchzuführen.
Die vorliegende Erfindung wird nun verständlicher von der detaillierten Be­ schreibung, die im folgenden zusammen mit den beigefügten Zeichnungen von vielfältigen Ausführungsformen der Erfindung gegeben wird und die rein beispielhaft ist. Dabei können unterschiedliche Merkmale unterschiedlicher Ausführungsformen miteinander kombiniert werden. Die vorliegende Erfindung basiert auf der US-Patentanmeldung S.N. 08/632,681 die am 16. April 1996 eingereicht wurde und deren Inhalt hiermit ausdrücklich mit aufgenommen wird.
Fig. 1 ist ein Blockdiagramm einer Ausführungsform des Dokumentsuch- und Beschaffungssystems der vorliegenden Erfindung.
Fig. 2A ist ein Flußdiagramm des Suchprozesses der vorliegenden Erfindung.
Fig. 2B ist ein Flußdiagramm des Suchprozesses der vorliegenden Erfindung.
Fig. 2C zeigt die Client-Server-Kommunikation.
Fig. 2D ist ein Blockdiagramm einer Ausführungsform der Gateway der vorliegenden Erfindung.
Fig. 3 ist ein Beispiel-Suchformular gemäß der vorliegenden Erfindung.
Fig. 4 ist ein Flußdiagramm einer Ausführungsform des Dokumentbeschaf­ fungsprozesses, der von einem Benutzer eines Faxgerätes gemäß der vorliegenden Erfindung durchgeführt wird.
Fig. 5 zeigt ein Beispiel eines Hardcopy-Dokuments, das eine maschinenles­ bare Information gemäß der vorliegenden Erfindung aufweist.
Fig. 6 ist ein Flußdiagramm einer Ausführungsform des Dokumentbeschaf­ fungsprozesses, der von der Gateway der vorliegenden Erfindung durchgeführt wird.
Fig. 7 ist ein Flußdiagramm einer Ausführungsform des Prozesses zum Extrahieren einer ausgewählten maschinenlesbaren Information aus einem empfangenen Dokument gemäß der vorliegenden Erfindung.
Fig. 8 zeigt ein Beispiel eines bemalten Bildes, das von der Anwendung einer Ausführungsform des Extraktionsprozesses der vorliegenden Erfindung resultiert.
Fig. 9 ist ein Blockdiagramm einer Ausführungsform eines Computersystems der vorliegenden Erfindung.
Es wird ein Verfahren und ein Apparat beschrieben, der der Suche nach Dokumenten und dem Auffinden von Dokumenten dient. Bei der folgenden detaillierten Beschreibung der vorliegenden Erfindung werden zahlreiche spezifische Details, wie Resourcen- und Dokument-Identifiziertypen, Dokumenttypen etc. dargelegt, um ein tiefgehendes Verständnis der vorliegenden Erfindung bereitzustellen. Jedoch ist es für den Fachmann offensichtlich, daß die vorliegende Erfindung auch ohne diese spezifischen Details in die Praxis umgesetzt werden kann. In anderen Fällen werden gut bekannte Strukturen und Vorrichtungen eher in der Gestalt eines Blockdiagramms als detailliert gezeigt um eine Verschleierung der vorliegenden Erfindung zu vermeiden.
Einige Abschnitte der folgenden detaillierten Beschreibung werden in Termen von Algorithmen und symbolischen Darstellungen von Operationen mit Datenbits innerhalb eines Computerspeichers dargelegt. Diese algorithmischen Beschreibungen und Darstellungen sind die Mittel, die von dem Fachmann auf dem Gebiet der Datenverarbeitung verwendet werden, um am effektivsten das wesentliche ihrer Arbeit anderen Fachleuten zu übermitteln. Ein Algorithmus wird hier und im allgemeinen so verstanden, daß er eine selbstkonsistente Abfolge von Schritten ist, die Schritte sind von dergestalt, daß sie physikalische Manipulationen physikalischer Quantitäten erfordern. Im allgemeinen nicht notwendigerweise nehmen diese Quantitäten die Form von elektrischen oder magnetischen Signalen an, die die Eigenschaft aufweisen, daß sie gespeichert, übertragen, kombiniert, verglichen und anderweitig manipuliert werden können. Es hat sich zu Zeiten als zweckmäßig erwiesen, insbesondere aus Gründen der allgemeinen Verwendung, auf diese Signale als Bits, Werte, Elemente, Symbole, Charakter bzw. Zeichen, Terme, Zahlen oder dergleichen bezugzunehmen.
Es sollte jedoch bewußt bleiben, daß all diese oder ähnliche Termen mit den geeigneten physikalischen Quantitäten in Verbindung gebracht werden müssen und daß sie lediglich zweckmäßige Benennungen darstellen, die diesen Quantitäten verliehen wurden. Soweit es nicht anders zu lesen ist, als es von der folgenden Diskussion erkennbar ist, wird betont, daß es für die gesamte vorliegende Erfindung gilt, daß Diskussionen, die Terme, wie zum Beispiel Verarbeiten oder Berechnen oder Kalkulieren oder Bestimmen oder Anzeigen oder dergleichen beinhalten, auf die Wirkungen und Prozesse eines Computersystems oder einer ähnlichen elektronischen Rechenvorrichtung bezugnehmen die Daten, die als physikalische (elektronische) Quantitäten innerhalb der Register und Speicher des Computersystems dargestellt werden, in andere Daten, die in ähnlicher Weise als physikalische Quantitäten innerhalb der Speicher oder Register oder anderen derartigen Informationsspeicher-, Übertragungs- oder Anzeigevorrichtungen dargestellt werden, manipulieren und transformieren.
Die vorliegende Erfindung nimmt ebenso Bezug auf einen Apparat, um die Operationen hierin durchzuführen. Dieser Apparat kann für die erforderlichen Zwecke speziell konstruiert sein oder er kann einen Allzweckcomputer aufweisen, der selektiv durch ein Computerprogramm aktiviert oder rekonfiguriert ist, das in dem Computer gespeichert ist. Die Algorithmen und Anzeigen, die hierin dargestellt werden, stehen nicht inhärent in Bezug zu irgendeinem bestimmten Computer oder anderen Apparat. Verschiedenste Allzweckmaschinen können mit Programmen entsprechend der hierin vorgestellten Lehre verwendet werden, oder es kann sich als zweckmäßig herausstellen, einen spezialisierteren Apparat zu konstruieren, um die erforderlichen Verfahrensschritte durchzuführen. Die erforderliche Struktur für eine Vielfalt dieser Maschinen wird aus der folgenden Beschreibung ersichtlich werden. Zusätzlich kann die vorliegende Erfindung unter Bezugnahme auf irgendeine bestimmte Programmiersprache beschrieben werden. Man wird begrüßen, daß eine Vielfalt von Programmiersprachen verwendet werden kann, um die Lehren der Erfindung, wie hierin beschrieben ist, zu implementieren.
Überblick über die vorliegende Erfindung
Die vorliegende Erfindung stellt einen Zugriff auf Dokumente bereit, indem unter Verwendung einer Facsimilemaschine nach den Dokumenten gesucht wird und die Dokumente aufgefunden werden. Bei der vorliegenden Erfindung kann es sich bei einem Dokument um einen beliebigen Typus eines Mediums, wie zum Beispiel (aber nicht beschränkt darauf) Text, Bilder, Ton usw. handeln.
Bei der vorliegenden Erfindung füllt der Benutzer, um nach Dokumenten in dem Web zu suchen, indem er nur ein Facsimilegerät bzw. eine Faxmaschine verwendet, lediglich ein Suchformular aus, indem gewünschte Suchterme oder andere gutbekannte Suchparameter in eine oder mehrere Eingaberahmen bzw. Entryboxen auf einem Dokument (z. B. Seite) ausfüllt, und er sendet dieses Dokument via Facsimile zu einem Server. Der Server extrahiert die Suchterme und führt eine Suche aus, indem die Suchterme verwendet werden. Bei einer Ausführungsform extrahiert der Server die Suchterme von dem Dokument in einem nicht erkennbaren Format (z. B. Bitmaps) und sendet diese Extraktionen zu einer Zeichenerkennungsmaschine (z. B. optische Zeichenerkennung bzw. optische Charaktererkennung bzw. OCR). Die Ausgabe der Zeichenerkennungsmaschine bzw. Charaktererkennungsmaschine wird bei einer Abfrage an eine Web-Suchmaschine, wie zum Beispiel Yahoo, hergestellt von Yahoo! Corporation of Sunnyvale, Kalifornien, verwendet, die eine Suche auf eine Art und Weise durchführt, wie sie in der Fachwelt gut bekannt ist. Die Ergebnisse der Suche werden an den Benutzer über die Faxmaschine zurückgegeben. Diese Ergebnisse können Dokumente beinhalten, die die Suche erfüllen oder sie können eine Auflistung derartiger Dokumente beinhalten. Indem die vorliegende Erfindung verwendet wird, kann der Benutzer ebenso Dokumente von den Suchergebnissen, die von dem Web unter Verwendung der Faxmaschine beschafft werden sollen, auswählen.
Somit erlaubt die vorliegende Erfindung als ein Web-Client zu arbeiten und Texte und Bilder von jedem beliebigen Web-Standort bzw. Web-Site zu beschaffen. Auf diese Art und Weise kann der Benutzer mehrere Seiten von dem Web ansehen, sogar ohne eine Standleitung.
Übersicht über Client-Server-Operationen
Im folgenden wird eine kurze Erklärung bezüglich Client-Server-Operationen, URLs und Browsing bzw. "Durchstöbern" des Web gegeben.
Vom Konzept her betrachtet, beinhaltet ein Computernetzwerk, wie zum Beispiel das Internet kleine Computer und große Computer, die allgemein als Server verwendet werden. Im allgemeinen stellen kleine Computer Personalcomputer oder Work­ stations dar und sie stellen die Standorte bzw. Sites dar an denen ein menschlicher Benutzer den Computer bedient, um eine Datenabfrage von anderen Computern oder Servern auf dem Netzwerk durchzuführen. Im allgemeinen finden sich die angeforderten Daten in großen Computern. Bei diesem Szenario stellen die kleinen Computer Clients dar und die großen Computer sind die Server. Bei dieser Spezifikation werden die Terme "Client" und "Server" verwendet, um auf eine allgemeine Rolle des Computers als ein Anforderer von Daten (Clients) oder Bereitsteller von Daten (Server) bezugzunehmen. Im allgemeinen schließt die Größe eines Computers oder die mit der Größe verbundenen Resourcen nicht die Fähigkeit des Computers aus als Client oder als Server zu dienen. Weiter kann jeder Computer bei einer Transaktion Daten anfordern und bei einer anderen Transaktion Daten bereitstellen, womit sich die Rolle des Computers vom Client zum Server oder umgekehrt ändert.
Das World Wide Web ("Web") verwendet das Client-Server-Modell, um Information zwischen Clients und Servers zu übertragen bzw. zu vermitteln. Web-Server sind mit dem Internet verbunden und Antworten auf eine Dokumentabfrage von Web-Clients. Web-Clients (z. B. Web-"Browser") sind Programme, die es dem Benutzer erlauben, einfach auf Web-Dokumente zuzugreifen, die sich auf Web-Server befinden.
Ein Beispiel eines Client-Server-Systems, das durch das Internet verbunden ist, kann ein entfernt gelegenes Server-System beinhalten, das durch das Internet mit einem Client-System verbunden ist. Das Client-System kann konventionelle Komponenten, wie zum Beispiel einen Prozessor, einen Speicher (z. B. RAM), einen Bus, der mit dem Prozessor und dem Speicher verbunden ist, eine Massenspeichervorrichtung (z. B. eine magnetische Festplatte oder eine optische Speicherplatte), die mit dem Prozessor und dem Speicher über eine I/O-Steuereinrichtung (Eingabe/Ausgabe- Steuereinrichtung) und eine Netzwerk-Schnittstelle wie zum Beispiel ein konventio­ nelles Modem, verbunden ist, beinhalten. Das Server-System kann ebenso konventionelle Komponenten, wie zum Beispiel einen Prozessor, einen Speicher (z. B. RAM), einen Bus, der mit dem Prozessor und dem Speicher verbunden ist eine Massenspeichervorrichtung (z. B. eine magnetische oder optische Platte), die mit dem Prozessor und dem Speicher durch eine I/O-Steuereinrichmng und eine Netzwerk-Schnittstelle, wie zum Beispiel ein herkömmliches Modem, verbunden ist, beinhalten. Ausgehend von der folgenden Beschreibung wird man begrüßen, daß die vorliegende Erfindung durch Software implementiert werden kann, die als ausführbare Befehle auf einem computerlesbaren Medium auf den Client- und Server-Systemen wie zum Beispiel jeweilig auf Massenspeichervorrichtungen oder jeweilig in Speichern bzw. internen Speichern gespeichert ist.
Um die Adressen von Resourcen auf dem Internet festzulegen, wird ein Uniform Resource Locator (URL) System bzw. ein System gemäß einer Methode zum Auffinden von Resourcen verwendet. Eine URL ist ein Beschreiber bzw. Descriptor, der speziell einen Typ einer Internetresource und seine Lokation bzw. seinen Ort festlegt. URLs weisen das folgende Format auf:
Protokoll://Domain.Adresse/Pfadname ("protocol://domain.adress/path_name")
Wobei "Protokoll" das Protokoll der Kommunikation zwischen dem Server und dem Client festlegt. Auf Web-Dokumente wird häufig über das "http"-Protokoll (Hypertexttransfer-Protokoll) zugegriffen. Andere Protokolle beinhalten "ftp" (Dateiübertragungs-Protokoll bzw. "file transmission protocol"), Gopher, "Telnet". Die "Domain.Adresse" definiert die Domainnamen-Adresse des Computerservers, auf der sich die Resource befindet. Schließlich legt "Pfadname" einen Verzeichnis­ pfad innerhalb des Dateisystems des Servers fest, der die Resource oder genauer eine Kennung bzw. einen Identifizierer oder eine Anforderungen bzw. Abfrage identifiziert. Der am weitesten rechts gelegene Name des Pfadnamenabschnitts ist üblicherweise der Name einer tatsächlichen Datei, er kann aber auch Schlüsselwert- Paare beinhalten, die von dem Server verwendet werden, um Dokumente "im laufenden Betrieb" bzw. "on the fly" zu erzeugen. Durch Übereinkunft enden viele Web-Seiten mit dem Suffix ".html", was anzeigt daß es sich bei der Datei um ein HTML-Dokument bzw. ein Dokument in der Sprache zur Auszeichnung von Hypertext ("HyperText Markup Language document") handelt.
Ein Beispiel für eine URL für ein Web-Dokument ist folgendes:
http://info.tech.ch/hypertext/Data/WWW/llistory.html
Diese URL zeigt an, daß durch die Verwendung des HTTP-(Web)Protokolls, um einen Server zu erreichen, der "info.tech.ch" genannt wird, es ein Verzeichnis "hypertext/Data/WWW" gibt, das ein Hypertextdokument beinhaltet, das den Namen "History.html" beinhaltet. Resourcen sind auf dem Internet durch ihre URL adressierbar.
Um auf ein Anfangs-Web-Dokument zuzugreifen, gibt der Benutzer die URL für ein Web-Dokument in ein Web-Browser-Programm ein. Der Web-Browser sendet dann eine HTTP-Anforderung an den Server, der das Web-Dokument aufweist, indem die URL verwendet wird. Der Web-Server antwortet auf die HTTP-Anforderung, indem er das angeforderte HTTP-Objekt an den Client sendet. In den meisten Fällen handelt es sich bei dem HTTP-Objekt um ein Einfachtext-(ASCII)Dokument, das Text (in ASCII) beinhaltet, das in "HyperText Markup Language" (HTML) geschrieben ist. Das HTML-Dokument beinhaltet üblicherweise Hyperlinks zu anderen Web- Dokumenten. Der Web-Browser zeigt das HTML-Dokument auf dem Bildschirm für den Benutzer an und die Hyperlinks zu den anderen Web-Dokumenten werden in einer gewissen Art und Weise hervorgehoben, so daß der Benutzer die Hyperlinks identifizieren und auswählen kann.
Verwendung einer Faxmaschine als Web-Client
Fig. 1 zeigt eine Ausführungsform der vorliegenden Erfindung. Fig. 1 ist ein Blockdiagramm einer Ausführungsform des Systems der vorliegenden Erfindung. Nimmt man Bezug auf Fig. 1, so ist ein Faxgerät 101 mit einer Überleiteinrichtung bzw. einer Schnittstelle zwischen zwei Kommunikationssystemen (im folgenden "Gateway" genannt) 102 über eine Telefonleitung 104 verbunden. Die Gateway 102 ist ebenso mit dem Internet 105 oder einem anderen Netzwerk oder einer anderen Dokumentenresource bzw. Dokumentenquelle verbunden, die einen Zugang zum Web 103 bereitstellt.
Bei einer Ausführungsform arbeitet das Faxgerät 101 als ein typisches Faxgerät gemäß dem Stand der Technik. Das heißt, das Faxgerät 101 ist dazu in der Lage, Faxübertragungen zu senden und zu empfangen, indem Telefonleitungen 104 verwendet werden. Ebenso beinhaltet das Faxgerät 101 einen Abtastmechanismus bzw. einen Scanner, um Dokumente abzutasten, wie zum Beispiel ein Dokument 106, das danach über die Telefonleitung 104 übertragen wird. Das Faxgerät 101 beinhaltet ebenso eine Druckmaschine, um einen Ausdruck bzw. Hardcopy- Darstellungen der empfangenen Facsimileübertragungen, wie zum Beispiel ein Dokument 107 zu erzeugen.
Bei der vorliegenden Erfindung bildet die Gateway 102 eine Schnittstelle zwischen dem Faxgerät 101 und dem Web 103 (über das Internet 105). Bei einer Ausführungs­ form weist die Gateway 102 ein Computersystem oder eine Workstation auf, die mit einer Telefonleitung 104 über Fax-Modems gekoppelt sind, die im Stand der Technik gut bekannt sind. Die Funktionalität und eine beispielhafte Implementation der Gateway 102 wird im folgenden beschrieben. Die Gateway 102 ist nicht darauf beschränkt eine Schnlttstelle nur mit einem Faxgerät (102) zu bilden, sondern sie kann eine beliebige Anzahl von Faxgeräten unterstützen. Jedoch kann die Gateway 102 durch die Anzahl von Dokumentbeschaffungs-Anfragen oder Publikations-Anforderungen beschränkt sein, die zu jeder beliebigen Zeit unterstützt werden können.
Das Web 103 beinhaltet mehrere Server und Maschinen die mit der Gateway 102 über das Internet 105 verbunden sind. In Bezug auf das Web 103 sollte bemerkt werden, daß die vorliegende Erfindung nicht darauf beschränkt ist Dokumente auf dem "World Wide Web" oder dem "Internet" zu suchen oder darüber zu beschaffen. Die Lehre der vorliegenden Erfindung kann auf vielfältige Netzwerke, Daten- und Vorlagenspeicher und Archiviereinrichtungen oder andere Typen von Client/Server- Systemen angewendet werden, die auf Anfrage Dokumente oder andere Information zur Verfügung stellen.
Das System der vorliegenden Erfindung erfordert nicht ein Faxgerät, solange das System Komponenten und Vorrichtungen beinhaltet, die eine Funktionalität bereitstellen können, die durch das Faxgerät bereitgestellt wird. Diese Funktionen beinhalten, die Fähigkeit Dokumente auszutauschen, und zwar in dem eine Version eines Dokuments empfangen wird und eine andere Version gesendet wird und die Fähigkeit ein Dokument durch die Erzeugung eines Bitmap oder einer anderen Anzeige des Dokuments anzusehen. Aber es gibt keine Beschränkung auf diese Funktionen.
Dokumentsuche
Die vorliegende Erfindung stellt eine Suche nach Dokumenten auf dem Web über ein Faxgerät bereit. Bei der vorliegenden Erfindung wirkt die Gateway 102 als ein Server.
Fig. 2A ist ein Flußdiagramm, das die Verarbeitung eines Dokument-Beschaf­ fungssystems erläutert, das durch den Benutzer des Faxgeräts 101 gemäß der vorliegenden Erfindung durchgeführt wird. Nimmt man Bezug auf Fig. 2A, so beginnt der Benutzer den Prozeß, indem die Kommunikation zwischen dem Faxgerät 101 und dem Gateway 102 (Verarbeitungsblock 201) ausgelöst wird. Bei einer Ausführungsform erstellt der Benutzer eine Kommunikation mit der Gateway 102, indem eine Facsimileübertragung eines spezifischen Dokuments (z. B. Dokument 106) zu der Gateway 102 gesendet wird. Bei einer Ausführungsform handelt es sich bei dem Dokument 106 um eine leere Seite. Bei einer anderen Ausführungsform kann das Dokument 106 Information beinhalten, um die Gateway 102 in die Lage zu versetzen, das Dokument zu identifizieren.
Infolge der Herstellung einer Verbindung mit der Gateway 102 empfängt der Benutzer ein Dokument, wie zum Beispiel das Dokument 107 von der Gateway 102, das aus dem Faxgerät 101 in einem Hardcopy-Format ausgegeben wird (Ver­ arbeitungsblock 202). Das erste Dokument, das von dem Benutzer von der Gateway 102 empfangen wurde, wird hierin als Home Page bzw. Heim-Seite bezeichnet. Das Dokument kann mehrere Seiten aufweisen.
Andere Verfahren zum Herstellen einer Verbindung, um das Dokument zu empfangen, können verwendet werden. Zum Beispiel kann ein Individuum verbal oder anderweitig einen Operator des Gateway 102 benachrichtigen, um anzufordern, daß das Dokument zu dem Benutzer des Faxgeräts 101 gesendet wird. Das Dokument kann automatisch oder zum Beispiel durch einen anderen Benutzer des Web gesendet werden. In ähnlicher Weise kann ein automatischer Service (z. B. tägliche elektronische Zeitung) den Benutzer benachrichtigen, wenn eine bestimmte Seite sich ändert. Bemerkenswert ist ebenso, daß der Benutzer das Dokument durch eine andere Einrichtung, zum Beispiel durch Post, Luftservice und/oder einem anderen Lieferservice oder einer anderen Lieferung erhalten werden kann oder auch ihm das Dokument von einem anderen gegeben wurde.
Wenigstens eine Seite (oder ein Abschnitt) des Dokuments, das von der Gateway 102 empfangen wurde, stellt ein Suchformular dar, das durch einen Benutzer ausgefüllt wird, um eine Suche zu spezifizieren. Bei einer Ausführungsform beinhaltet das Formular eine oder mehrere Rahmen bzw. Boxen oder andere spezifizierte Orte bzw. Stellen, in die die Suchterme geschrieben werden können. Bei einer Ausführungs­ form stellt das Suchformular eine Seite dar, die verschiedene Boxen bzw. Rahmen beinhaltet. Jeder der verschiedenen Boxen bzw. Rahmen kann ein unterschiedlicher Typ von Abfrage oder Suche zugeordnet werden. Ein Beispiel einer derartigen Seite wird in Fig. 3 gezeigt. Nimmt man Bezug auf Fig. 3, so beinhaltet das Suchformular zwei Sätze von Boxen, einen Satz 301 für eine Suche, bei der beide Termen (einer in jeder Box) in einem lokalisierten Dokument sein muß und der andere Satz 302 für eine Suche, in dem einer der beiden Suchterme in einem Dokument sein kann, um für das Dokument die Suche zu erfüllen. Das Suchformular beinhaltet ebenso eine Auflistung von Datenbasen 303, in denen die Suche stattfinden soll. Bei einer Ausführungsform kann jede Anzahl von Datenbasen für die Suche ausgewählt werden. Bemerkenswert ist, daß bei einer Ausführungsform eine derartige Datenbasen-Auflistung nicht verwendet wird und alle Datenbasen oder eine vorbestimmte Anzahl von Datenbasen (wie durch die Gateway vorausgewählt) gesucht werden. Eine Auswahl einer Datenbasis kann durch eine Markierung (z. B. Einkreisen, Unterstreichen oder Durchkreuzen, durch die Plazierung einer Kontrolle oder einer anderen unterscheidungsfähigen Marke nahe bei oder darauf), und zwar betreffend die zu durchsuchende Datenbasis. Eine Auswahl kann durchgeführt werden, indem der Strichkode unterhalb jeder Datenbasis, der sie identifiziert, anstelle des Namens der Datenbasis markiert wird.
Jede der Boxen bzw. der Rahmen und jedes Element in der Liste der Datenbasen beinhaltet einen Strichkode als ein identifizierbares Muster, um eine Information auf dem Suchformular zu lokalisieren, wenn eine Erkennung durchgeführt wird, wie im folgenden diskutiert wird.
Bemerkenswert ist, daß die Verwendung von Boxen oder Rahmen oder anderen vorab spezifizierten Stellen für Suchterme lediglich die Erkennung erleichtert, die später durchgeführt wird. Bei einer alternativen Ausführungsform können Suchterme an jeder Stelle auf einer Seite bzw. auf Seiten plaziert werden und die vorliegende Erfindung erhält die Suchterme, indem zum Beispiel nach Schlüsselwörtern oder vorbestimmten erkennbaren Mustern gesucht wird (z. B. Unterstreichungen bzw. Bildunterschriften, Strichkodes etc.).
Nimmt man Bezug auf Fig. 2A, so füllt der Benutzer das Suchformular aus (Verarbeitungsblock 203).
Wenn einmal das Suchterm auf dem Formular geschrieben oder gedruckt worden ist, übernimmt das ausgefüllte Formular die Rolle eines Dokuments 106 und wird zu der Gateway 102 gefaxt (Verarbeitungsblock 204). Die Gateway 102, die als ein Server dient, identifiziert die Suchterm-Stellen (z. B. die Box oder die Datenbasis-Stellen) (Verarbeitungsblock 205). Bei einer Ausführungsform identifiziert ein Detektor in der Gateway 102 die Box-Stellen, indem die Strichkodes auf dem Dokument 106 lokalisiert werden. Bemerkenswert ist, daß die Gateway 102 automatisch alle Dokumente, die sie empfängt nach Suchterm-Stellen durchsuchen kann, und zwar ungeachtet, ob es sich bei derartigen Dokumenten um Suchformulare handelt. Nur wenn die Suchterm-Stellen gefunden werden, wird eine darauffolgende Suche durchgeführt.
Nachdem die Box-Stellen identifiziert wurden, detektiert die vorliegende Erfindung das Schreiben in den Boxen (Verarbeitungsblock 206). Bei einer Ausführungsform detektiert die vorliegende Erfindung das Schreiben, indem die räumliche Intensitätsvarianz untersucht wird. Boxen bzw. Rahmen mit Text darin werden einen hohen Mittelwert und einen hohen Grad an Varianz zwischen dem Pixelwerten innerhalb der Box aufweisen. Boxen, die keinen Text bzw. keine Schrift aufweisen, werden eine sehr geringe Varianz und einen geringen Mittelwert aufweisen. Der Mittelwert und die Varianz für alle Pixel in der Box können gemaß der folgenden Gleichung berechnet werden:
P = Pixelintensitätswert, "Mean" steht für "Mittelwert"
N = Anzahl der Pixel, "Variance" steht für "Varianz"
j variiert über alle Pixel
Bei der alternativen Ausführungsform detektiert die vorliegende Erfindung den Text, indem ein vordefinierter Satz von Merkmalen untersucht wird. Verschiedene "Interessen"-Operatoren (z. B. morphologische Operatoren) können verwendet werden. Der einfachste würde nach verbundenen Komponenten (z. B. benachbarte Pixel mit "Ein"-Werten) schauen. Boxen, die einen Text in sich aufweisen, werden viele verbundene Komponenten bzw. Verbindungskomponenten aufweisen, die eine relativ große Anzahl von Pixeln in jeder Komponente aufweisen. Boxen ohne einen Text bzw. ohne Geschriebenes darin, werden sehr wenig verbundene Komponenten bzw. Verbindungskomponenten aufweisen (z. B. die meisten Pixel sind "aus") und jene Komponenten werden sehr wenig Pixel aufweisen (Pixel "ein", die auf Rauschen zurückzuführen sind, weisen wahrscheinlich keine "Ein"-Nachbarn auf).
Bezüglich jeder Box, in der Text bzw. Geschriebenes detektiert wurde, extrahiert die Gateway 102 der vorliegenden Erfindung Bitmaps von jenen Boxen (Verarbeitungs­ block 207) und übergibt eine Bitmap-Version des Inhalts der Box zu einer Maschine zur optischen Zeichenerkennung bzw. zu einer OCR-Maschine, die eine Erkennung bezüglich des Bitmaps durchführt (Verarbeitungsblock 208). Bei einer Ausführungs­ form weist die Erkennungsmaschine eine Maschine zur Erkennung von hand­ geschriebenen Zeichen bzw. eine HCR-("handwriting character recognition") Maschine auf.
Bei einer Ausführungsform können die Datenbasen, die ausgewählt werden, indem das Suchformular markiert wird, durch die Gateway 102, wie sie später beschrieben wird, identifiziert werden, und zwar auf dieselbe Art und Weise, in der die spezifischen Dokumente von den Suchergebnissen in der vorliegenden Erfindung ausgewählt wurden. Bei einer Ausführungsform werden die markierten Regionen auf dem Suchformular extrahiert, die erzielte Information (z. B. Strichkodes) wird dekodiert und die Datenbasis wird identifiziert, indem die dekodierte Information verwendet wird. Bei einer Ausführungsform handelt es sich bei dem Extraktions­ prozeß um denselben, der durch die vorliegende Erfindung verwendet wird, wenn Dokumente identifiziert werden, die aus dem Suchergebnis ausgewählt sind. Dieser Prozeß wird im folgenden beschrieben.
Als nächstes erzeugt die Gateway 102 der vorliegenden Erfindung einen Abfrage- String bzw. eine Abfrage-Zeichenkette, indem die erkannten Wörter und/oder Charakter verwendet werden (Verarbeitungsblock 209). Bei einer Ausführungsform weist die Abfrage, die durch die vorliegende Erfindung erzeugt wird, eine http- Abfrage (z. B. eine URL) auf, wie jene, die durch bildschirmbasierte Browser erzeugt werden.
Eine Beispiel-URL lautet wie folgt:
http://www.yahoo.com/bin/search?p=keyword
wobei das "Keyword" bzw. das "Schlüsselwort" durch die Erkennungsmaschine extrahiert wird. Falls es mehrere Schlüsselwörter gibt, dann würden "p=keyword"- Abschnitte in die URL eingeschlossen werden, die durch einen Identifizierer bzw. eine Kennung aus einem oder mehreren Charaktern getrennt sind (z. B. der Charakter "?").
Als nächstes wird eine Suche durchgeführt (Verarbeitungsblock 210). Während die Gateway 102 als Client auf dem Web arbeitet, verwendet sie die URL, um andere Server auf dem Web zu kontaktieren, und sie fragt Dokumente, die in der Abfrage­ URL entsprechen, ab. Der Server 103 verarbeitet die Abfrage (gut bekannt in der Fachwelt) und gibt zu der Gateway 102 URLs und eine andere Information ab, die passenden Dokumenten entspricht. Diese andere Information kann zum Beispiel einen Titel, Zusammenfassungen, Dokumentenlänge, Format, Firmeninformation, Information über die Biographie des Autors, Information über einen in Beziehung stehenden Standort, etc. beinhalten. Bemerkenswert ist, daß die vorliegende Erfindung mit anderen Zeigern oder Dokumentkennungen bzw. Dokumentidentifizie­ rern neben den URLs verwendet werden kann.
Bei einer Ausführungsform erzeugt die Gateway 102 ein Dokument und gibt es wieder, das die Suchergebnisse beinhaltet (mit speziellen Strichkodes für Verbindun­ gen) und sendet das wiedergegebene Dokument zu dem Faxgerät 101 über das Faxmodem zurück (Verarbeitungsblock 211). Bei einer anderen Ausführungsform beschafft die Gateway 102 verschiedene oder alle passenden Dokumente (indem die URLs verwendet werden), gibt diese Dokumente wieder und gibt sie zu dem Faxgerät 101 zurück.
Eine zusätzliche Verarbeitung kann verwendet werden, um die Anzahl der zurückgegebenen Dokumente zu beschränken, um die Dokumente nach ihrer Relevanz zu ordnen oder alle Dokumente von einem Standort zu gruppieren bzw. zusammenzufassen. Ergebnisse können basierend auf der Geschichte bzw. Historie, der Ähnlichkeit, usw. gefiltert werden. Zum Beispiel kann die Gateway 102 eine Liste oder eine Datenbasis von Dokumenten behalten, die zu einer bestimmten Faxnummer gesendet worden sind und nicht erneut zu der Faxnummer irgendwelche passenden Dokumente von der gegenwärtigen Abfrage zu senden, wodurch die Zeit und Material (Papier, Toner etc.) gespart wird, die bzw. das mit im Spiel wäre, wenn ein Dokument gesendet wird, das der Benutzer bereits erhalten hat. Eine derartige Liste oder Datenbasis bzw. Datenbank kann auf der oder durch die Gateway 102 aufrechterhalten werden. In ähnlicher Weise kann die Gateway 102 nur eines jener Dokumente (z. B. das allgemeinste oder eines mit dem kürzesten Pfad) senden, falls die Suchergebnisse verschiedene Dokumente von dem selben Standort beinhalten. Natürlich gibt es viele andere Merkmale und Filtermechanismen, um das Ergebnis zu filtern, bevor das Dokument bzw. die Dokumente über das Fax zurückgegeben werden.
Die Suchergebnisse können ein Dokument mit einer zusätzlichen Suchbox beinhalten, um die Abfrage zu verfeinern oder zu modifizieren. Die Gateway 102 kann ebenso Terme der Originalabfrage des Benutzers modifizieren oder welche addieren. Zum Beispiel falls "thinking" als ein Schlüsselwort erkannt wurde, kann die Gateway ebenso sowohl "think" als auch "thinking" als Suchterme verwenden (oder irgendeine Ableitung oder alle Ableitungen eines Wortes) verwenden.
Ebenso, falls die Suche scheitert (kein Dokument wird zurückgegeben oder zuwenig Dokumente werden zurückgegeben oder zuviele Dokumente werden zurückgegeben), könnte die Gateway 102 die Suche modifizieren, indem Schlüsselwörter (oder andere Kriterien) addiert oder gelöscht werden und die Abfrage wieder ausführen. Falls zum Beispiel zuwenige Dokumente oder gar kein Dokument zurückgegeben wird, kann eine Suchabfrage, die zwei oder mehr Terme benötigt, modifiziert werden, um nur einen Untersatz oder wenige Untersätze von den zwei oder mehr Termen benötigen (z. B. die Änderung von "UND"-Operatoren in der Suchabfrage in "ODER"- Operatoren). In ähnlicher Weise kann die Suchabfrage modifiziert werden, falls eine Suche zuviele Dokumente erzeugt, indem die Anforderung gestellt wird, daß mehrere Suchterme in jedem Dokument sind, anstatt daß Dokumente zugelassen werden, die nur einen Untersatz jener Terme aufweisen (z. B. die Änderung irgendeines "ODER"- Operators in einen "UND "-Operator).
Die Gateway 102 kann dem Benutzer über ein Faxgerät 101 eine Liste von aktualisierten modifizierten Suchvorgängen senden, aus denen der Benutzer wählen kann. Bei einer Ausführungsform ähnelt die Liste der Auflistung von Datenbanken in Fig. 3 und eine bestimmte Suche oder bestimmte Suchvorgänge können auf dieselbe Art und Weise ausgewählt werden, wie jene Datenbanken gewählt wurden, wie zum Beispiel durch das Markieren (Einkreisen) eines maschinenlesbaren Kodes (z. B. Strichkode) oder durch das Schreiben einer Zahl oder eines Buchstabens, der mit einer bestimmten Suche bei einer gewissen Stelle auf der Seite mit der Auflistung in Beziehung steht. Es kann ein Platz für den Benutzer vorgesehen sein, um eine eigene modifizierte Suche bereitzustellen. Bemerkenswert ist ebenso, daß die Liste möglicher Abfragen bzw. Suchvorgänge die Anzahl von Dokumenten, die jede der möglichen Suchvorgänge erfüllen, anzeigen. Dies kann dem Benutzer helfen, zu entscheiden, welche Suche er auswählt.
Bemerkenswert ist, daß der Sucher immer Terme zu dem Originalformular addieren kann und sie erneut senden kann.
Fig. 2B zeigt den Suchvorgang. Nimmt man Bezug auf Fig. 2B, so weist ein Suchformular 210 einen Suchterm "Ricoh" auf, der in die Box 210A geschrieben ist.
Das Suchformular 210 wird in das Faxgerät 201 eingegeben und zu der Gateway 102 gesendet. Der Detektor 214 identifiziert den Text "Ricoh" und sendet Bitmaps des Textes zu der HCR-Maschine 212. Die Ergebnisse, die durch die HCR-Maschine 212 erzeugt werden, werden von der Suchmaschine 213 verwendet, die die Suche ausführt. Die Suchergebnisse werden dann über das Faxgerät 101 zurückgegeben.
Bei einer Ausführungsform sendet die Gateway 102, die als ein Web-Client agiert, die Suchabfrage zu einem oder mehreren Servern. Die Gateway 102 kann Suchterme den Server oder den Servern auf eine Vielfalt von Weisen bereitstellen. Zum Beispiel kann die Gateway 102 ein "get"-Verfahren bzw. "Bekommen" -Verfahren ausführen, bei dem die Suchterme in der URL kodiert sind und ihr Vorhandensein wird durch einen oder mehrere addierte abgesetzte Charakter bzw. Zeichen (z. B. das Zeichen "?") hervorgehoben. Der Server empfängt die URL und analysiert diese syntaktisch um die Suchterme zu lokalisieren (über die hinzugefügten abgesetzten Charakter). Wenn einmal die Suchterme aus der URL dekodiert worden sind erzeugt der Server eine Abfrage von den Suchtermen und führt die Suche in einer Art und Weise durch, die in der Fachwelt gut bekannt ist. Bei einer anderen Ausführungsform sendet die Gateway 102 eine URL zu einem Server oder zu mehreren Servern, um eine Verbindung auszulösen und um die Server bzw. den Server zu veranlassen, in einen Modus einzutreten, in dem er auf Suchterme wartet. Wenn einmal die Verbindung errichtet worden ist, stellt die Gateway 102 die Suchterme dem Server bzw. den Servern bereit. Ein Server empfängt die Suchterme, erzeugt automatisch eine Suchabfrage und führt die Suche durch. Dies wird als "Post"-Operation bezeichnet.
Bei einer anderen Ausführungsform weist die Suchmaschine 213 ein Programm auf, das auf der Gateway 102 läuft und daß eine Datenbank bzw. Datenbasis (ausgehend von den gegebenen Standorten) nach den extrahierten Schlüsselwörtern durchsucht. Die Datenbank befindet sich typischerweise bei der Gateway 102. Dies ist jedoch nicht erforderlich. Die Gateway 102 braucht nur irgendwelche Mittel, um die Datenbank bzw. die Datenbanken oder auf die Information über ihren Inhalt zuzugreifen. Fig. 2C zeigt die Kommunikation zwischen Client und Server im allgemeinen. Eine derartige Kommunikation findet zwischen der Gateway und mehreren Servern in dem Web statt. Nimmt man Bezug auf Fig. 2C, so gibt der Client 401 der vorliegenden Erfindung eine Anfrage (/Anfrage/Datei.html bzw. "/request/file.html") an den Web-Server 402 der unter dem Domainnamen "Name.org" bekannt ist. Der Web-Server 402 sendet das Dokument an den Clienten 401. Das gesendete Dokument beinhaltet einen Kopftext und ein HTML-Dokument, das in ASCII formartiert ist.
Fig. 2D zeigt eine Ausführungsform der Gateway 102. Nimmt man Bezug auf Fig. 2D, so werden Faxe von einem Faxmodem 302 in der Gateway 102 empfangen und gesendet. Faxmodem sind in der Fachwelt gut bekannt. Die empfangenen Faxe werden durch eine Parsereinheit 303, die die Suchterme extrahiert, syntaktisch bzw. grammatikalisch analysiert. Indem die extrahierten Suchterme verwendet werden, erzeugt der URL-Generator 304 URLs und gibt die URLs als Abfragen an den Web-Client 305 weiter bzw. sendet diese an ihn. Der Web-Client 305 sendet die Abfragen an die Server über das Internet.
Der Web-Client 305 empfängt Dokumentdaten, die über das Internet zurückgegeben werden. Die Dokumentdaten können Zeiger zu Dokumenten aufweisen, die die Suchabfrage erfüllen bzw. befriedigen. Optional kann die Gateway 102 eine zusätzliche Verarbeitungs- und Filtereinheit 306 beinhalten, die mit den Dokument­ daten arbeitet bzw. auf diese einwirkt die durch den Web-Clients 305 empfangen wurden, und zwar wie oben beschrieben wurde. Eine derartige Verarbeitung kann Suchergebnisse von den Antworten mehrerer Server kombinieren. Die Verarbeitung kann ebenso ein Bewertungssystem beinhalten, durch die die Gateway 102 bestimmt, wie eng die Ergebnisse mit der Suchabfrage übereinstimmen. Sie kann zusätzlich eine Verarbeitungslogik beinhalten, durch die jene Suchergebnisse, die nicht so gut übereinstimmen, gelöscht bzw. nicht beachtet werden. Die sich ergebenden Dokumentdaten (von dem Web-Client 305 oder von einer zusätzlichen Ver­ arbeitung/Filterung 306) werden durch die Dokumentrückgabeeinheit 307 übergeben bzw. zurückgegeben. Die zurückgegebenen Dokumente werden zu dem Faxmodem 302 gesendet, das die Dokumente zu einem Faxgerät oder zu mehreren Faxgeräten faxt.
Jede der Einheiten in der Fig. 2D kann als Hardware, Software oder als eine Kombination aus beiden implementiert sein. Bei einer Ausführungsform kann die Parsereinheit 303, der URL-Generator 304, der Web-Client 305, die zusätzliche Verarbeitungs- und Filtereinheit 306 und die Dokumentrückgabeeinheit 307 in Software implementiert sein, die auf der Gateway 102 läuft. Bemerkenswert ist, daß Hardware innerhalb der Gateway 102, die jede der Komponenten unterstützt, in der Fachwelt gut bekannt ist und Pufferspeicher, Kommunikationsempfangs- und Übertragungshardware etc. beinhaltet.
Dokumentbeschaffung
Fig. 4 ist ein Flußdiagramm, das den Prozeß der Dokumentbeschaffung erläutert, die von dem Benutzer des Faxgeräts 101 gemäß der vorliegenden Erfindung durchgeführt wird. Nimmt man Bezug auf Fig. 4, so beginnt der Benutzer den Prozeß, indem die Kommunikation zwischen dem Faxgerät 101 und der Gateway 102 ausgelöst wird (Verarbeitungsblock 401), und zwar in derselben Art und Weise, wie oben beschrieben, wobei die Dokumente bzw. das Dokument die bzw. das sich aus den Suchergebnissen bzw. dem Suchergebnis ergibt zu dem Benutzer gesendet wird (Verarbeitungsblock 402).
Die Suchergebnis-Dokumente bzw. das Suchergebnis-Dokument, das von der Gateway 102 empfangen wird, beinhaltet Verbindungen zu den Dokumenten, die die Suchkriterien erfüllen und können für den Benutzer beschafft werden. Bei einer Ausführungsform handelt es sich bei den Verbindungen bzw. Links um Hypertext- Links bzw. Hypertext-Verbindungen. Die Links werden kodiert und in maschinenles­ bare Information auf dem Dokument formatiert. Die maschinenlesbare Information kann in digitaler Form sein, wie zum Beispiel ein Strichkode oder Digitalpapier ("digital paper"). Ein Ausführungsbeispiel dafür ist in dem US-Patent 5,337,362 beschrieben, das den Titel trägt "Method and Apparatus for Placing Data Onto Plain Papier" und das am 9. August 1994 veröffentlicht wurde und dem Anmelder der vorliegenden Erfindung übertragen wurde. Andere Typen von Kodierung können bei der vorliegenden Erfindung verwendet werden, solange eine Identifikation und Selektion von Verbindungen möglich sind.
Bei einer Ausführungsform beinhaltet das Suchergebnis-Dokument, das von der Gateway 102 empfangen wird, maschinenlesbare Information, die die Hypertext-Links oder "hot spots" anzeigt, die mit einem Kreis umgeben werden können bzw. eingekreist werden können, um weitere Dokumente zu beschaffen. Bei einer Ausführungsform ist die maschinenlesbare Information unter einem Bild oder einem Textabschnitt plaziert. Auf diese Art und Weise ist es dem Benutzer klar bewußt welche Verbindungen bzw. Links aktiv sind. Die maschinenlesbare Information kann auf den Universal Resource Locator (URL) der angelinkten Dokumente, die beschafft werden sollen, hinweisen. Die URL identifiziert und lokalisiert das Dokument auf dem World Wide Web und ist in der Fachwelt gut bekannt. Ein Beispieldokument, das einen Text mit Strichkodes zeigt die Links unter dem Text in dem Dokument darstellen, ist in Fig. 5 gezeigt. Bei einer alternativen Ausführungsform können Ikons verwendet werden, um die Links darzustellen. Viele Ikons können auf eine einzige Seite passen und die Ikons selbst könnten maschinenlesbare URL-Information beinhalten.
Der Benutzer wählt eine oder mehrere Links aus dem Dokument, indem er auf jene Dokumente hinweist, die gewünscht sind (Verarbeitungsblock 403). Bei einer Ausführungsform wählt der Benutzer einen Link auf dem Dokument, indem der Link mit einem Kreis umgeben wird. Jegliche Art und Weise, mit der ein Link eingekreist oder markiert wird, stellt ein Mittel zur Auswahl jenes Links dar und kann gemäß der vorliegenden Erfindung verwendet werden. Zum Beispiel kann ein Quadrat oder eine andere Form um einen Link gezeichnet werden, um ihn auszuwählen.
Bei einer alternativen Ausführungsform kann das Dokument eine spezielle Eingabestelle (z. B. eine Box) aufweisen, in die der Benutzer die gewünschten Links oder Dokumente oder andere Informationen schreibt, um die gewünschten Dokumente zu identifizieren. Zum Beispiel kann das Dokument ein Formular mit Eingabeboxen für den Benutzer beinhalten, um Auswahlkriterien bzw. die Auswahl dort hinein zu schreiben. Bemerkenswert ist, daß in diesem Fall die Gateway 102 eine gewisse Art von Zeichenerkennung bzw. Charaktererkennung durchführen kann, um die Auswahl bzw. die Auswahlkriterien zu bestimmen.
Bei einer Ausführungsform kann ein Link ausgewählt werden, indem Zahlen eingegeben werden, die mit jedem Link auf einem Tastaturfeld verbunden sind, wie zum Beispiel das Tastaturfeld des Faxgeräts 101.
Nimmt man Bezug auf Fig. 5, so wird eine der Links von dem Benutzer ausgewählt, indem der Strichkode, der dem Link entspricht, mit einem Kreis umgeben wird bzw. eingekreist wird. Bemerkenswert ist, daß der Text oder die Grafiken, die den Link begleiten, nicht eingekreist werden müssen oder anderweitig ausgewählt werden müssen. Ein Benutzer kann eine beliebige Anzahl von Links auf dem Dokument auswählen. Mit anderen Worten kann der Benutzer jede Anzahl von Strichkodes mit einem Kreis umgeben, die in dem Dokument enthalten sind.
Der Vorgang der Auswahl kann sowohl ein Hervorheben eines Teils eines Bildes (zum Beispiel das Einkreisen eines Links) als auch das Plazieren einer Markierung auf einer bestimmten Stelle des Bildes beinhalten. Basierend auf sowohl der Hervorhebung als auch der Stelle der Markierung kann ein Dokument oder können mehrere Dokumente beschafft werden.
Nach der Auswahl führt der Benutzer das Dokument in das Faxgerät 101 ein und faxt das Dokument zu der Gateway 102 (Verarbeitungsblock 404), die wiederum das Dokument von irgendwo in der Welt über das World Wide Web 103 oder über eine sonst irgendwie elektronisch zugängliche Quelle beschafft und faxt die zurückgegebe­ nen Versionen der abgefragten Dokumente zu dem Faxgerät 101 oder zu irgendeiner anderen elektronisch zugänglichen Quelle.
Das Faxgerät 101 erzeugt Hardkopien der beschafften Dokumente, die von der Gateway 102 gefaxt wurden (Verarbeitungsblock 405). Der Benutzer kann weitere Information beschaffen, indem er Links bzw. Verknüpfungen auswählt (z. B. einkreist), und zwar auf den neu empfangenen Dokumenten, und indem er dann die Verarbeitungsblöcke 404 und 405 wiederholt.
Die Gateway 102 empfängt und verarbeitet Facsimileübertragungen, die von dem Faxgerät 101 empfangen wurden und die eine Dokumentbeschaffungsabfrage beinhalten. Die Gateway 102 erfüllt die Abfragen bzw. die Anforderungen, indem sie Dokumente beschafft, die den Links entsprechen, die auf dem Dokument ausgewählt wurden. Die Verarbeitung der Verarbeitungslogik der Gateway 102, um die Dokumentbeschaffungsabfrage zu empfangen und ausgehend von den Suchergeb­ nissen auszufüllen, ist durch das Flußdiagramm in Fig. 6 gezeigt.
Die Verarbeitungslogik der Gateway 102 fängt an, wenn der Benutzer ein Dokument mit eingekreisten bzw. umkreisten Links bzw. Verknüpfungen (z. B. Hypertext etc.) zu der Gateway 102 faxt. Nimmt man Bezug auf Fig. 6, so empfängt die Gateway 102 anfänglich das Faxbild, zum Beispiel über ein Faxmodem (Verarbeitungsblock 601), wie zum Beispiel das Bild von dem Dokument, das in Fig. 5 gezeigt ist.
Nach dem Empfang des Faxes bestimmt die Gateway 102 den Lokalisie­ rer/Identifizierer (z. B. die URL) des Dokuments bzw. der Dokumente, die ausgehend von dem gefaxten Bild beschafft werden sollen (Verarbeitungsblock 602).
Die Gateway 102 führt die Bestimmung durch, indem die maschinenlesbare Information extrahiert wird, die von dem Benutzer ausgewählt wird. Bei einer Ausführungsform extrahiert die Gateway 102 die ausgewählten Links, indem eine Erkennungstechnik und eine digitale Dekodiertechnik verwendet wird, die in der Fachwelt gut bekannt ist. Eine Ausführungsform des Extraktionsprozesses, der von der Gateway 102 durchgeführt wird, wird unten in Verbindung mit Fig. 7 beschrieben.
Bei einer Ausführungsform wird ein "Strichkode" oder ein "eindimensionales digitales Papier" ("one-dimensional digital papier") verwendet, das bezüglich der Auflösungsdifferenzen zwischen unterschiedlichen Bitmap-Darstellungen des Bildes unempfindlich ist. Die Strichkodes ("bar codes") weisen alternierend schwarze und weiße Stellen auf. Die Information ist in den relativen Lauflängen des schwarzen enthalten. Jeder Kode beginnt mit einem speziellen Marker einer schwarzen Stelle, die von einer weißen Stelle gefolgt wird, die von einer anderen schwarzen Stelle gefolgt wird, wobei die Länge der weißen Stelle in etwa der Länge jeder der umgebenden schwarzen Stellen gleich ist. Ein darauffolgender Lauf von schwarz wird mit der mittleren Länge der Läufe in der Startsequenz verglichen und als ein Vielfaches jeder Länge interpretiert. Eine Endsequenz, die der Startsequenz ähnelt, wird für einen gültigen Kode benötigt. Jeglicher langer Lauf in weiß vor der Endsequenz wird den Kode ungültig machen. Da der maschinenlesbare Kode auf den relativen Längen der Läufe basiert, ist er hinsichtlich der Auflösung unempfindlich und kann schnell in einem einzigen Durchgang durch das Bild berechnet werden. Dickere Kodes (z. B. die Höhe) geben eine Redundanz hinzu und machen ihn gegenüber einem Versatz und gegenüber Rauschen unempfindlich.
Wenn das Dokument zum Beispiel ein Formular aufweist, kann an die Gateway 102 die Anforderung gestellt werden, eine Erkennung auf bestimmten Gebieten oder Boxen auf dem Bild durchzuführen, um das zu beschaffende Dokument zu identifizieren. Die Gateway 102 kann ebenso Markierungen (z. B. "x" etc.) lokalisieren müssen, die auf dem Dokument von dem Benutzer plaziert werden und die einen Teil des Dokumentauswahlprozesses darstellen.
Indem der Lokalisierer/Identifizierer verwendet wird, beschafft die Gateway 102 die gewünschten Dokumente über das Internet 105 (Verarbeitungsblock 603). Bemer­ kenswert ist, daß die Gateway 102 ebenso veranlaßt werden kann, Markierungen zu verwenden (z. B. "x"), die sich auf dem Bild zusammen mit dem Lokalisie­ rer/Identifizierer befinden, um ein Dokument zu beschaffen. In einem derartigen Fall wird ein anderes Dokument gesendet, falls die Markierung an einer anderen Stelle vorgenommen wird, obwohl der Lokalisierer/Identifizierer derselbe ist. Dies fügt ein Schlüsselwertpaar zu der URL hinzu, die die Gateway von einem Web-Server abfragt und das die x-, y-Position der Markierung in dem Bild beinhaltet.
Wenn einmal das gewünschte Dokument erhalten worden ist, erzeugt die Gateway 102 ein Bild eines jeden Dokuments, um es zu dem Benutzer zu übertragen (Verarbeitungsblock 404). Bei einer Ausführungsform erzeugt die Gateway 102 Bilder, und zwar in dem die Dokumente nach der Syntax analysiert werden, formatiert werden und übergeben bzw. zurückgegeben werden. Das syntaktische Analysieren des Dokuments ("parsing") sowie das Formatieren und Zurückgeben der syntaktisch analysierten Dokumente, beinhaltet die Konversion bzw. Umwandlung von Dokument-Identifizierern/Lokalisierern, die mit den beschafften Dokumenten in Beziehung stehen, in einen maschinenlesbaren Kode (z. B. einen Strichkode, digitales Papier, etc.), die in die Bilder mit aufgenommen werden sollen, die zu dem Benutzer gefaxt werden (um eine Auswahl von zusätzlichen Dokumenten durch einen Benutzer zu ermöglichen). Das Zurückgeben ist bei den meisten Dokumenten notwendig, um die Daten von einem ASCII-Format in ein Raster-Bitmap, das Protokoll, das von Faxgeräten (und anderen Markiermaschinen) verwendet wird, umzuwandeln.
Wenn einmal das Bild erzeugt worden ist, sendet die Gateway 102 das Bild über das Fax zu dem Benutzer (Verarbeitungsblock 605). Nach dem Empfang der beschafften Dokumente von der Gateway 102, kann der Benutzer zusätzliche Dokumente für die Beschaffung, wie oben beschrieben, auswählen. Auf diese Art und Weise kann ein Faxgerät jegliches Dokument auf dem Web beschaffen, ohne daß er über einen Internetanschluß verfügen muß.
Die Gateway 102 kann nicht nur eine angeforderte Seite zurückgeben sondern sie kann ebenso alle oder manche Seitenzahlen zurückgeben, auf die durch jene Seite hingewiesen wurde. Auf der anderen Seite kann die Gateway 102 Seiten, die sehr lang sind, aufspalten und nur einen Teil der Seite zusammen mit einer Verknüpfung zu dem Rest zurückgeben.
Fig. 7 zeigt eine Ausführungsform des Extraktionsprozesses, der durch die Gateway 102 der vorliegenden Erfindung durchgeführt wird. Nimmt man Bezug auf Fig. 7, so extrahiert die Gateway 102 anfänglich eingekreiste bzw. umkreiste Regionen von dem gefaxten Bild, das über sein Faxmodem bzw. über seine Faxmodems empfangen wurde (Verarbeitungsblock 701). Bei einer Ausführungsform werden die umkreisten bzw. eingekreisten Regionen extrahiert, indem das ganze Bild mit Ausnahme der umkreisten Bereiche mit einer einzigen Farbe bemalt wird (z. B. schwarz). Somit verbleibt nur die maschinenlesbare Information (z. B. die Strichkodes), die eingekreist ist, nachdem das Bild bemalt wurde. Ein Beispiel eines bemalten Bilds ist in Fig. 8 zu sehen.
Dann durchsucht die Verarbeitungslogik der Gateway 102 das Dokument nach eingekreisten Bereichen (nicht bemalte Bereiche), und zwar basierend auf der Farbe der Pixel, bis die eingekreisten Bereiche erhalten bzw. gefunden wurden.
Nachdem die eingekreisten Bereiche extrahiert wurden, wird die Information rekodiert, um die Identifizierer/Lokalisierer-URL zu bestimmen (Verarbeitungsblock 702). Somit werden die Strichkodes oder andere maschinenlesbare Kodes, die auf dem empfangenen, gefaxten Bild eingekreist sind, dekodiert, um einen Kode zu produzieren.
Indem der Kode verwendet wird, erzielt die Gateway 102 den Identifizie­ rer/Lokalisierer (z. B. URL) (Verarbeitungsblock 703). Bei einer Ausführungsform weist der Kode den Identifizierer/Lokalisierer (z. B. die URL). Bei einer alternativen Ausführungsform wird der Kode, der sich aus der Dekodierung ergibt, die durch die Gateway 102 durchgeführt wurde, von der Gateway 102 als ein Zeiger auf eine Speicherstelle, Liste oder Tabelle verwendet, auf die zugegriffen werden kann und die den Identifizierer, Lokalisierer enthält. Als einen Zeiger kann der Kode einen ersten Abschnitt beinhalten, der einem Zeiger auf die Liste oder Tabelle darstellt, und einen zweiten Abschnitt beinhalten, der den Eintrag in der Liste oder Tabelle anzeigt, die den Identifizierer/Lokalisierer beinhaltet. Bemerkenswert ist, daß bei einer Ausführungsform alle Identifizierer/Lokalisierer auf der Oberseite des gefaxten Bildes erscheinen, wobei der Kode anzeigt, welche der aufgelisteten Identifizie­ rer/Lokalisierer der Benutzer ausgewählt hat.
Eine Ausführungsform der Gateway der vorliegenden Erfindung
Eine Ausführungsform der Gateway der vorliegenden Erfindung umfaßt ein Computersystem und eine Workstation mit wenigstens einem Prozessor, einem Speicher mit wahlfreiem Zugriff und einem Bus, und sie betreibt ein Betriebssystem usw. Fig. 9 ist ein Blockdiagramm einer Ausführungsform des Computersystems, das die Lehren der vorliegenden Erfindung verkörpern kann. Nimmt man Bezug auf Fig. 9, so umfaßt das Computersystem 900 einen Bus oder eine andere Kommuni­ kationseinrichtung 901, um Information zu übermitteln und einen Prozessor 902, der mit dem Bus 901 zur Informationsverarbeitung verbunden ist.
Das System 900 weist weiter einen Speicher mit wahlfreiem Zugriff (RAM) oder eine andere dynamische Speichervorrichtung 904 (Hauptspeicher genannt) auf, die mit dem Bus 901 zur Speicherung von Information und Befehlen, die durch den Prozessor 902 ausgeführt werden sollen, verbunden ist. Der Hauptspeicher 904 kann ebenso zum temporären Speichern von Variablen oder anderen Zwischeninformatio­ nen während der Ausführung von Befehlen durch den Prozessor 902 verwendet werden. Das Computersystem 900 weist ebenso einen Nur-Lesespeicher (ROM) und/oder andere statische Speichervorrichtungen 906 auf, die mit dem Bus 901 zum Speichern statischer Information und von Befehlen für einen Prozessor 902 verbunden sind, und sie weist eine Datenspeichervorrichtung 907, wie zum Beispiel eine magnetische Platte oder eine optische Platte und ihr entsprechendes Disketten­ laufwerk bzw. Plattenantriebseinrichtung auf. Die Datenspeichervorrichtung 907 ist mit dem Bus 901 zum Speichern von Informationen und Befehlen verbunden.
Das Computersystem 900 weist ebenso Faxmodems 940 und eine Internetverbindung 941 auf. Bei der Internetverbindung 941 kann es sich um eine lokale Gebiets­ verbindung (z. B. Ethernet) bzw. um ein lokales Netzwerk handeln oder es kann sich um eine ISDN-Leitung handeln. Bei einer anderen Ausführungsform können sich bei der Internetverbindung 941 um ein Modem handeln, das ein PPP oder ein SLIP betreibt. Die vorliegende Erfindung ist nicht auf eine Verwendung mit dem Internet beschränkt und somit kann die Verbindung 941 für eine Verbindung mit jedem beliebigen Netzwerk verwendet werden, indem die TCP/IP oder andere Protokolle verwendet werden, mit denen ein "Router" verbunden ist, der eine Verbindung mit einem anderen Netzwerk ermöglicht. Die zwei Netzwerke bilden ein "Inter-Netzwerk". Das Internet bezieht sich auf das größte weltweite Set von derartig verbundenen Netzwerken, das Information zwischen ihnen hin und her übertragen kann. Mögliche Verfahren zur Verbindung mit einem Netzwerk beinhalten eine physikalische Kommunikationsverbindung, wie zum Beispiel Ethernet, ISDN, Modem- und Telefonleitungen oder drahtlose Modems und TCP/IP, SLIP oder PPP-Software.
Das Computersystem 900 kann weiter verschiedene Eingabe-/Ausgabe-Periphergerä­ te, wie zum Beispiel eine Anzeigevorrichtung, wie zum Beispiel eine Kathoden­ strahlröhre (CRT) oder eine Flüssigkristallanzeige (LCD) beinhalten, die mit einem Bus 901 verbunden ist, um Information einem Computerbenutzer anzuzeigen. Eine alphanumerische Eingabevorrichtung, die alphanumerische oder andere Tasten mit einschließt, kann ebenso mit dem Bus 901 verbunden sein, um Information und eine Befehlsauswahl zu einem Prozessor 902 zu übermitteln. Eine zusätzliche Benutzer­ eingabevorrichtung ist die Cursorsteuerung, wie zum Beispiel eine Maus, ein Trackball, eine Schreibnadel bzw. ein stiftähnliches Abtastgerät ("Stylus") oder Cursorrichtungstasten, die mit dem Bus 901 verbunden sind, um eine Richtungs­ information und eine Befehlsauswahl zu dem Prozessor 902 zu übermitteln und um eine Cursorbewegung auf einer Anzeige zu steuern. Eine andere Vorrichtung, die mit dem Bus 901 verbunden sein kann, ist eine Hardcopy-Vorrichtung, die verwendet werden kann, um Befehle, Daten oder andere Informationen auf einem Medium, wie zum Beispiel Papier, Film oder ähnlichen Typen von Medien zu drucken.
Bemerkenswert ist es, daß irgendeine oder alle der Bestandteile des Systems 900 und eine zugeordnete Hardware verwendet werden kann; jedoch kann es begrüßt werden, daß jeglicher Typ von Konfiguration des Systems für vielfältige Zwecke, wie sie der Benutzer benötigt, verwendet werden kann.
Der Benutzer oder Kunde braucht nur ein Faxgerät zu haben, das mit der Gateway der vorliegenden Erfindung gekoppelt ist, die einen Austausch von Dokumenten (über Telefonleitungen) erlaubt.
Als eine Gateway kann das Computersystem 900 der vorliegenden Erfindung verschiedene Software ablaufen lassen, um eine Vielfalt von Funktionen durch­ zuführen. Bei einer Ausführungsform läßt das Computersystem 900 eine Internet­ kommunikations-Protokollsoftware ablaufen, wie zum Beispiel TCP/IP, die bei den Fachleuten gut bekannt ist. Das Computersystem 900 läßt ebenso eine Faxmodem- Treibersoftware ablaufen, die verwendet wird, um Faxe zu senden und zu empfangen. Es läßt auch Hypertext-Transferprotokoll-(HTTP)Serversoftware ablaufen, wie zum Beispiel CERN- oder NCSA-Serversoftware, die in der Fachwelt gut bekannt ist. Die Steuersoftware ist ebenso von dem Computersystem 900 ausgeführt, um gefaxte Bilder, wie oben beschrieben, handzuhaben. Das Computer­ system 900 kann ebenso eine Charakter-Erkennungssoftware sowie eine Bitmap-Extraktions- und Verarbeitungssoftware ausführen. Ebenso führt das Computersystem 900 Software (z. B. HTTP-Clientsoftware) aus, um einen Identifizierer/Lokalisierer (z. B. eine URL) zu beschaffen und sie für ein Faxgerät geeignet zu formatieren.
Bei einer Ausführungsform beschafft die Software, die auf dem Computersystem 900 läuft, die Rückruf-Telefonnummer, um zu bestimmen, wohin die beschafften Dokumente zurückgegeben werden sollen. Die Telefonnummer kann ebenso während des Quittungsaustausches bzw. des "Handshaking" erhalten werden, wobei die Software sie in ein Tiff-Bild mit einbringt. Bei einer alternativen Ausführungsform verbleibt das Faxgerät in Verbindung mit der Gateway (also verbleibt daran angeschlossen), während das Dokument beschafft und dann zurückgesendet wird.
Bei einer Ausführungsform beschneidet die Software, die auf dem Computersystem 900 läuft, während der Bildverarbeitung die Ränder des Bildes, identifiziert, welche aktiven Regionen eingekreist wurden, füllt jene Gebiete des Bildes auf, die nicht eingekreist wurden, lokalisiert und analysiert syntaktisch jeglichen verbleibenden Identifizierer, der maschinenlesbar ist, und zwar bezüglich jeder maschinenlesbaren Papiermarke, die dekodiert ist, und findet die entsprechende URL in einer Datenbasis bzw. Datenbank von URLs, die zu dem Benutzer gesendet worden ist.
Bemerkenswert ist, daß bei einer Ausführungsform jedes Dokument einer einzigen ID zugewiesen wird, wenn sie über die Gateway zurückgegeben wird. Diese ID wird am oberen Ende des Dokuments gedruckt und spezifiziert den Rahmen einer Datei, die die Abbildung bzw. das Zuordnen ("mapping") zwischen den maschinenlesbaren Kodes und den URLs beinhaltet bzw. hält.
Nach der Verarbeitung des Bildes übergibt das Computersystem 900 jede URL und die Rückruftelefonnummer zu der Beschaffungs- und Rückgabesoftware. Die Beschaffungs- und Rückgabemaschine beschafft die URL, analysiert das Dokument syntalltisch und gibt es (einschließlich des digitalen Papiers) zurück, aktualisiert die Datenbank des Dokumentidentifizierers und sendet das zurückgegebene Dokument über Fax zu der Rückruftelefonnummer.
Die Beschaffungs- und Rückgabesoftware beschafft die URL und wandelt jede URL in dem beschafften Dokument in eine globale bzw. weltweite URL um, die eine volle Spezifikation des Orts des Links bzw. der Verbindung beinhaltet.
Bei einer Ausführungsform wandelt die Software das beschaffte Dokument, das sich in einem HTML-Format befindet, in ein PostScript-Format oder direkt in ein G3- Faxformat um. Die In-Line-Bilder werden ebenso beschafft und in PostScript konvertiert, um in dem Dokument mit aufgenommen zu werden. Bemerkenswert ist, daß bei dieser Ausführungsform eine HTML-Quelle in ein "LaTEX"-Format umgewandelt wird. Das heißt, die HTML-Quelle wird in eine Quelle für das LaTEX- Dokument-Formatiersystem umgewandelt. Die LaTEX-Quelle beinhaltet Befehle, um die digitalen Papiermarken zu erzeugen. Die Software, die auf dem Computersystem 900 läuft, weist Link-Zahlen bzw. Verknüpfungszahlen jedem Link zu und beinhaltet die geeigneten LaTEX-Befehle in einer LaTEX-Quellendatei, um jene Kodes in einem maschinenlesbaren Format zu drucken. Bemerkenswert ist, daß eine Marke erzeugt wird, um das Dokument zu identifizieren, und als ein Kopf auf jeder Seite gedruckt wird. Die Software speichert ebenso eine Liste von Kodes und die URLs in einer temporären Datei. Die maschinenlesbaren Identifizierer werden erzeugt und der maschinenlesbare Kode wird unter dem Text gedruckt. Die Software, die auf dem Computersystem 900 läuft, erzeugt dann ein PostScript-Bild, in dem zum Beispiel LaTEX-dvips verwendet werden.
Bei LaTEX handelt es sich um ein Makropaket für Tex, einem Softwareprogramm, das von Donald Knuth bei der Stanford University, Palo Alto, Kalifornien geschrieben worden ist. LaTEX erzeugt "dvi" (vorrichtungsunabhängige bzw. "device independent") Aufgaben, ausgehend von der LaTEX-Quelle. Diese kann in PostScript übersetzt werden, in dem "dvips" verwendet wird, ein Softwareprogramm, das von Thomas Rokicki bei der Stanford University, Palo Alto, Kalifornien, geschrieben wurde. Alle diese Programme sind in der Fachwelt gut bekannt.
Zusammengefaßt kann jedes Dokument auf dem World Wide Web über die Gateway der vorliegenden Erfindung beschafft werden. Alles was der Benutzer braucht, ist eine Telefonnummer des Gateways der vorliegenden Erfindung. Eine Gateway kann ein regionales Gebiet bedienen oder es kann sich um eine Proxy-Maschine für alle ihr bekannten Faxgeräte handeln.
Weiter kann jede Seite eine gewisse zusätzliche maschinenlesbare Information beinhalten. Bei einer Ausführungsform identifiziert eine Marke pro Seite die Seite und ein Bit der maschinenlesbaren Information wird unter jeder aktiven Verknüpfung bzw. unter jedem aktiven Link gedruckt. Somit kann eine URL-Bezugnahme auf eine robuste, seitenunabhängige Art und Weise durchgeführt werden.
Schließlich kann es sich bei einer modifizierten Version der Gateway um eine Fax- Verbesserungs- oder Austausch- bzw. Ersatzmaschine handeln, die einzelne Personen direkt verwenden können. Diese Maschine wäre in der Lage eine Schnittstelle zu dem Internetprotokoll direkt bereitzustellen und würde einen Internetzugriffspunkt direkt anrufen, wenn sie aufgefordert wird, ein Web-Dokument zu beschaffen. In diesem Fall wäre ein Vorteil eine starke Vereinfachung des Zugriffs zu dem World Wide Web (und) in dem die Basisfunktionen des Faxgeräts verwendet werden. Bemerkenswert ist, daß zusätzlich zu dem Web-Zugriff eine derartige Maschine einen E-mail-Zugriff bereitstellen könnte.
Die Erfindung betrifft insbesondere eine Vorrichtung (insbesondere eine Gateway), die an ein öffentliches (digitales oder analoges) Telefonnetz (oder ein ähnliches Netz) und an ein Netzwerk, insbesondere das Internet anschließbar ist und in beide Netze Daten abgeben und davon empfangen kann. Die Vorrichtung bzw. die Gateway weist vorzugsweise eine Einrichtung auf, um über das Telefonnetz empfangene Faxnach­ richten bzw. Faxinformationen nach Suchanforderungen bzw. -anfragen zu durchsuchen bzw. zu analysieren und die Suchanforderungen somit festzustellen, und eine Einrichtung, um aufgrund der festgestellten Suchanforderungen bzw. Suchan­ fragen eine Suche in dem Netzwerk durchzuführen und aus dem Netzwerk Suchergebnisse zu beschaffen. Schließlich weist die Vorrichtung bzw. die Gateway vorzugsweise eine Einrichtung auf, die so ausgebildet ist, daß sie die beschafften Suchergebnisse über das Telefonnetz (oder ein ähnliches Netz) an ein Faxgerät senden kann.
Die Erfindung läßt sich beispielsweise wie folgt zusammenfassen:
Während Web-Server und Web-Clients, wie zum Beispiel Mosiac. die Tür für eine On-Line-Veröffentlichung und für eine On-Line-Benutzung von Information geöffnet haben, können diese Dienste nur von denjenigen genutzt werden, die einen Internetanschluß haben. Mit anderen Worten einzelne Personen, die keinen Internetanschluß mit einem Computer und einem Datenkanal zum Internet haben, können nicht nach Dokumenten oder anderen Quellen bzw. Resourcen suchen, die über das Web verfügbar sind. Die vorliegende Erfindung erhält bzw. verschafft Dokumente, indem eine Faxübertragung eines Dokuments mit wenigstens einem Suchterm empfangen wird und indem eine Suche, basierend auf den Suchtermen, die sich auf dem empfangenen Dokument befinden, durchgeführt wird. Insbesondere betrifft sie eine Vorrichtung und ein Verfahren zum Empfangen der Faxübertragung und zum Durchführen der Suche.
Bezugszeichenliste Fig. 2A
201 - erstelle Kommunikation zwischen dem Faxgerät und der Gateway
202 - empfange Dokument(e) von Gateway
203 - fülle Suchformular aus
204 - faxe Formular zu der Gateway
205 - identifiziere Suchtermstellen
206 - detektiere Text bzw. Geschriebenes in Suchtermstellen
207 - extrahiere Bitmap von Suchtermstellen
208 - führe Charaktererkennung mit extrahierten Bitmaps durch
209 - erzeuge Abfrage-String, basierend auf erkannten Charaktern
210 - führe Suche unter Verwendung der Abfrage durch
211 - gebe Suchergebnisse zurück
Fig. 4
401 - erstelle Kommunikation zwischen dem Faxgerät und der Gateway
402 - empfange Dokument(e) von Gateway
403 - wähle Links entsprechend dem (den) gewünschten Dokument(en) aus
404 - faxe Dokument zur Gateway
405 - empfange gewünschte(s), von der Gateway beschaffte(s) und gefaxte(s) Dokument(e)
Fig. 6
601 - empfange ein Fax vom Benutzer
602 - bestimme Identifizierer/Lokalisierer von zu beschaffenden Dokumenten
603 - beschaffe gewünschte Dokumente, indem Identifizierer/Lokalisierer verwendet werden
604 - erzeuge ein Bild von jedem der beschafften Dokumente
605 - sende Faxübertragung von erzeugten Bildern
Fig. 7
701 - extrahiere eingekreiste Bereiche von empfangenem Faxbild, um maschinenles­ bare Info zu erzeugen
702 - dekodiere erhaltene Information
703 - bestimme Identifizierer/Lokalisierer, basierend auf dekodierter Information.

Claims (29)

1. Verfahren zum Erhalten bzw. Verschaffen von Dokumenten, das die folgenden Schritte aufweist:
eine Faxübertragung eines Dokuments mit einem Suchterm wird empfangen;
und
eine Suche, basierend auf wenigstens diesen einen genannten Suchterm wird in Antwort auf das Dokument durchgeführt.
2. Verfahren nach Anspruch 1, das weiter den Schritt aufweist, wonach die Suchergebnisse über eine Faxübertragung gesendet werden.
3. Verfahren nach Anspruch 2, bei dem der Schritt des Sendens von Suchergebnissen das Senden wenigstens eines Dokuments umfaßt.
4. Verfahren nach Anspruch 2 oder 3, bei welchem der Schritt des Sendens von Suchergebnissen das Senden von einer Quelle bzw. Resource oder mehreren Quellen bzw. Resourcen umfaßt, und zwar entsprechend dem genannten wenigstens einem Suchterm.
5. Verfahren nach Anspruch 2, bei welchem der Schritt des Sendens von Suchergeb­ nissen die folgenden Schritte aufweist:
ein Dokument wird gesendet, das einen Satz von Resourcen auflistet, die dem wenigstens einem Suchterm entsprechen;
das Dokument wird empfangen, das einen Satz oder mehrere Sätze von hervorgehobenen Resourcen aufweist;
die hervorgehobenen Resourcen werden auf dem Dokument identifiziert:
die hervorgehobenen Resourcen werden erhalten bzw. verschafft; und
die hervorgehobenen Resourcen werden über Faxübertragung gesendet.
6. Verfahren nach Anspruch 1, das weiter die Schritte aufweist:
Stellen von Suchtermen werden auf dem Dokument identifiziert;
Geschriebenes bzw. Text wird bei den Stellen detektiert, die als die Stellen identifiziert sind, die Suchterme beinhalten;
eine Erkennung wird bezüglich der Suchterme durchgeführt: und
eine Suchabfrage wird basierend auf den erkannten Suchtermen erzeugt.
7. Verfahren nach Anspruch 6, bei welchem der Schritt der Identifizierung von Stellen die Lokalisierung von Strichkodes auf dem Dokument aufweist.
8. Verfahren nach Anspruch 6, bei welchem der Schritt der Identifizierung von Stellen von Suchtermen, die Lokalisierung von wenigstens einer Box auf dem Dokument, das einen Suchterm oder mehrere Suchterme aufweist, umfaßt.
9. Verfahren nach Anspruch 6, bei welchem der Schritt der Durchführung einer Erkennung, den Schritt umfaßt, wonach ein Bitmap einer Suchstelle einer Erkennungsmaschine bereitgestellt wird bzw. der Erkennungsmaschine zugeführt wird.
10. Verfahren nach Anspruch 9, bei welchem der Schritt der Durchführung einer Erkennung, den Schritt der Durchführung einer Handschrifterkennung aufweist.
11. Verfahren nach Anspruch 1, das weiter den Schritt der Modifizierung einer Suchabfrage umfaßt, die eine Fuzzy-Anpassung verwendet.
12. Verfahren nach Anspruch 2, das weiter den Schritt aufweist, wonach die Ergebnisse, basierend auf einer Metrik, gefiltert werden.
13. Verfahren nach Anspruch 12, bei welchem der Schritt, wonach Ergebnisse gefiltert werden, das Entfernen von Duplikaten aus den Suchergebnissen umfaßt.
14. Verfahren nach Anspruch 1, bei welchem die Suche erzeugt wird, indem eine URL erzeugt wird und ein Dokument beschafft wird, das mit einer URL von einem Web-Server in Beziehung steht.
15. Verfahren zum Erhalten von Dokumenten, das die folgenden Schritte aufweist:
Bitmaps werden aus Suchstellen auf einem Dokument extrahiert, das über eine Faxübertragung empfangen wird;
die Bitmaps werden zu einer Erkennungsmaschine übergeben, von der eine Ausgabe erzeugt wird;
eine erste Netzwerk-Suchmaschine wird mit einer Abfrage abgefragt, die auf der Ausgabe basiert; und
Suchergebnisse werden gesendet.
16. Verfahren nach Anspruch 15, das weiter den Schritt aufweist, wonach eine zweite Netzwerk-Suchmaschine mit der Abfrage abgefragt wird, und Antworten von der ersten und der zweiten Netzwerk-Suchmaschine in den Suchergebnissen korreliert werden.
17. System zum Suchen nach Dokumenten auf einem Netzwerk, das folgendes aufweist:
ein Faxgerät;
eine Überleiteinrichtung bzw. eine Gateway, die mit dem Faxgerät und dem Netzwerk verbunden ist, wobei die Gateway folgendes aufweist:
eine Erkennungsmaschine, die angeschlossen ist, um Bitmaps als Eingabe zu empfangen, wobei eine Ausgabe der Erkennungsmaschine wenigstens ein Suchformu­ lar bzw. eine Suchform aufweist;
eine Suchmaschine, die angeschlossen ist, um die wenigstens eine Suchform bzw. das wenigstens eine Suchformular von der Erkennungsmaschine zu empfangen,
wobei die Suchmaschine eine Ausgabe von Suchergebnissen aufweist, die auf Suchtermen auf dem wenigstens einem Suchformular basiert.
18. System, das im Anspruch 17 definiert ist, bei welchem die Suchmaschine an dem Faxgerät angeschlossen ist und bei welchem das Faxgerät ein Dokument ausgibt, das die Suchergebnisse aufweist.
19. System, das im Anspruch 18 definiert ist, bei welchem das Dokument, das Suchergebnisse aufweist, eine Liste von Dokumenten beinhaltet.
20. System nach Anspruch 18, das weiter eine Dokumentbeschaffungseinheit aufweist, die angeschlossen ist, um das Dokument zu empfangen, das Suchergebnisse aufweist, wobei eine Ausgabe der Dokumentbeschaffungseinheit ein Dokument oder mehrere Dokumente aufweist, die in dem Dokument ausgewählt wurden, das Suchergebnisse aufweist.
21. System nach Anspruch 20, bei welchem die Dokumentbeschaffungseinheit an das Faxgerät angeschlossen ist und bei dem weiter das Dokument, das Suchergebnisse aufweist, mittels der Dokumentbeschaffungseinheit von dem Faxgerät empfangen wird.
22. System, das im Anspruch 20 festgelegt ist, bei welchem die Dokument­ beschaffungseinheit an das Faxgerät angeschlossen ist und bei welchem weiter eine Eingabe des Faxgeräts ein Dokument oder mehrere Dokumente von der Dokument­ beschaffungseinheit aufweist, wobei das Faxgerät das eine Dokument oder die mehreren Dokumente sendet.
23. System nach Anspruch 17, bei welchem die Erkennungsmaschine eine Handschrifterkennungsmaschine aufweist.
24. System nach Anspruch 17, bei welchem die Suchmaschine eine HTTP-Suchmaschine aufweist.
25. System nach Anspruch 17, bei welchem die Gateway weiter einen Schreibdetek­ tor aufweist, der angeschlossen ist, um eine elektronische Version einer Suchform von dem Faxgerät zu empfangen, und bei welchem eine Ausgabe des Detektors weitere Bitmaps von Suchtermen in der elektronischen Version der Suchform bzw. des Suchformulars aufweist.
26. System nach Anspruch 25, bei welchem der Detektor Stellen von Suchtermen auf der elektronischen Version der Suchform bzw. des Suchformulars identifiziert und Geschriebenes bzw. Text bei den identifizierten Stellen detektiert.
27. System nach Anspruch 26, bei welchem der Detektor Bitmaps der identifizierten Stellen ausgibt, bei denen Geschriebenes bzw. Text detektiert wurde.
28. System nach Anspruch 26, bei welchem der Detektor Stellen identifiziert, indem Strichkodes auf der elektronischen Version des Suchformulars bzw. der Suchform lokalisiert werden.
29. Apparat zum Suchen von Dokumenten, der folgendes aufweist:
eine Einrichtung zum Empfangen einer Form bzw. eines Formulars von einem Faxgerät;
eine Einrichtung zum Extrahieren von Bitmaps von Stellen auf der Form;
eine Einrichtung zum Durchführen einer Erkennung auf dem Bitmap;
eine Einrichtung zum Abfragen eines Netzwerks mit einer Abfrage, die auf einer Ausgabe von der Einrichtung zur Durchführung der Erkennung basiert; und
eine Einrichtung zum Zurückgeben von Suchergebnissen.
DE19715696A 1996-04-16 1997-04-15 Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird Pending DE19715696A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/632,681 US5873077A (en) 1995-01-13 1996-04-16 Method and apparatus for searching for and retrieving documents using a facsimile machine

Publications (1)

Publication Number Publication Date
DE19715696A1 true DE19715696A1 (de) 1997-11-06

Family

ID=24536492

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19715696A Pending DE19715696A1 (de) 1996-04-16 1997-04-15 Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird

Country Status (2)

Country Link
US (1) US5873077A (de)
DE (1) DE19715696A1 (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19811407A1 (de) * 1998-03-16 1999-09-23 Cit Alcatel Verfahren zum Empfang von Faxnachrichten anstelle eines Faxgerätes eines Teilnehmers sowie Faxempfangseinrichtung, Server und Vermittlungsstelle hierzu
DE19737826C2 (de) * 1996-09-03 1999-12-23 Dci Datenbank Fuer Wirtschafts Internet-Server und Verfahren zum Bereitstellen einer Web-Seite
EP1014676A2 (de) * 1998-12-15 2000-06-28 DeTeMobil Deutsche Telekom MobilNet GmbH Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax
DE19957895C1 (de) * 1999-11-19 2001-06-21 Guideguide Ag System und Verfahren zum Erstellen von Kleinanzeigen im Internet sowie Set für ein System der vorgenannten Art
KR100308262B1 (ko) * 1997-12-31 2001-10-19 구자홍 인터넷예약검색및저장장치및방법

Families Citing this family (167)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6678864B1 (en) * 1992-02-25 2004-01-13 Irving Tsai Method and apparatus for linking designated portions of a received document image with an electronic address
US6026429A (en) * 1995-06-07 2000-02-15 America Online, Inc. Seamless integration of internet resources
US7562392B1 (en) 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
ATE311728T1 (de) 1995-12-11 2005-12-15 Hewlett Packard Co Verfahren zur versorgung von fernmeldediensten
GB9603582D0 (en) 1996-02-20 1996-04-17 Hewlett Packard Co Method of accessing service resource items that are for use in a telecommunications system
DE69635386T2 (de) 1995-12-11 2006-06-22 Hewlett-Packard Development Co., L.P., Houston Verfahren zum Bereitstellen von Telekommunikationsdiensten
WO1997022212A1 (en) 1995-12-11 1997-06-19 Hewlett-Packard Company Method of accessing service resource items that are for use in a telecommunications system
JPH09269914A (ja) * 1996-03-29 1997-10-14 Fujitsu Ltd クライアント・サーバシステムにおけるローカルファイル転送方法及びシステム
JP3478681B2 (ja) * 1996-10-07 2003-12-15 株式会社リコー 文書情報管理システム
US6016307A (en) 1996-10-31 2000-01-18 Connect One, Inc. Multi-protocol telecommunications routing optimization
US6473404B1 (en) * 1998-11-24 2002-10-29 Connect One, Inc. Multi-protocol telecommunications routing optimization
US6754181B1 (en) 1996-11-18 2004-06-22 Mci Communications Corporation System and method for a directory service supporting a hybrid communication system architecture
US6690654B2 (en) 1996-11-18 2004-02-10 Mci Communications Corporation Method and system for multi-media collaboration between remote parties
US6335927B1 (en) 1996-11-18 2002-01-01 Mci Communications Corporation System and method for providing requested quality of service in a hybrid network
US6131095A (en) * 1996-12-11 2000-10-10 Hewlett-Packard Company Method of accessing a target entity over a communications network
US6731625B1 (en) 1997-02-10 2004-05-04 Mci Communications Corporation System, method and article of manufacture for a call back architecture in a hybrid network with support for internet telephony
US6070798A (en) * 1997-02-21 2000-06-06 Nethery; Kee Purchaser generated transaction recording and negotiable instrument payment system
US6366698B1 (en) * 1997-03-11 2002-04-02 Casio Computer Co., Ltd. Portable terminal device for transmitting image data via network and image processing device for performing an image processing based on recognition result of received image data
JP2959545B2 (ja) * 1997-03-25 1999-10-06 セイコーエプソン株式会社 画像情報入出力装置及び画像情報入出力装置の制御方法及び画像情報処理システム
US6163536A (en) * 1997-06-11 2000-12-19 International Business Machines Corporation Communication system including a client controlled gateway for concurrent voice/data messaging with a data server
JP3478725B2 (ja) * 1997-07-25 2003-12-15 株式会社リコー 文書情報管理システム
US6006217A (en) * 1997-11-07 1999-12-21 International Business Machines Corporation Technique for providing enhanced relevance information for documents retrieved in a multi database search
US6415278B1 (en) * 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6789080B1 (en) 1997-11-14 2004-09-07 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6272492B1 (en) * 1997-11-21 2001-08-07 Ibm Corporation Front-end proxy for transparently increasing web server functionality
US6381592B1 (en) * 1997-12-03 2002-04-30 Stephen Michael Reuning Candidate chaser
US6314422B1 (en) * 1997-12-09 2001-11-06 Chrysler Corporation Method for softlinking between documents in a vehicle diagnostic system
US6661933B1 (en) * 1998-01-13 2003-12-09 Matsushita Electric Industrial Co., Ltd. Apparatus and method for image data processing
US6167451A (en) * 1998-01-20 2000-12-26 Netscape Communications Corporation Multiple push protocol unifying system
US7098206B2 (en) * 1998-01-21 2006-08-29 Smithkline Beecham Corporation Pharmaceutically active morpholinol
JPH11249777A (ja) * 1998-02-27 1999-09-17 Toshiba Corp ドキュメント管理システムおよび同システムのドキュメント管理方法
US6348970B1 (en) * 1998-04-29 2002-02-19 Qwest Communications Int'l., Inc. Apparatus and method for interfacing a computer network to a facsimile machine
US6279013B1 (en) * 1998-07-20 2001-08-21 Xerox Corporation Interactive newspaper
US7010177B1 (en) * 1998-08-27 2006-03-07 Intel Corporation Portability of digital images
AU720645B2 (en) * 1998-10-02 2000-06-08 Citibank, N.A. System and method of using E-mail centered internet interaction
US6938033B1 (en) 1998-10-02 2005-08-30 Citibank, N.A. System and method of using e-mail centered internet interaction
US6845370B2 (en) * 1998-11-12 2005-01-18 Accenture Llp Advanced information gathering for targeted activities
US7003719B1 (en) 1999-01-25 2006-02-21 West Publishing Company, Dba West Group System, method, and software for inserting hyperlinks into documents
US6351747B1 (en) * 1999-04-12 2002-02-26 Multex.Com, Inc. Method and system for providing data to a user based on a user's query
US6341282B1 (en) * 1999-04-19 2002-01-22 Electronic Data Systems Corporation Information retrieval system and method
US6253198B1 (en) * 1999-05-11 2001-06-26 Search Mechanics, Inc. Process for maintaining ongoing registration for pages on a given search engine
US6501779B1 (en) * 1999-05-26 2002-12-31 Nxi Communications, Inc. Network communication system
US7640318B1 (en) * 1999-09-17 2009-12-29 Ricoh Co., Ltd. Method and apparatus for publishing documents over a network
US6823370B1 (en) 1999-10-18 2004-11-23 Nortel Networks Limited System and method for retrieving select web content
US7711738B1 (en) * 1999-11-15 2010-05-04 West Services, Inc. Method, system and computer-readable medium for accessing and retrieving court records, items and documents
US6597808B1 (en) 1999-12-06 2003-07-22 Matsushita Electric Industrial Co., Ltd. User drawn circled region extraction from scanned documents
US6867875B1 (en) 1999-12-06 2005-03-15 Matsushita Electric Industrial Co., Ltd. Method and apparatus for simplifying fax transmissions using user-circled region detection
US6690396B1 (en) * 1999-12-27 2004-02-10 Gateway, Inc. Scannable design of an executable
FR2805111B1 (fr) * 2000-02-11 2003-09-26 Sagem Procede pour l'execution d'une tache par un serveur informatique multitache, sur requete d'un terminal telephonique
DE50008829D1 (de) * 2000-02-15 2005-01-05 Siemens Ag Verfahren zur Uebermittlung einer Nachricht sowie Gateway
US7180638B1 (en) * 2000-02-16 2007-02-20 Ricoh Co., Ltd. Network fax machine using a web page as a user interface
WO2001063906A2 (en) * 2000-02-24 2001-08-30 Geoffrey Marshall Faxing paper documents to a plurality of address types
US6785670B1 (en) * 2000-03-16 2004-08-31 International Business Machines Corporation Automatically initiating an internet-based search from within a displayed document
US8023131B2 (en) * 2000-03-28 2011-09-20 Mongonet Method and system for combining separate digitized representations of documents for retransmission via computer network transfer protocols
US7079275B2 (en) * 2000-03-28 2006-07-18 Mongonet Method and system for facilitating paper to electronic communications
US7944573B2 (en) * 2000-03-28 2011-05-17 Mongonet Methods and apparatus for authenticating facsimile transmissions to electronic storage destinations
US6424426B1 (en) * 2000-03-28 2002-07-23 Mongonet Fax-to-email and email-to-fax communication system and method
US20090059271A1 (en) * 2000-03-28 2009-03-05 Mongonet Methods and apparatus for web-based status of facsimile transmissions to electronic storage destinations
US8023132B2 (en) * 2000-03-28 2011-09-20 Mongonet Method and system for transferring digitized representations of documents via computer network transfer protocols
US7746496B2 (en) * 2000-03-28 2010-06-29 Mongonet Method and system for pay per use document transfer via computer network transfer protocols
US7940411B2 (en) * 2000-03-28 2011-05-10 Mongonet Method and system for entry of electronic data via fax-to-email communication
US7826100B2 (en) * 2000-03-28 2010-11-02 Mongonet Methods and apparatus for facsimile transmissions to electronic storage destinations including embedded barcode fonts
US8045203B2 (en) * 2000-03-28 2011-10-25 Mongonet Methods and apparatus for secure facsimile transmissions to electronic storage destinations
US7817295B2 (en) * 2000-03-28 2010-10-19 Mongonet Method and system for modified document transfer via computer network transfer protocols
US8275100B2 (en) * 2000-03-28 2012-09-25 Mongonet Methods and apparatus for billing of facsimile transmissions to electronic storage destinations
US8035834B2 (en) * 2000-03-28 2011-10-11 Mongonet Methods and apparatus for manipulating and providing facsimile transmissions to electronic storage destinations
US8184318B2 (en) * 2000-03-28 2012-05-22 Mongonet Methods and apparatus for compositing facsimile transmissions to electronic storage destinations
US8045204B2 (en) * 2000-03-28 2011-10-25 Mongonet Methods and apparatus for facsimile transmissions to electronic storage destinations including tracking data
US20070236750A1 (en) * 2000-03-28 2007-10-11 Mongonet Methods and apparatus for facilitating facsimile transmissions to electronic storage destinations
US7755790B2 (en) 2000-03-28 2010-07-13 Mongonet Method and system for transferring sponsored digitized representations of documents via computer network transfer protocols
US6883001B2 (en) * 2000-05-26 2005-04-19 Fujitsu Limited Document information search apparatus and method and recording medium storing document information search program therein
US20010053252A1 (en) * 2000-06-13 2001-12-20 Stuart Creque Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store
US7573616B2 (en) * 2000-08-11 2009-08-11 Ctb/Mcgraw-Hill Llc Enhanced data capture from imaged documents
US6671706B1 (en) * 2000-08-12 2003-12-30 Keith Vinh Method and system for editing the content of a web site with a facsimile transmission
US6801932B1 (en) 2000-11-07 2004-10-05 Pitney Bowes Inc Method and system for remote retrieval of documents
US6744528B2 (en) 2000-11-30 2004-06-01 Pitney Bowes Inc. Method and system for remote printing of documents
US6654601B2 (en) 2000-11-30 2003-11-25 Pitney Bowes Inc. Method and system for remote retrieval of messages using spontaneous networking technology
US6972863B2 (en) * 2001-03-19 2005-12-06 Hewlett-Packard Development Company, L.P. Direct barcode printing from internet database
US20020198847A1 (en) * 2001-03-21 2002-12-26 Christer Fahraeus Communications services, methods and systems
US7392287B2 (en) * 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US6999204B2 (en) * 2001-04-05 2006-02-14 Global 360, Inc. Document processing using color marking
US6829605B2 (en) * 2001-05-24 2004-12-07 Microsoft Corporation Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval
US7113300B2 (en) * 2001-07-12 2006-09-26 Pitney Bowes Inc. Method and system for secure delivery and printing of documents
US7072473B2 (en) * 2001-07-12 2006-07-04 Pitney Bowes Inc. Method and system for secure delivery and retrieval of documents utilizing a facsimile machine
US6751732B2 (en) 2001-07-12 2004-06-15 Pitney Bowes Inc. Method and system for secure delivery and printing of documents via a network device
US8909595B2 (en) * 2001-08-01 2014-12-09 T-System, Inc. Method for entering, recording, distributing and reporting data
US7106470B2 (en) * 2001-08-10 2006-09-12 Hewlett-Packard Development Company, L.P. Direct printing from internet database
US7075668B2 (en) * 2001-08-10 2006-07-11 Hewlett-Packard Development Company, L.P. Direct printing from internet database
US6996235B2 (en) * 2001-10-08 2006-02-07 Pitney Bowes Inc. Method and system for secure printing of documents via a printer coupled to the internet
US7304757B2 (en) * 2001-12-21 2007-12-04 Hewlett-Packard Development Company, L.P. System and method for secure printing
US7333966B2 (en) * 2001-12-21 2008-02-19 Thomson Global Resources Systems, methods, and software for hyperlinking names
JP3997812B2 (ja) * 2002-03-28 2007-10-24 ブラザー工業株式会社 画像形成装置
US7640267B2 (en) 2002-11-20 2009-12-29 Radar Networks, Inc. Methods and systems for managing entities in a computing device using semantic objects
US7356768B1 (en) 2002-11-27 2008-04-08 Adobe Systems Incorporated Using document templates to assemble a collection of documents
US7242496B2 (en) * 2003-10-10 2007-07-10 Murata Kikai Kabushiki Kaisha Facsimile machine and data conversion device
AR047362A1 (es) 2003-12-31 2006-01-18 Thomson Global Resources Ag Sistemas, metodos, interfases y software para recoleccion automatizada e integracion de datos de entidades en bases de datos y directorios profesionales en linea.
US7433876B2 (en) 2004-02-23 2008-10-07 Radar Networks, Inc. Semantic web portal and platform
US7970171B2 (en) * 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8868555B2 (en) * 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US9373029B2 (en) * 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US7702673B2 (en) * 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8838591B2 (en) * 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US7669148B2 (en) * 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US8144921B2 (en) * 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8385589B2 (en) * 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US10192279B1 (en) 2007-07-11 2019-01-29 Ricoh Co., Ltd. Indexed document modification sharing with mixed media reality
US8600989B2 (en) * 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8856108B2 (en) * 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US7920759B2 (en) 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US8369655B2 (en) * 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8005831B2 (en) * 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US8184155B2 (en) * 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8176054B2 (en) * 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US8332401B2 (en) * 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8335789B2 (en) * 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8521737B2 (en) * 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8825682B2 (en) * 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US7885955B2 (en) * 2005-08-23 2011-02-08 Ricoh Co. Ltd. Shared document annotation
US8156116B2 (en) * 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8510283B2 (en) * 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8195659B2 (en) * 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US7917554B2 (en) * 2005-08-23 2011-03-29 Ricoh Co. Ltd. Visibly-perceptible hot spots in documents
US8276088B2 (en) * 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7991778B2 (en) * 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US9466048B2 (en) 2005-05-16 2016-10-11 Thomson Reuters Global Resources Systems, methods, software and interfaces for integration of online research tasks into law firm workflow
WO2006127596A2 (en) 2005-05-20 2006-11-30 Hillcrest Laboratories, Inc. Dynamic hyperlinking approach
US7769772B2 (en) * 2005-08-23 2010-08-03 Ricoh Co., Ltd. Mixed media reality brokerage network with layout-independent recognition
US20070115500A1 (en) * 2005-11-21 2007-05-24 Xerox Corporation Method for operating communication device
US9020966B2 (en) * 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8489987B2 (en) * 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8676810B2 (en) * 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US8201076B2 (en) * 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9063952B2 (en) * 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8073263B2 (en) * 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US9176984B2 (en) * 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US20080227075A1 (en) 2007-03-15 2008-09-18 Ctb/Mcgraw-Hill, Llc Method and system for redundant data capture from scanned documents
US20080235564A1 (en) * 2007-03-21 2008-09-25 Ricoh Co., Ltd. Methods for converting electronic content descriptions
US8584042B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Methods for scanning, printing, and copying multimedia thumbnails
US8812969B2 (en) * 2007-03-21 2014-08-19 Ricoh Co., Ltd. Methods for authoring and interacting with multimedia representations of documents
US8612412B2 (en) * 2007-05-24 2013-12-17 International Business Machines Corporation Searching for a directory in a file system
US20090015875A1 (en) * 2007-06-20 2009-01-15 Ctb/Mcgraw-Hill Companies, Inc. Image manipulation of digitized images of documents
US8526766B2 (en) * 2007-10-31 2013-09-03 Ctb/Mcgraw-Hill Llc Use of composite bitmapped images in conjunction with display of captured data
US8924374B2 (en) * 2008-02-22 2014-12-30 Tigerlogic Corporation Systems and methods of semantically annotating documents of different structures
US8145632B2 (en) * 2008-02-22 2012-03-27 Tigerlogic Corporation Systems and methods of identifying chunks within multiple documents
US8924421B2 (en) * 2008-02-22 2014-12-30 Tigerlogic Corporation Systems and methods of refining chunks identified within multiple documents
US9129036B2 (en) * 2008-02-22 2015-09-08 Tigerlogic Corporation Systems and methods of identifying chunks within inter-related documents
US8078630B2 (en) 2008-02-22 2011-12-13 Tigerlogic Corporation Systems and methods of displaying document chunks in response to a search request
US8195540B2 (en) * 2008-07-25 2012-06-05 Mongonet Sponsored facsimile to e-mail transmission methods and apparatus
US9037567B2 (en) 2009-04-15 2015-05-19 Vcvc Iii Llc Generating user-customized search results and building a semantics-enhanced search engine
US10628847B2 (en) 2009-04-15 2020-04-21 Fiver Llc Search-enhanced semantic advertising
US8200617B2 (en) 2009-04-15 2012-06-12 Evri, Inc. Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
US8862579B2 (en) * 2009-04-15 2014-10-14 Vcvc Iii Llc Search and search optimization using a pattern of a location identifier
US8238538B2 (en) 2009-05-28 2012-08-07 Comcast Cable Communications, Llc Stateful home phone service
US8385660B2 (en) * 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US20110119262A1 (en) * 2009-11-13 2011-05-19 Dexter Jeffrey M Method and System for Grouping Chunks Extracted from A Document, Highlighting the Location of A Document Chunk Within A Document, and Ranking Hyperlinks Within A Document
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US20130182974A1 (en) * 2012-01-13 2013-07-18 Honeywell International, Inc. doing business as (d.b.a.) Honeywell Scanning & Mobility System and method for obtaining and routing electronic copies of documents
US8824750B2 (en) * 2012-03-19 2014-09-02 Next Level Security Systems, Inc. Distributive facial matching and notification system
CN110046309A (zh) * 2019-04-02 2019-07-23 北京字节跳动网络技术有限公司 文档输入内容的处理方法、装置、电子设备和存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2458119C3 (de) * 1974-12-09 1980-08-14 Siemens Ag, 1000 Berlin Und 8000 Muenchen Verfahren und Anordnung zur Faksimilecodierung
JPS59128661A (ja) * 1983-01-14 1984-07-24 Fuji Xerox Co Ltd 画像フアイル装置
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system
US4553206A (en) * 1983-10-03 1985-11-12 Wang Laboratories, Inc. Image storage and retrieval
JPH0827831B2 (ja) * 1986-05-16 1996-03-21 株式会社日立製作所 画像登録方式
US4760606A (en) * 1986-06-30 1988-07-26 Wang Laboratories, Inc. Digital imaging file processing system
US5099340A (en) * 1989-05-15 1992-03-24 Sharp Kabushiki Kaisha Electronic filing apparatus
US5068888A (en) * 1989-08-11 1991-11-26 Afd Systems, Inc. Interactive facsimile information retrieval system and method
JPH03161873A (ja) * 1989-11-20 1991-07-11 Ricoh Co Ltd データベース構築機能を有する電子フアイリング装置
JPH03196266A (ja) * 1989-12-25 1991-08-27 Toshiba Corp 画像形成記憶装置
JPH03202967A (ja) * 1989-12-28 1991-09-04 Toshiba Corp 電子ファイリング装置
US5170266A (en) * 1990-02-20 1992-12-08 Document Technologies, Inc. Multi-capability facsimile system
JP3098783B2 (ja) * 1990-04-20 2000-10-16 株式会社リコー 画像蓄積機能付きファクシミリ装置
US5115326A (en) * 1990-06-26 1992-05-19 Hewlett Packard Company Method of encoding an e-mail address in a fax message and routing the fax message to a destination on a network
US5563955A (en) * 1990-11-21 1996-10-08 The Board Of Trustees Of The University Of Arkansas Apparatus and/or method for recognizing printed data in an image
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5436960A (en) * 1991-05-20 1995-07-25 Campana, Jr.; Thomas J. Electronic mail system with RF communications to mobile processors and method of operation thereof
US5241466A (en) * 1991-06-26 1993-08-31 Perry Victor A System for administering a central depository for living wills and other associated information
US5301315A (en) * 1991-09-27 1994-04-05 Computer Concepts Corp. Indexing/compression scheme for supporting graphics and data selection
US5579407A (en) * 1992-04-21 1996-11-26 Murez; James D. Optical character classification
US5341222A (en) * 1992-05-18 1994-08-23 Demand Publishing, Inc. Distributed facsimile information system and method
US5337362A (en) * 1993-04-15 1994-08-09 Ricoh Corporation Method and apparatus for placing data onto plain paper
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
US5461488A (en) * 1994-09-12 1995-10-24 Motorola, Inc. Computerized facsimile (FAX) system and method of operation
US5530852A (en) * 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
CA2139081C (en) * 1994-12-23 1999-02-02 Alastair Gordon Unified messaging system and method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19737826C2 (de) * 1996-09-03 1999-12-23 Dci Datenbank Fuer Wirtschafts Internet-Server und Verfahren zum Bereitstellen einer Web-Seite
KR100308262B1 (ko) * 1997-12-31 2001-10-19 구자홍 인터넷예약검색및저장장치및방법
DE19811407A1 (de) * 1998-03-16 1999-09-23 Cit Alcatel Verfahren zum Empfang von Faxnachrichten anstelle eines Faxgerätes eines Teilnehmers sowie Faxempfangseinrichtung, Server und Vermittlungsstelle hierzu
EP1014676A2 (de) * 1998-12-15 2000-06-28 DeTeMobil Deutsche Telekom MobilNet GmbH Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax
DE19857901A1 (de) * 1998-12-15 2000-06-29 Deutsche Telekom Mobil Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax
EP1014676A3 (de) * 1998-12-15 2004-10-27 T-Mobile Deutschland GmbH Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax
DE19957895C1 (de) * 1999-11-19 2001-06-21 Guideguide Ag System und Verfahren zum Erstellen von Kleinanzeigen im Internet sowie Set für ein System der vorgenannten Art

Also Published As

Publication number Publication date
US5873077A (en) 1999-02-16

Similar Documents

Publication Publication Date Title
DE19715696A1 (de) Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird
DE10236188B4 (de) Verfahren, System und Programmprodukt zum Bereitstellen eines Inhalts einer Quellwebsite an eine Verbraucherwebsite durch einen Bildumwandlungsdienst
DE60028561T2 (de) Bereitstellung von kundendiensten, die daten aus datenquellen abrufen, wobei die datenquellen die vom kunden geforderten formate nicht notwendigerweise unterstützen
DE60129652T2 (de) Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung
DE10135445B4 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE69434620T2 (de) Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten
DE10236190B4 (de) Verfahren, System, Programmprodukt und Druckerwebdienst zum Erzeugen eines Druckauftrags zum Drucken eines Dokuments
DE69736373T2 (de) Web-browser, der die Navigation zwischen Hypertextobjekten mit einer Abstandsbedienung ermöglicht
DE60116343T2 (de) Webserver
DE10236189B4 (de) Verfahren, System und Programmprodukt zum Drucker eines Dokuments, das eine Mehrzahl von Seiten aufweist
DE19936314A1 (de) Verfahren und System zur Inhaltskonvertierung von elektronischen Daten unter Verwendung von Konvertierungspräferenzen
DE19962192A1 (de) Verfahren und System zur Inhaltskonvertierung von elektronischen Daten für drahtlose Vorrichtungen
DE10048940A1 (de) Erzeugen von Dokumenteninhalten durch Transcodierung mit Hilfe von Java Server Pages
DE10309241A1 (de) Drucken mit variablen Daten unter Verwendung einer dynamischen Ausschießvorlage
DE10050172A1 (de) Systeme, Verfahren und Computerprogrammprodukte zur Überprüfung eines für die Anzeige in pervasive Computereinheiten angepassten Web-Inhaltes
DE10122231A1 (de) System, Methode, und Programmprodukt zum Speichern eines vorgelegten Formulars einer Web Page
DE60003278T2 (de) Hierarchische Auflösung von Adressen in einem Datennetzwerk
DE19963981A1 (de) Verfahren und Vorrichtung zum Auffinden von Dokumenten unter Verwendung von Hyperlinks
DE60026788T2 (de) Vorrichtung zum Suchen eines Gerätes in einem Netzwerk
DE102016015381A1 (de) Verwendung von Bloom-Filtern zur Vereinfachung der Erweiterung und Unterteilung eines dynamischen Fonts
DE10236182B4 (de) Verfahren, ein System und ein Programmprodukt zum Drucken eines Dokuments gemäß einer vorbestimmten Druckspezifikation
EP1211099A2 (de) Verfahren zum digitalen Drucken von zusammengesetzten Dokumenten
DE10330826A1 (de) Bestimmen einer Ziel-E-Mail-Adresse zum Senden gescannter Dokumente
DE60215271T2 (de) Datenerfassungssystem und -Verfahren mit Verwendung von Antwortformularen
DE10296924T5 (de) Anwenderbestimmtes selektives Neuladen von Bildern

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law