DE19715696A1 - Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird - Google Patents
Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wirdInfo
- Publication number
- DE19715696A1 DE19715696A1 DE19715696A DE19715696A DE19715696A1 DE 19715696 A1 DE19715696 A1 DE 19715696A1 DE 19715696 A DE19715696 A DE 19715696A DE 19715696 A DE19715696 A DE 19715696A DE 19715696 A1 DE19715696 A1 DE 19715696A1
- Authority
- DE
- Germany
- Prior art keywords
- search
- document
- gateway
- documents
- web
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/748—Hypervideo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/2871—Implementation details of single intermediate entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/564—Enhancement of application control based on intercepted application data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/565—Conversion or adaptation of application format or content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00206—Transmitting or receiving computer data via an image communication device, e.g. a facsimile transceiver
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/327—Initiating, continuing or ending a single-mode communication; Handshaking therefor
- H04N1/32765—Initiating a communication
- H04N1/32771—Initiating a communication in response to a request, e.g. for a particular document
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/327—Initiating, continuing or ending a single-mode communication; Handshaking therefor
- H04N1/32765—Initiating a communication
- H04N1/32771—Initiating a communication in response to a request, e.g. for a particular document
- H04N1/32778—Initiating a communication in response to a request, e.g. for a particular document using a mark-sheet or machine-readable code request
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/322—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
- H04L69/329—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0008—Connection or combination of a still picture apparatus with another apparatus
- H04N2201/0034—Details of the connection, e.g. connector, interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0008—Connection or combination of a still picture apparatus with another apparatus
- H04N2201/0065—Converting image data to a format usable by the connected apparatus or vice versa
- H04N2201/0068—Converting from still picture data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Description
Die vorliegende Erfindung betrifft das Gebiet von Dokumentbeschaffungssystemen;
insbesondere betrifft die vorliegende Erfindung die Suche nach Dokumenten auf
einem verbundenen Computernetzwerk, wie zum Beispiel dem World Wide Web
oder einer ähnlichen Dokumentenresourcen-Versorgungseinrichtung bzw. Dokumen
tenquellen-Versorgungseinrichtung, indem ein Faxgerät verwendet wird.
Eine wichtige Verwendung von Computern stellt die Übertragung von Information
über ein Netzwerk dar. Gegenwärtig ist das größte existierende Computernetzwerk
das Internet. Das Internet ist eine weltweite Verbindung von Computernetzwerken,
die miteinander kommunizieren, indem ein gemeinsames Protokoll verwendet wird.
Millionen von Computern von einem einfachen Personalcomputer bis zu einem
hochtechnologischen Supercomputer sind an dem Internet angeschlossen.
Das Internet wuchs aus einer Arbeit, die in den 60ern durch die Advanced Research
Projects Agency des U.S. Defense Department′s gegründet wurde. Für eine lange
Zeit wurde Internet von Forschern in Universitäten und Nationalen Laboratorien
verwendet, um Informationen auszutauschen. Als die Existenz des Internet breiter
bekannt wurde, begannen viele Benutzer außerhalb der
Akademiker/Forscher-Gemeinde (z. B. Angestellte von großen Firmen), das Internet zu benutzen, um
elektronisch Post zu übermitteln.
1989 wurde ein neuer Typ von Informationssystem, das als das World Wide Web
("das Web") bekannt ist, auf dem Internet eingeführt. Eine frühe Entwicklung des
Web fand am CERN statt, dem Europäischen Teilchenphysiklaboratorium bzw.
"European Particle Physics Laboratory". Das Web ist ein weitflächiges Hypermedia-
Informationsbeschaffungssystem, das darauf zielt, einen breiten Zugriff auf ein
großes Universum von Dokumenten zu ermöglichen. Zu dieser Zeit war das Web
nur der Akademiker/Forscher-Gemeinde bekannt und wurde von dieser genutzt. Es
gab keine einfachen verfügbaren Mittel, die es einer technisch nicht ausgebildeten
Person erlaubte, auf das Web zuzugreifen.
1993 gaben Forscher am National Center for Supercomputing Applications (NSCA)
einen Web-Browser heraus, der "Mosiac" genannt wurde und der eine graphische
Benutzerschnittstelle bzw. "graphical user interface" (GUI) implementierte. Die
graphische Benutzerschnittstelle des Mosiac war einfach zu lernen und dennoch
leistungsfähig. Der Mosiac-Browser erlaubt es einem Benutzer, Dokumente aus dem
Web zu beschaffen, in dem einfache Zeige-und-Klickbefehle verwendet werden.
Die Architektur des Web folgt einem herkömmlichen Client-Server-Modell. Die
Terme "Client" und "Server" werden verwendet, um auf die allgemeine Rolle des
Computers als ein Abfrager bzw. Anforderer von Daten (der Client) oder als ein
Bereitsteller von Daten (der Server) hinzuweisen. In der Web-Umgebung sind die
Web-Browser Client und die Web-Dokumente befinden sich auf den Servern. Die
Web-Clients und die Web-Server kommunizieren miteinander, indem ein Protokoll
bzw. Übertragungsprotokoll verwendet wird, das Hypertext-Übertragungsprotokoll
bzw. "Hypertext Transfer Protocol" (HTTP) genannt wird. Ein Browser öffnet eine
Verbindung zu einem Server und löst eine Abfrage für ein Dokument aus. Der
Server liefert das abgefragte Dokument, typischerweise in der Form eines Text-
Dokumentes, das in einem Standardformat der Hypertext Markup Language (HTML)
bzw. in einem Standardformat der Sprache zur Auszeichnung von Hypertext kodiert
ist. Der Server übernimmt die passive Rolle. Er nimmt die Befehle von dem Client
an und sendet die Daten zu dem Client, aber er kann nicht von dem Client fordern,
irgendeine Aktion durchzuführen.
Abschnitte von Dokumenten, die auf dem Web angezeigt werden beinhalten
Hypertextlinks. Die Hypertextlinks verbinden bzw. verknüpfen Graphiken oder Text
auf einem Dokument mit einem anderen Dokument auf dem Web. Jeder Hyper
textlink ist mit einem Universal Resource Locator (URL) bzw. mit einer genormten
Methode zum Auffinden von Resourcen verbunden. Eine URL spezifiziert einen
Server und ein bestimmtes Dokument auf dem Server. Wenn ein Benutzer einen
Hypertextlink auswählt, indem zum Beispiel ein Cursor verwendet wird, stellt der
graphische Browser eine Verbindung zu dem Server her und beschafft das Dokument
bzw. die Dokumente, die durch die URL bzw. die URLs spezifiziert sind.
Manche Server stellen eine Einrichtung bereit, um eine Sammlung von Dokumenten
bereitzustellen. Nach der anfänglichen Aufforderung liefert der Server ein Formular
zu dem Browser. Der Benutzer gibt die Daten unter Verwendung des graphischen
Browsers ein, wie zum Beispiel Schlüsselwörter, und zwar auf dieser Form bzw.
diesem Formular, die bzw. das einen Teil einer Suchabfrage darstellt, und eröffnet
dann eine neue Verbindung zu dem Server und legt diese Daten dem Server vor bzw.
übersendet sie an diesen. Der Server antwortet auf diese Anfrage mit einer
Auflistung neuer Dokumente, wobei manche oder alle der Dokumente mit jenen
Schlüsselwörtern oder anderen Daten zusammenpassen, die durch den Browser
angefordert wurden. Jedes normalerweise aufgelistete Dokument beinhaltet einen
Hypertextlink zu dem aktuellen Dokument, so daß der Benutzer auf einfache Weise
das Dokument beschaffen kann (wie dies jeder andere Link bzw. jede andere
Verknüpfung machen würde).
Während Web-Server und Web-Clients, wie zum Beispiel Mosaic die Tür für On-
Line-Veröffentlichungen und Nutzung von Information geöffnet haben, waren diese
Dienste nur für jene verfügbar, die einen Internetanschluß hatten. Mit anderen
Worten können einzelne Personen, die keinen direkten Internetanschluß, ein
schließlich einen Computer und einen Datenkanal zu dem Internet haben, nicht nach
Dokumenten und anderen Resourcen bzw. Quellen suchen, die über das Web
verfügbar sind. Es ist wünschenswert, die Suche nach Dokumenten auf den Web
(oder einem anderen derartigen Netzwerk) jenen einzelnen Personen zu erlauben, die
nicht einen derartigen direkten Anschluß haben.
Die vorliegende Erfindung stellt einen Zugriff auf das Web einzelnen Personen
bereit, die nicht einen Computer oder einen Anschluß an das Internet oder an eine
andere Netzwerk/Resourcen-Versorgungseinrichtung haben. Die vorliegende
Erfindung erlaubt es einzelnen Personen nach Dokumenten zu suchen (und sie zu
beschaffen), und zwar auf dem Web, und zwar so, als ob sie tatsächlich mit dem
Web individuell verbunden wären. Auf diese Art und Weise ermöglicht es die
vorliegende Erfindung einzelnen Personen, die Fähigkeit von Clients zu entwickeln,
wenn diese einzelne Person keinen direkten Anschluß an ein Netzwerk hat.
Die vorliegende Erfindung stellt ein Verfahren und ein Apparat bereit, um
Dokumente zu beschaffen. Die vorliegende Erfindung weist ein Verfahren und einen
Apparat auf, der eine Facsimileübertragung eines Dokuments mit wenigstens einem
Suchterm empfängt. Die vorliegende Erfindung stellt ebenso ein Verfahren und ein
Apparat bereit, um eine Suche, basierend auf Suchtermen, die sich auf dem
empfangenen Dokument befinden, durchzuführen.
Die vorliegende Erfindung wird nun verständlicher von der detaillierten Be
schreibung, die im folgenden zusammen mit den beigefügten Zeichnungen von
vielfältigen Ausführungsformen der Erfindung gegeben wird und die rein beispielhaft
ist. Dabei können unterschiedliche Merkmale unterschiedlicher Ausführungsformen
miteinander kombiniert werden. Die vorliegende Erfindung basiert auf der
US-Patentanmeldung S.N. 08/632,681 die am 16. April 1996 eingereicht wurde und
deren Inhalt hiermit ausdrücklich mit aufgenommen wird.
Fig. 1 ist ein Blockdiagramm einer Ausführungsform des
Dokumentsuch- und Beschaffungssystems der vorliegenden Erfindung.
Fig. 2A ist ein Flußdiagramm des Suchprozesses der vorliegenden Erfindung.
Fig. 2B ist ein Flußdiagramm des Suchprozesses der vorliegenden Erfindung.
Fig. 2C zeigt die Client-Server-Kommunikation.
Fig. 2D ist ein Blockdiagramm einer Ausführungsform der Gateway der
vorliegenden Erfindung.
Fig. 3 ist ein Beispiel-Suchformular gemäß der vorliegenden Erfindung.
Fig. 4 ist ein Flußdiagramm einer Ausführungsform des Dokumentbeschaf
fungsprozesses, der von einem Benutzer eines Faxgerätes gemäß der
vorliegenden Erfindung durchgeführt wird.
Fig. 5 zeigt ein Beispiel eines Hardcopy-Dokuments, das eine maschinenles
bare Information gemäß der vorliegenden Erfindung aufweist.
Fig. 6 ist ein Flußdiagramm einer Ausführungsform des Dokumentbeschaf
fungsprozesses, der von der Gateway der vorliegenden Erfindung
durchgeführt wird.
Fig. 7 ist ein Flußdiagramm einer Ausführungsform des Prozesses zum
Extrahieren einer ausgewählten maschinenlesbaren Information aus
einem empfangenen Dokument gemäß der vorliegenden Erfindung.
Fig. 8 zeigt ein Beispiel eines bemalten Bildes, das von der Anwendung
einer Ausführungsform des Extraktionsprozesses der vorliegenden
Erfindung resultiert.
Fig. 9 ist ein Blockdiagramm einer Ausführungsform eines Computersystems
der vorliegenden Erfindung.
Es wird ein Verfahren und ein Apparat beschrieben, der der Suche nach Dokumenten
und dem Auffinden von Dokumenten dient. Bei der folgenden detaillierten
Beschreibung der vorliegenden Erfindung werden zahlreiche spezifische Details, wie
Resourcen- und Dokument-Identifiziertypen, Dokumenttypen etc. dargelegt, um ein
tiefgehendes Verständnis der vorliegenden Erfindung bereitzustellen. Jedoch ist es
für den Fachmann offensichtlich, daß die vorliegende Erfindung auch ohne diese
spezifischen Details in die Praxis umgesetzt werden kann. In anderen Fällen werden
gut bekannte Strukturen und Vorrichtungen eher in der Gestalt eines Blockdiagramms
als detailliert gezeigt um eine Verschleierung der vorliegenden Erfindung zu
vermeiden.
Einige Abschnitte der folgenden detaillierten Beschreibung werden in Termen von
Algorithmen und symbolischen Darstellungen von Operationen mit Datenbits
innerhalb eines Computerspeichers dargelegt. Diese algorithmischen Beschreibungen
und Darstellungen sind die Mittel, die von dem Fachmann auf dem Gebiet der
Datenverarbeitung verwendet werden, um am effektivsten das wesentliche ihrer
Arbeit anderen Fachleuten zu übermitteln. Ein Algorithmus wird hier und im
allgemeinen so verstanden, daß er eine selbstkonsistente Abfolge von Schritten ist,
die Schritte sind von dergestalt, daß sie physikalische Manipulationen physikalischer
Quantitäten erfordern. Im allgemeinen nicht notwendigerweise nehmen diese
Quantitäten die Form von elektrischen oder magnetischen Signalen an, die die
Eigenschaft aufweisen, daß sie gespeichert, übertragen, kombiniert, verglichen und
anderweitig manipuliert werden können. Es hat sich zu Zeiten als zweckmäßig
erwiesen, insbesondere aus Gründen der allgemeinen Verwendung, auf diese Signale
als Bits, Werte, Elemente, Symbole, Charakter bzw. Zeichen, Terme, Zahlen oder
dergleichen bezugzunehmen.
Es sollte jedoch bewußt bleiben, daß all diese oder ähnliche Termen mit den
geeigneten physikalischen Quantitäten in Verbindung gebracht werden müssen und
daß sie lediglich zweckmäßige Benennungen darstellen, die diesen Quantitäten
verliehen wurden. Soweit es nicht anders zu lesen ist, als es von der folgenden
Diskussion erkennbar ist, wird betont, daß es für die gesamte vorliegende Erfindung
gilt, daß Diskussionen, die Terme, wie zum Beispiel Verarbeiten oder Berechnen
oder Kalkulieren oder Bestimmen oder Anzeigen oder dergleichen beinhalten, auf die
Wirkungen und Prozesse eines Computersystems oder einer ähnlichen elektronischen
Rechenvorrichtung bezugnehmen die Daten, die als physikalische (elektronische)
Quantitäten innerhalb der Register und Speicher des Computersystems dargestellt
werden, in andere Daten, die in ähnlicher Weise als physikalische Quantitäten
innerhalb der Speicher oder Register oder anderen derartigen Informationsspeicher-,
Übertragungs- oder Anzeigevorrichtungen dargestellt werden, manipulieren und
transformieren.
Die vorliegende Erfindung nimmt ebenso Bezug auf einen Apparat, um die
Operationen hierin durchzuführen. Dieser Apparat kann für die erforderlichen
Zwecke speziell konstruiert sein oder er kann einen Allzweckcomputer aufweisen,
der selektiv durch ein Computerprogramm aktiviert oder rekonfiguriert ist, das in
dem Computer gespeichert ist. Die Algorithmen und Anzeigen, die hierin dargestellt
werden, stehen nicht inhärent in Bezug zu irgendeinem bestimmten Computer oder
anderen Apparat. Verschiedenste Allzweckmaschinen können mit Programmen
entsprechend der hierin vorgestellten Lehre verwendet werden, oder es kann sich als
zweckmäßig herausstellen, einen spezialisierteren Apparat zu konstruieren, um die
erforderlichen Verfahrensschritte durchzuführen. Die erforderliche Struktur für eine
Vielfalt dieser Maschinen wird aus der folgenden Beschreibung ersichtlich werden.
Zusätzlich kann die vorliegende Erfindung unter Bezugnahme auf irgendeine
bestimmte Programmiersprache beschrieben werden. Man wird begrüßen, daß eine
Vielfalt von Programmiersprachen verwendet werden kann, um die Lehren der
Erfindung, wie hierin beschrieben ist, zu implementieren.
Die vorliegende Erfindung stellt einen Zugriff auf Dokumente bereit, indem unter
Verwendung einer Facsimilemaschine nach den Dokumenten gesucht wird und die
Dokumente aufgefunden werden. Bei der vorliegenden Erfindung kann es sich bei
einem Dokument um einen beliebigen Typus eines Mediums, wie zum Beispiel (aber
nicht beschränkt darauf) Text, Bilder, Ton usw. handeln.
Bei der vorliegenden Erfindung füllt der Benutzer, um nach Dokumenten in dem
Web zu suchen, indem er nur ein Facsimilegerät bzw. eine Faxmaschine verwendet,
lediglich ein Suchformular aus, indem gewünschte Suchterme oder andere
gutbekannte Suchparameter in eine oder mehrere Eingaberahmen bzw. Entryboxen
auf einem Dokument (z. B. Seite) ausfüllt, und er sendet dieses Dokument via
Facsimile zu einem Server. Der Server extrahiert die Suchterme und führt eine Suche
aus, indem die Suchterme verwendet werden. Bei einer Ausführungsform extrahiert
der Server die Suchterme von dem Dokument in einem nicht erkennbaren Format
(z. B. Bitmaps) und sendet diese Extraktionen zu einer Zeichenerkennungsmaschine
(z. B. optische Zeichenerkennung bzw. optische Charaktererkennung bzw. OCR). Die
Ausgabe der Zeichenerkennungsmaschine bzw. Charaktererkennungsmaschine wird
bei einer Abfrage an eine Web-Suchmaschine, wie zum Beispiel Yahoo, hergestellt
von Yahoo! Corporation of Sunnyvale, Kalifornien, verwendet, die eine Suche auf
eine Art und Weise durchführt, wie sie in der Fachwelt gut bekannt ist. Die
Ergebnisse der Suche werden an den Benutzer über die Faxmaschine zurückgegeben.
Diese Ergebnisse können Dokumente beinhalten, die die Suche erfüllen oder sie
können eine Auflistung derartiger Dokumente beinhalten. Indem die vorliegende
Erfindung verwendet wird, kann der Benutzer ebenso Dokumente von den
Suchergebnissen, die von dem Web unter Verwendung der Faxmaschine beschafft
werden sollen, auswählen.
Somit erlaubt die vorliegende Erfindung als ein Web-Client zu arbeiten und Texte
und Bilder von jedem beliebigen Web-Standort bzw. Web-Site zu beschaffen. Auf
diese Art und Weise kann der Benutzer mehrere Seiten von dem Web ansehen, sogar
ohne eine Standleitung.
Im folgenden wird eine kurze Erklärung bezüglich Client-Server-Operationen, URLs
und Browsing bzw. "Durchstöbern" des Web gegeben.
Vom Konzept her betrachtet, beinhaltet ein Computernetzwerk, wie zum Beispiel das
Internet kleine Computer und große Computer, die allgemein als Server verwendet
werden. Im allgemeinen stellen kleine Computer Personalcomputer oder Work
stations dar und sie stellen die Standorte bzw. Sites dar an denen ein menschlicher
Benutzer den Computer bedient, um eine Datenabfrage von anderen Computern oder
Servern auf dem Netzwerk durchzuführen. Im allgemeinen finden sich die
angeforderten Daten in großen Computern. Bei diesem Szenario stellen die kleinen
Computer Clients dar und die großen Computer sind die Server. Bei dieser
Spezifikation werden die Terme "Client" und "Server" verwendet, um auf eine
allgemeine Rolle des Computers als ein Anforderer von Daten (Clients) oder
Bereitsteller von Daten (Server) bezugzunehmen. Im allgemeinen schließt die Größe
eines Computers oder die mit der Größe verbundenen Resourcen nicht die Fähigkeit
des Computers aus als Client oder als Server zu dienen. Weiter kann jeder Computer
bei einer Transaktion Daten anfordern und bei einer anderen Transaktion Daten
bereitstellen, womit sich die Rolle des Computers vom Client zum Server oder
umgekehrt ändert.
Das World Wide Web ("Web") verwendet das Client-Server-Modell, um Information
zwischen Clients und Servers zu übertragen bzw. zu vermitteln. Web-Server sind mit
dem Internet verbunden und Antworten auf eine Dokumentabfrage von Web-Clients.
Web-Clients (z. B. Web-"Browser") sind Programme, die es dem Benutzer erlauben,
einfach auf Web-Dokumente zuzugreifen, die sich auf Web-Server befinden.
Ein Beispiel eines Client-Server-Systems, das durch das Internet verbunden ist, kann
ein entfernt gelegenes Server-System beinhalten, das durch das Internet mit einem
Client-System verbunden ist. Das Client-System kann konventionelle Komponenten,
wie zum Beispiel einen Prozessor, einen Speicher (z. B. RAM), einen Bus, der mit
dem Prozessor und dem Speicher verbunden ist, eine Massenspeichervorrichtung
(z. B. eine magnetische Festplatte oder eine optische Speicherplatte), die mit dem
Prozessor und dem Speicher über eine I/O-Steuereinrichtung (Eingabe/Ausgabe-
Steuereinrichtung) und eine Netzwerk-Schnittstelle wie zum Beispiel ein konventio
nelles Modem, verbunden ist, beinhalten. Das Server-System kann ebenso
konventionelle Komponenten, wie zum Beispiel einen Prozessor, einen Speicher
(z. B. RAM), einen Bus, der mit dem Prozessor und dem Speicher verbunden ist
eine Massenspeichervorrichtung (z. B. eine magnetische oder optische Platte), die mit
dem Prozessor und dem Speicher durch eine I/O-Steuereinrichmng und eine
Netzwerk-Schnittstelle, wie zum Beispiel ein herkömmliches Modem, verbunden ist,
beinhalten. Ausgehend von der folgenden Beschreibung wird man begrüßen, daß die
vorliegende Erfindung durch Software implementiert werden kann, die als
ausführbare Befehle auf einem computerlesbaren Medium auf den Client- und
Server-Systemen wie zum Beispiel jeweilig auf Massenspeichervorrichtungen oder
jeweilig in Speichern bzw. internen Speichern gespeichert ist.
Um die Adressen von Resourcen auf dem Internet festzulegen, wird ein Uniform
Resource Locator (URL) System bzw. ein System gemäß einer Methode zum
Auffinden von Resourcen verwendet. Eine URL ist ein Beschreiber bzw. Descriptor,
der speziell einen Typ einer Internetresource und seine Lokation bzw. seinen Ort
festlegt. URLs weisen das folgende Format auf:
Protokoll://Domain.Adresse/Pfadname ("protocol://domain.adress/path_name")
Wobei "Protokoll" das Protokoll der Kommunikation zwischen dem Server und dem
Client festlegt. Auf Web-Dokumente wird häufig über das "http"-Protokoll
(Hypertexttransfer-Protokoll) zugegriffen. Andere Protokolle beinhalten "ftp"
(Dateiübertragungs-Protokoll bzw. "file transmission protocol"), Gopher, "Telnet".
Die "Domain.Adresse" definiert die Domainnamen-Adresse des Computerservers,
auf der sich die Resource befindet. Schließlich legt "Pfadname" einen Verzeichnis
pfad innerhalb des Dateisystems des Servers fest, der die Resource oder genauer eine
Kennung bzw. einen Identifizierer oder eine Anforderungen bzw. Abfrage
identifiziert. Der am weitesten rechts gelegene Name des Pfadnamenabschnitts ist
üblicherweise der Name einer tatsächlichen Datei, er kann aber auch Schlüsselwert-
Paare beinhalten, die von dem Server verwendet werden, um Dokumente "im
laufenden Betrieb" bzw. "on the fly" zu erzeugen. Durch Übereinkunft enden viele
Web-Seiten mit dem Suffix ".html", was anzeigt daß es sich bei der Datei um ein
HTML-Dokument bzw. ein Dokument in der Sprache zur Auszeichnung von
Hypertext ("HyperText Markup Language document") handelt.
Ein Beispiel für eine URL für ein Web-Dokument ist folgendes:
http://info.tech.ch/hypertext/Data/WWW/llistory.html
Diese URL zeigt an, daß durch die Verwendung des HTTP-(Web)Protokolls, um
einen Server zu erreichen, der "info.tech.ch" genannt wird, es ein Verzeichnis
"hypertext/Data/WWW" gibt, das ein Hypertextdokument beinhaltet, das den Namen
"History.html" beinhaltet. Resourcen sind auf dem Internet durch ihre URL
adressierbar.
Um auf ein Anfangs-Web-Dokument zuzugreifen, gibt der Benutzer die URL für ein
Web-Dokument in ein Web-Browser-Programm ein. Der Web-Browser sendet dann
eine HTTP-Anforderung an den Server, der das Web-Dokument aufweist, indem die
URL verwendet wird. Der Web-Server antwortet auf die HTTP-Anforderung, indem
er das angeforderte HTTP-Objekt an den Client sendet. In den meisten Fällen handelt
es sich bei dem HTTP-Objekt um ein Einfachtext-(ASCII)Dokument, das Text (in
ASCII) beinhaltet, das in "HyperText Markup Language" (HTML) geschrieben ist.
Das HTML-Dokument beinhaltet üblicherweise Hyperlinks zu anderen Web-
Dokumenten. Der Web-Browser zeigt das HTML-Dokument auf dem Bildschirm für
den Benutzer an und die Hyperlinks zu den anderen Web-Dokumenten werden in
einer gewissen Art und Weise hervorgehoben, so daß der Benutzer die Hyperlinks
identifizieren und auswählen kann.
Fig. 1 zeigt eine Ausführungsform der vorliegenden Erfindung. Fig. 1 ist ein
Blockdiagramm einer Ausführungsform des Systems der vorliegenden Erfindung.
Nimmt man Bezug auf Fig. 1, so ist ein Faxgerät 101 mit einer Überleiteinrichtung
bzw. einer Schnittstelle zwischen zwei Kommunikationssystemen (im folgenden
"Gateway" genannt) 102 über eine Telefonleitung 104 verbunden. Die Gateway 102
ist ebenso mit dem Internet 105 oder einem anderen Netzwerk oder einer anderen
Dokumentenresource bzw. Dokumentenquelle verbunden, die einen Zugang zum
Web 103 bereitstellt.
Bei einer Ausführungsform arbeitet das Faxgerät 101 als ein typisches Faxgerät
gemäß dem Stand der Technik. Das heißt, das Faxgerät 101 ist dazu in der Lage,
Faxübertragungen zu senden und zu empfangen, indem Telefonleitungen 104
verwendet werden. Ebenso beinhaltet das Faxgerät 101 einen Abtastmechanismus
bzw. einen Scanner, um Dokumente abzutasten, wie zum Beispiel ein Dokument
106, das danach über die Telefonleitung 104 übertragen wird. Das Faxgerät 101
beinhaltet ebenso eine Druckmaschine, um einen Ausdruck bzw. Hardcopy-
Darstellungen der empfangenen Facsimileübertragungen, wie zum Beispiel ein
Dokument 107 zu erzeugen.
Bei der vorliegenden Erfindung bildet die Gateway 102 eine Schnittstelle zwischen
dem Faxgerät 101 und dem Web 103 (über das Internet 105). Bei einer Ausführungs
form weist die Gateway 102 ein Computersystem oder eine Workstation auf, die mit
einer Telefonleitung 104 über Fax-Modems gekoppelt sind, die im Stand der Technik
gut bekannt sind. Die Funktionalität und eine beispielhafte Implementation der
Gateway 102 wird im folgenden beschrieben. Die Gateway 102 ist nicht darauf
beschränkt eine Schnlttstelle nur mit einem Faxgerät (102) zu bilden, sondern sie
kann eine beliebige Anzahl von Faxgeräten unterstützen. Jedoch kann die Gateway
102 durch die Anzahl von Dokumentbeschaffungs-Anfragen oder
Publikations-Anforderungen beschränkt sein, die zu jeder beliebigen Zeit unterstützt werden
können.
Das Web 103 beinhaltet mehrere Server und Maschinen die mit der Gateway 102
über das Internet 105 verbunden sind. In Bezug auf das Web 103 sollte bemerkt
werden, daß die vorliegende Erfindung nicht darauf beschränkt ist Dokumente auf
dem "World Wide Web" oder dem "Internet" zu suchen oder darüber zu beschaffen.
Die Lehre der vorliegenden Erfindung kann auf vielfältige Netzwerke, Daten- und
Vorlagenspeicher und Archiviereinrichtungen oder andere Typen von Client/Server-
Systemen angewendet werden, die auf Anfrage Dokumente oder andere Information
zur Verfügung stellen.
Das System der vorliegenden Erfindung erfordert nicht ein Faxgerät, solange das
System Komponenten und Vorrichtungen beinhaltet, die eine Funktionalität
bereitstellen können, die durch das Faxgerät bereitgestellt wird. Diese Funktionen
beinhalten, die Fähigkeit Dokumente auszutauschen, und zwar in dem eine Version
eines Dokuments empfangen wird und eine andere Version gesendet wird und die
Fähigkeit ein Dokument durch die Erzeugung eines Bitmap oder einer anderen
Anzeige des Dokuments anzusehen. Aber es gibt keine Beschränkung auf diese
Funktionen.
Die vorliegende Erfindung stellt eine Suche nach Dokumenten auf dem Web über ein
Faxgerät bereit. Bei der vorliegenden Erfindung wirkt die Gateway 102 als ein
Server.
Fig. 2A ist ein Flußdiagramm, das die Verarbeitung eines Dokument-Beschaf
fungssystems erläutert, das durch den Benutzer des Faxgeräts 101 gemäß der
vorliegenden Erfindung durchgeführt wird. Nimmt man Bezug auf Fig. 2A, so
beginnt der Benutzer den Prozeß, indem die Kommunikation zwischen dem Faxgerät
101 und dem Gateway 102 (Verarbeitungsblock 201) ausgelöst wird. Bei einer
Ausführungsform erstellt der Benutzer eine Kommunikation mit der Gateway 102,
indem eine Facsimileübertragung eines spezifischen Dokuments (z. B. Dokument 106)
zu der Gateway 102 gesendet wird. Bei einer Ausführungsform handelt es sich bei
dem Dokument 106 um eine leere Seite. Bei einer anderen Ausführungsform kann
das Dokument 106 Information beinhalten, um die Gateway 102 in die Lage zu
versetzen, das Dokument zu identifizieren.
Infolge der Herstellung einer Verbindung mit der Gateway 102 empfängt der
Benutzer ein Dokument, wie zum Beispiel das Dokument 107 von der Gateway 102,
das aus dem Faxgerät 101 in einem Hardcopy-Format ausgegeben wird (Ver
arbeitungsblock 202). Das erste Dokument, das von dem Benutzer von der Gateway
102 empfangen wurde, wird hierin als Home Page bzw. Heim-Seite bezeichnet. Das
Dokument kann mehrere Seiten aufweisen.
Andere Verfahren zum Herstellen einer Verbindung, um das Dokument zu
empfangen, können verwendet werden. Zum Beispiel kann ein Individuum verbal
oder anderweitig einen Operator des Gateway 102 benachrichtigen, um anzufordern,
daß das Dokument zu dem Benutzer des Faxgeräts 101 gesendet wird. Das
Dokument kann automatisch oder zum Beispiel durch einen anderen Benutzer des
Web gesendet werden. In ähnlicher Weise kann ein automatischer Service (z. B.
tägliche elektronische Zeitung) den Benutzer benachrichtigen, wenn eine bestimmte
Seite sich ändert. Bemerkenswert ist ebenso, daß der Benutzer das Dokument durch
eine andere Einrichtung, zum Beispiel durch Post, Luftservice und/oder einem
anderen Lieferservice oder einer anderen Lieferung erhalten werden kann oder auch
ihm das Dokument von einem anderen gegeben wurde.
Wenigstens eine Seite (oder ein Abschnitt) des Dokuments, das von der Gateway 102
empfangen wurde, stellt ein Suchformular dar, das durch einen Benutzer ausgefüllt
wird, um eine Suche zu spezifizieren. Bei einer Ausführungsform beinhaltet das
Formular eine oder mehrere Rahmen bzw. Boxen oder andere spezifizierte Orte bzw.
Stellen, in die die Suchterme geschrieben werden können. Bei einer Ausführungs
form stellt das Suchformular eine Seite dar, die verschiedene Boxen bzw. Rahmen
beinhaltet. Jeder der verschiedenen Boxen bzw. Rahmen kann ein unterschiedlicher
Typ von Abfrage oder Suche zugeordnet werden. Ein Beispiel einer derartigen Seite
wird in Fig. 3 gezeigt. Nimmt man Bezug auf Fig. 3, so beinhaltet das
Suchformular zwei Sätze von Boxen, einen Satz 301 für eine Suche, bei der beide
Termen (einer in jeder Box) in einem lokalisierten Dokument sein muß und der
andere Satz 302 für eine Suche, in dem einer der beiden Suchterme in einem
Dokument sein kann, um für das Dokument die Suche zu erfüllen. Das Suchformular
beinhaltet ebenso eine Auflistung von Datenbasen 303, in denen die Suche stattfinden
soll. Bei einer Ausführungsform kann jede Anzahl von Datenbasen für die Suche
ausgewählt werden. Bemerkenswert ist, daß bei einer Ausführungsform eine
derartige Datenbasen-Auflistung nicht verwendet wird und alle Datenbasen oder eine
vorbestimmte Anzahl von Datenbasen (wie durch die Gateway vorausgewählt)
gesucht werden. Eine Auswahl einer Datenbasis kann durch eine Markierung (z. B.
Einkreisen, Unterstreichen oder Durchkreuzen, durch die Plazierung einer Kontrolle
oder einer anderen unterscheidungsfähigen Marke nahe bei oder darauf), und zwar
betreffend die zu durchsuchende Datenbasis. Eine Auswahl kann durchgeführt
werden, indem der Strichkode unterhalb jeder Datenbasis, der sie identifiziert,
anstelle des Namens der Datenbasis markiert wird.
Jede der Boxen bzw. der Rahmen und jedes Element in der Liste der Datenbasen
beinhaltet einen Strichkode als ein identifizierbares Muster, um eine Information auf
dem Suchformular zu lokalisieren, wenn eine Erkennung durchgeführt wird, wie im
folgenden diskutiert wird.
Bemerkenswert ist, daß die Verwendung von Boxen oder Rahmen oder anderen
vorab spezifizierten Stellen für Suchterme lediglich die Erkennung erleichtert, die
später durchgeführt wird. Bei einer alternativen Ausführungsform können Suchterme
an jeder Stelle auf einer Seite bzw. auf Seiten plaziert werden und die vorliegende
Erfindung erhält die Suchterme, indem zum Beispiel nach Schlüsselwörtern oder
vorbestimmten erkennbaren Mustern gesucht wird (z. B. Unterstreichungen bzw.
Bildunterschriften, Strichkodes etc.).
Nimmt man Bezug auf Fig. 2A, so füllt der Benutzer das Suchformular aus
(Verarbeitungsblock 203).
Wenn einmal das Suchterm auf dem Formular geschrieben oder gedruckt worden ist,
übernimmt das ausgefüllte Formular die Rolle eines Dokuments 106 und wird zu der
Gateway 102 gefaxt (Verarbeitungsblock 204). Die Gateway 102, die als ein Server
dient, identifiziert die Suchterm-Stellen (z. B. die Box oder die Datenbasis-Stellen)
(Verarbeitungsblock 205). Bei einer Ausführungsform identifiziert ein Detektor in
der Gateway 102 die Box-Stellen, indem die Strichkodes auf dem Dokument 106
lokalisiert werden. Bemerkenswert ist, daß die Gateway 102 automatisch alle
Dokumente, die sie empfängt nach Suchterm-Stellen durchsuchen kann, und zwar
ungeachtet, ob es sich bei derartigen Dokumenten um Suchformulare handelt. Nur
wenn die Suchterm-Stellen gefunden werden, wird eine darauffolgende Suche
durchgeführt.
Nachdem die Box-Stellen identifiziert wurden, detektiert die vorliegende Erfindung
das Schreiben in den Boxen (Verarbeitungsblock 206). Bei einer Ausführungsform
detektiert die vorliegende Erfindung das Schreiben, indem die räumliche
Intensitätsvarianz untersucht wird. Boxen bzw. Rahmen mit Text darin werden einen
hohen Mittelwert und einen hohen Grad an Varianz zwischen dem Pixelwerten
innerhalb der Box aufweisen. Boxen, die keinen Text bzw. keine Schrift aufweisen,
werden eine sehr geringe Varianz und einen geringen Mittelwert aufweisen. Der
Mittelwert und die Varianz für alle Pixel in der Box können gemaß der folgenden
Gleichung berechnet werden:
P = Pixelintensitätswert, "Mean" steht für "Mittelwert"
N = Anzahl der Pixel, "Variance" steht für "Varianz"
j variiert über alle Pixel
N = Anzahl der Pixel, "Variance" steht für "Varianz"
j variiert über alle Pixel
Bei der alternativen Ausführungsform detektiert die vorliegende Erfindung den Text,
indem ein vordefinierter Satz von Merkmalen untersucht wird. Verschiedene
"Interessen"-Operatoren (z. B. morphologische Operatoren) können verwendet
werden. Der einfachste würde nach verbundenen Komponenten (z. B. benachbarte
Pixel mit "Ein"-Werten) schauen. Boxen, die einen Text in sich aufweisen, werden
viele verbundene Komponenten bzw. Verbindungskomponenten aufweisen, die eine
relativ große Anzahl von Pixeln in jeder Komponente aufweisen. Boxen ohne einen
Text bzw. ohne Geschriebenes darin, werden sehr wenig verbundene Komponenten
bzw. Verbindungskomponenten aufweisen (z. B. die meisten Pixel sind "aus") und
jene Komponenten werden sehr wenig Pixel aufweisen (Pixel "ein", die auf Rauschen
zurückzuführen sind, weisen wahrscheinlich keine "Ein"-Nachbarn auf).
Bezüglich jeder Box, in der Text bzw. Geschriebenes detektiert wurde, extrahiert die
Gateway 102 der vorliegenden Erfindung Bitmaps von jenen Boxen (Verarbeitungs
block 207) und übergibt eine Bitmap-Version des Inhalts der Box zu einer Maschine
zur optischen Zeichenerkennung bzw. zu einer OCR-Maschine, die eine Erkennung
bezüglich des Bitmaps durchführt (Verarbeitungsblock 208). Bei einer Ausführungs
form weist die Erkennungsmaschine eine Maschine zur Erkennung von hand
geschriebenen Zeichen bzw. eine HCR-("handwriting character recognition")
Maschine auf.
Bei einer Ausführungsform können die Datenbasen, die ausgewählt werden, indem
das Suchformular markiert wird, durch die Gateway 102, wie sie später beschrieben
wird, identifiziert werden, und zwar auf dieselbe Art und Weise, in der die
spezifischen Dokumente von den Suchergebnissen in der vorliegenden Erfindung
ausgewählt wurden. Bei einer Ausführungsform werden die markierten Regionen auf
dem Suchformular extrahiert, die erzielte Information (z. B. Strichkodes) wird
dekodiert und die Datenbasis wird identifiziert, indem die dekodierte Information
verwendet wird. Bei einer Ausführungsform handelt es sich bei dem Extraktions
prozeß um denselben, der durch die vorliegende Erfindung verwendet wird, wenn
Dokumente identifiziert werden, die aus dem Suchergebnis ausgewählt sind. Dieser
Prozeß wird im folgenden beschrieben.
Als nächstes erzeugt die Gateway 102 der vorliegenden Erfindung einen Abfrage-
String bzw. eine Abfrage-Zeichenkette, indem die erkannten Wörter und/oder
Charakter verwendet werden (Verarbeitungsblock 209). Bei einer Ausführungsform
weist die Abfrage, die durch die vorliegende Erfindung erzeugt wird, eine http-
Abfrage (z. B. eine URL) auf, wie jene, die durch bildschirmbasierte Browser
erzeugt werden.
Eine Beispiel-URL lautet wie folgt:
http://www.yahoo.com/bin/search?p=keyword
wobei das "Keyword" bzw. das "Schlüsselwort" durch die Erkennungsmaschine
extrahiert wird. Falls es mehrere Schlüsselwörter gibt, dann würden "p=keyword"-
Abschnitte in die URL eingeschlossen werden, die durch einen Identifizierer bzw.
eine Kennung aus einem oder mehreren Charaktern getrennt sind (z. B. der Charakter
"?").
Als nächstes wird eine Suche durchgeführt (Verarbeitungsblock 210). Während die
Gateway 102 als Client auf dem Web arbeitet, verwendet sie die URL, um andere
Server auf dem Web zu kontaktieren, und sie fragt Dokumente, die in der Abfrage
URL entsprechen, ab. Der Server 103 verarbeitet die Abfrage (gut bekannt in der
Fachwelt) und gibt zu der Gateway 102 URLs und eine andere Information ab, die
passenden Dokumenten entspricht. Diese andere Information kann zum Beispiel einen
Titel, Zusammenfassungen, Dokumentenlänge, Format, Firmeninformation,
Information über die Biographie des Autors, Information über einen in Beziehung
stehenden Standort, etc. beinhalten. Bemerkenswert ist, daß die vorliegende
Erfindung mit anderen Zeigern oder Dokumentkennungen bzw. Dokumentidentifizie
rern neben den URLs verwendet werden kann.
Bei einer Ausführungsform erzeugt die Gateway 102 ein Dokument und gibt es
wieder, das die Suchergebnisse beinhaltet (mit speziellen Strichkodes für Verbindun
gen) und sendet das wiedergegebene Dokument zu dem Faxgerät 101 über das
Faxmodem zurück (Verarbeitungsblock 211). Bei einer anderen Ausführungsform
beschafft die Gateway 102 verschiedene oder alle passenden Dokumente (indem die
URLs verwendet werden), gibt diese Dokumente wieder und gibt sie zu dem
Faxgerät 101 zurück.
Eine zusätzliche Verarbeitung kann verwendet werden, um die Anzahl der
zurückgegebenen Dokumente zu beschränken, um die Dokumente nach ihrer
Relevanz zu ordnen oder alle Dokumente von einem Standort zu gruppieren bzw.
zusammenzufassen. Ergebnisse können basierend auf der Geschichte bzw. Historie,
der Ähnlichkeit, usw. gefiltert werden. Zum Beispiel kann die Gateway 102 eine
Liste oder eine Datenbasis von Dokumenten behalten, die zu einer bestimmten
Faxnummer gesendet worden sind und nicht erneut zu der Faxnummer irgendwelche
passenden Dokumente von der gegenwärtigen Abfrage zu senden, wodurch die Zeit
und Material (Papier, Toner etc.) gespart wird, die bzw. das mit im Spiel wäre,
wenn ein Dokument gesendet wird, das der Benutzer bereits erhalten hat. Eine
derartige Liste oder Datenbasis bzw. Datenbank kann auf der oder durch die
Gateway 102 aufrechterhalten werden. In ähnlicher Weise kann die Gateway 102 nur
eines jener Dokumente (z. B. das allgemeinste oder eines mit dem kürzesten Pfad)
senden, falls die Suchergebnisse verschiedene Dokumente von dem selben Standort
beinhalten. Natürlich gibt es viele andere Merkmale und Filtermechanismen, um das
Ergebnis zu filtern, bevor das Dokument bzw. die Dokumente über das Fax
zurückgegeben werden.
Die Suchergebnisse können ein Dokument mit einer zusätzlichen Suchbox beinhalten,
um die Abfrage zu verfeinern oder zu modifizieren. Die Gateway 102 kann ebenso
Terme der Originalabfrage des Benutzers modifizieren oder welche addieren. Zum
Beispiel falls "thinking" als ein Schlüsselwort erkannt wurde, kann die Gateway
ebenso sowohl "think" als auch "thinking" als Suchterme verwenden (oder irgendeine
Ableitung oder alle Ableitungen eines Wortes) verwenden.
Ebenso, falls die Suche scheitert (kein Dokument wird zurückgegeben oder zuwenig
Dokumente werden zurückgegeben oder zuviele Dokumente werden zurückgegeben),
könnte die Gateway 102 die Suche modifizieren, indem Schlüsselwörter (oder andere
Kriterien) addiert oder gelöscht werden und die Abfrage wieder ausführen. Falls zum
Beispiel zuwenige Dokumente oder gar kein Dokument zurückgegeben wird, kann
eine Suchabfrage, die zwei oder mehr Terme benötigt, modifiziert werden, um nur
einen Untersatz oder wenige Untersätze von den zwei oder mehr Termen benötigen
(z. B. die Änderung von "UND"-Operatoren in der Suchabfrage in "ODER"-
Operatoren). In ähnlicher Weise kann die Suchabfrage modifiziert werden, falls eine
Suche zuviele Dokumente erzeugt, indem die Anforderung gestellt wird, daß mehrere
Suchterme in jedem Dokument sind, anstatt daß Dokumente zugelassen werden, die
nur einen Untersatz jener Terme aufweisen (z. B. die Änderung irgendeines "ODER"-
Operators in einen "UND "-Operator).
Die Gateway 102 kann dem Benutzer über ein Faxgerät 101 eine Liste von
aktualisierten modifizierten Suchvorgängen senden, aus denen der Benutzer wählen
kann. Bei einer Ausführungsform ähnelt die Liste der Auflistung von Datenbanken
in Fig. 3 und eine bestimmte Suche oder bestimmte Suchvorgänge können auf
dieselbe Art und Weise ausgewählt werden, wie jene Datenbanken gewählt wurden,
wie zum Beispiel durch das Markieren (Einkreisen) eines maschinenlesbaren Kodes
(z. B. Strichkode) oder durch das Schreiben einer Zahl oder eines Buchstabens, der
mit einer bestimmten Suche bei einer gewissen Stelle auf der Seite mit der Auflistung
in Beziehung steht. Es kann ein Platz für den Benutzer vorgesehen sein, um eine
eigene modifizierte Suche bereitzustellen. Bemerkenswert ist ebenso, daß die Liste
möglicher Abfragen bzw. Suchvorgänge die Anzahl von Dokumenten, die jede der
möglichen Suchvorgänge erfüllen, anzeigen. Dies kann dem Benutzer helfen, zu
entscheiden, welche Suche er auswählt.
Bemerkenswert ist, daß der Sucher immer Terme zu dem Originalformular addieren
kann und sie erneut senden kann.
Fig. 2B zeigt den Suchvorgang. Nimmt man Bezug auf Fig. 2B, so weist ein
Suchformular 210 einen Suchterm "Ricoh" auf, der in die Box 210A geschrieben ist.
Das Suchformular 210 wird in das Faxgerät 201 eingegeben und zu der Gateway 102
gesendet. Der Detektor 214 identifiziert den Text "Ricoh" und sendet Bitmaps des
Textes zu der HCR-Maschine 212. Die Ergebnisse, die durch die HCR-Maschine
212 erzeugt werden, werden von der Suchmaschine 213 verwendet, die die Suche
ausführt. Die Suchergebnisse werden dann über das Faxgerät 101 zurückgegeben.
Bei einer Ausführungsform sendet die Gateway 102, die als ein Web-Client agiert,
die Suchabfrage zu einem oder mehreren Servern. Die Gateway 102 kann Suchterme
den Server oder den Servern auf eine Vielfalt von Weisen bereitstellen. Zum Beispiel
kann die Gateway 102 ein "get"-Verfahren bzw. "Bekommen" -Verfahren ausführen,
bei dem die Suchterme in der URL kodiert sind und ihr Vorhandensein wird durch
einen oder mehrere addierte abgesetzte Charakter bzw. Zeichen (z. B. das Zeichen
"?") hervorgehoben. Der Server empfängt die URL und analysiert diese syntaktisch
um die Suchterme zu lokalisieren (über die hinzugefügten abgesetzten Charakter).
Wenn einmal die Suchterme aus der URL dekodiert worden sind erzeugt der Server
eine Abfrage von den Suchtermen und führt die Suche in einer Art und Weise durch,
die in der Fachwelt gut bekannt ist. Bei einer anderen Ausführungsform sendet die
Gateway 102 eine URL zu einem Server oder zu mehreren Servern, um eine
Verbindung auszulösen und um die Server bzw. den Server zu veranlassen, in einen
Modus einzutreten, in dem er auf Suchterme wartet. Wenn einmal die Verbindung
errichtet worden ist, stellt die Gateway 102 die Suchterme dem Server bzw. den
Servern bereit. Ein Server empfängt die Suchterme, erzeugt automatisch eine
Suchabfrage und führt die Suche durch. Dies wird als "Post"-Operation bezeichnet.
Bei einer anderen Ausführungsform weist die Suchmaschine 213 ein Programm auf,
das auf der Gateway 102 läuft und daß eine Datenbank bzw. Datenbasis (ausgehend
von den gegebenen Standorten) nach den extrahierten Schlüsselwörtern durchsucht.
Die Datenbank befindet sich typischerweise bei der Gateway 102. Dies ist jedoch
nicht erforderlich. Die Gateway 102 braucht nur irgendwelche Mittel, um die
Datenbank bzw. die Datenbanken oder auf die Information über ihren Inhalt
zuzugreifen. Fig. 2C zeigt die Kommunikation zwischen Client und Server im
allgemeinen. Eine derartige Kommunikation findet zwischen der Gateway und
mehreren Servern in dem Web statt. Nimmt man Bezug auf Fig. 2C, so gibt der
Client 401 der vorliegenden Erfindung eine Anfrage (/Anfrage/Datei.html bzw.
"/request/file.html") an den Web-Server 402 der unter dem Domainnamen
"Name.org" bekannt ist. Der Web-Server 402 sendet das Dokument an den Clienten
401. Das gesendete Dokument beinhaltet einen Kopftext und ein HTML-Dokument,
das in ASCII formartiert ist.
Fig. 2D zeigt eine Ausführungsform der Gateway 102. Nimmt man Bezug auf
Fig. 2D, so werden Faxe von einem Faxmodem 302 in der Gateway 102
empfangen und gesendet. Faxmodem sind in der Fachwelt gut bekannt. Die
empfangenen Faxe werden durch eine Parsereinheit 303, die die Suchterme
extrahiert, syntaktisch bzw. grammatikalisch analysiert. Indem die extrahierten
Suchterme verwendet werden, erzeugt der URL-Generator 304 URLs und gibt die
URLs als Abfragen an den Web-Client 305 weiter bzw. sendet diese an ihn. Der
Web-Client 305 sendet die Abfragen an die Server über das Internet.
Der Web-Client 305 empfängt Dokumentdaten, die über das Internet zurückgegeben
werden. Die Dokumentdaten können Zeiger zu Dokumenten aufweisen, die die
Suchabfrage erfüllen bzw. befriedigen. Optional kann die Gateway 102 eine
zusätzliche Verarbeitungs- und Filtereinheit 306 beinhalten, die mit den Dokument
daten arbeitet bzw. auf diese einwirkt die durch den Web-Clients 305 empfangen
wurden, und zwar wie oben beschrieben wurde. Eine derartige Verarbeitung kann
Suchergebnisse von den Antworten mehrerer Server kombinieren. Die Verarbeitung
kann ebenso ein Bewertungssystem beinhalten, durch die die Gateway 102 bestimmt,
wie eng die Ergebnisse mit der Suchabfrage übereinstimmen. Sie kann zusätzlich
eine Verarbeitungslogik beinhalten, durch die jene Suchergebnisse, die nicht so gut
übereinstimmen, gelöscht bzw. nicht beachtet werden. Die sich ergebenden
Dokumentdaten (von dem Web-Client 305 oder von einer zusätzlichen Ver
arbeitung/Filterung 306) werden durch die Dokumentrückgabeeinheit 307 übergeben
bzw. zurückgegeben. Die zurückgegebenen Dokumente werden zu dem Faxmodem
302 gesendet, das die Dokumente zu einem Faxgerät oder zu mehreren Faxgeräten
faxt.
Jede der Einheiten in der Fig. 2D kann als Hardware, Software oder als eine
Kombination aus beiden implementiert sein. Bei einer Ausführungsform kann die
Parsereinheit 303, der URL-Generator 304, der Web-Client 305, die zusätzliche
Verarbeitungs- und Filtereinheit 306 und die Dokumentrückgabeeinheit 307 in
Software implementiert sein, die auf der Gateway 102 läuft. Bemerkenswert ist, daß
Hardware innerhalb der Gateway 102, die jede der Komponenten unterstützt, in der
Fachwelt gut bekannt ist und Pufferspeicher, Kommunikationsempfangs- und
Übertragungshardware etc. beinhaltet.
Fig. 4 ist ein Flußdiagramm, das den Prozeß der Dokumentbeschaffung erläutert,
die von dem Benutzer des Faxgeräts 101 gemäß der vorliegenden Erfindung
durchgeführt wird. Nimmt man Bezug auf Fig. 4, so beginnt der Benutzer den
Prozeß, indem die Kommunikation zwischen dem Faxgerät 101 und der Gateway 102
ausgelöst wird (Verarbeitungsblock 401), und zwar in derselben Art und Weise, wie
oben beschrieben, wobei die Dokumente bzw. das Dokument die bzw. das sich aus
den Suchergebnissen bzw. dem Suchergebnis ergibt zu dem Benutzer gesendet wird
(Verarbeitungsblock 402).
Die Suchergebnis-Dokumente bzw. das Suchergebnis-Dokument, das von der
Gateway 102 empfangen wird, beinhaltet Verbindungen zu den Dokumenten, die die
Suchkriterien erfüllen und können für den Benutzer beschafft werden. Bei einer
Ausführungsform handelt es sich bei den Verbindungen bzw. Links um Hypertext-
Links bzw. Hypertext-Verbindungen. Die Links werden kodiert und in maschinenles
bare Information auf dem Dokument formatiert. Die maschinenlesbare Information
kann in digitaler Form sein, wie zum Beispiel ein Strichkode oder Digitalpapier
("digital paper"). Ein Ausführungsbeispiel dafür ist in dem US-Patent 5,337,362
beschrieben, das den Titel trägt "Method and Apparatus for Placing Data Onto Plain
Papier" und das am 9. August 1994 veröffentlicht wurde und dem Anmelder der
vorliegenden Erfindung übertragen wurde. Andere Typen von Kodierung können bei
der vorliegenden Erfindung verwendet werden, solange eine Identifikation und
Selektion von Verbindungen möglich sind.
Bei einer Ausführungsform beinhaltet das Suchergebnis-Dokument, das von der
Gateway 102 empfangen wird, maschinenlesbare Information, die die
Hypertext-Links oder "hot spots" anzeigt, die mit einem Kreis umgeben werden können bzw.
eingekreist werden können, um weitere Dokumente zu beschaffen. Bei einer
Ausführungsform ist die maschinenlesbare Information unter einem Bild oder einem
Textabschnitt plaziert. Auf diese Art und Weise ist es dem Benutzer klar bewußt
welche Verbindungen bzw. Links aktiv sind. Die maschinenlesbare Information kann
auf den Universal Resource Locator (URL) der angelinkten Dokumente, die beschafft
werden sollen, hinweisen. Die URL identifiziert und lokalisiert das Dokument auf
dem World Wide Web und ist in der Fachwelt gut bekannt. Ein Beispieldokument,
das einen Text mit Strichkodes zeigt die Links unter dem Text in dem Dokument
darstellen, ist in Fig. 5 gezeigt. Bei einer alternativen Ausführungsform können
Ikons verwendet werden, um die Links darzustellen. Viele Ikons können auf eine
einzige Seite passen und die Ikons selbst könnten maschinenlesbare URL-Information
beinhalten.
Der Benutzer wählt eine oder mehrere Links aus dem Dokument, indem er auf jene
Dokumente hinweist, die gewünscht sind (Verarbeitungsblock 403). Bei einer
Ausführungsform wählt der Benutzer einen Link auf dem Dokument, indem der Link
mit einem Kreis umgeben wird. Jegliche Art und Weise, mit der ein Link eingekreist
oder markiert wird, stellt ein Mittel zur Auswahl jenes Links dar und kann gemäß
der vorliegenden Erfindung verwendet werden. Zum Beispiel kann ein Quadrat oder
eine andere Form um einen Link gezeichnet werden, um ihn auszuwählen.
Bei einer alternativen Ausführungsform kann das Dokument eine spezielle
Eingabestelle (z. B. eine Box) aufweisen, in die der Benutzer die gewünschten Links
oder Dokumente oder andere Informationen schreibt, um die gewünschten
Dokumente zu identifizieren. Zum Beispiel kann das Dokument ein Formular mit
Eingabeboxen für den Benutzer beinhalten, um Auswahlkriterien bzw. die Auswahl
dort hinein zu schreiben. Bemerkenswert ist, daß in diesem Fall die Gateway 102
eine gewisse Art von Zeichenerkennung bzw. Charaktererkennung durchführen kann,
um die Auswahl bzw. die Auswahlkriterien zu bestimmen.
Bei einer Ausführungsform kann ein Link ausgewählt werden, indem Zahlen
eingegeben werden, die mit jedem Link auf einem Tastaturfeld verbunden sind, wie
zum Beispiel das Tastaturfeld des Faxgeräts 101.
Nimmt man Bezug auf Fig. 5, so wird eine der Links von dem Benutzer
ausgewählt, indem der Strichkode, der dem Link entspricht, mit einem Kreis
umgeben wird bzw. eingekreist wird. Bemerkenswert ist, daß der Text oder die
Grafiken, die den Link begleiten, nicht eingekreist werden müssen oder anderweitig
ausgewählt werden müssen. Ein Benutzer kann eine beliebige Anzahl von Links auf
dem Dokument auswählen. Mit anderen Worten kann der Benutzer jede Anzahl von
Strichkodes mit einem Kreis umgeben, die in dem Dokument enthalten sind.
Der Vorgang der Auswahl kann sowohl ein Hervorheben eines Teils eines Bildes
(zum Beispiel das Einkreisen eines Links) als auch das Plazieren einer Markierung
auf einer bestimmten Stelle des Bildes beinhalten. Basierend auf sowohl der
Hervorhebung als auch der Stelle der Markierung kann ein Dokument oder können
mehrere Dokumente beschafft werden.
Nach der Auswahl führt der Benutzer das Dokument in das Faxgerät 101 ein und
faxt das Dokument zu der Gateway 102 (Verarbeitungsblock 404), die wiederum das
Dokument von irgendwo in der Welt über das World Wide Web 103 oder über eine
sonst irgendwie elektronisch zugängliche Quelle beschafft und faxt die zurückgegebe
nen Versionen der abgefragten Dokumente zu dem Faxgerät 101 oder zu irgendeiner
anderen elektronisch zugänglichen Quelle.
Das Faxgerät 101 erzeugt Hardkopien der beschafften Dokumente, die von der
Gateway 102 gefaxt wurden (Verarbeitungsblock 405). Der Benutzer kann weitere
Information beschaffen, indem er Links bzw. Verknüpfungen auswählt (z. B.
einkreist), und zwar auf den neu empfangenen Dokumenten, und indem er dann die
Verarbeitungsblöcke 404 und 405 wiederholt.
Die Gateway 102 empfängt und verarbeitet Facsimileübertragungen, die von dem
Faxgerät 101 empfangen wurden und die eine Dokumentbeschaffungsabfrage
beinhalten. Die Gateway 102 erfüllt die Abfragen bzw. die Anforderungen, indem
sie Dokumente beschafft, die den Links entsprechen, die auf dem Dokument
ausgewählt wurden. Die Verarbeitung der Verarbeitungslogik der Gateway 102, um
die Dokumentbeschaffungsabfrage zu empfangen und ausgehend von den Suchergeb
nissen auszufüllen, ist durch das Flußdiagramm in Fig. 6 gezeigt.
Die Verarbeitungslogik der Gateway 102 fängt an, wenn der Benutzer ein Dokument
mit eingekreisten bzw. umkreisten Links bzw. Verknüpfungen (z. B. Hypertext etc.)
zu der Gateway 102 faxt. Nimmt man Bezug auf Fig. 6, so empfängt die Gateway
102 anfänglich das Faxbild, zum Beispiel über ein Faxmodem (Verarbeitungsblock
601), wie zum Beispiel das Bild von dem Dokument, das in Fig. 5 gezeigt ist.
Nach dem Empfang des Faxes bestimmt die Gateway 102 den Lokalisie
rer/Identifizierer (z. B. die URL) des Dokuments bzw. der Dokumente, die
ausgehend von dem gefaxten Bild beschafft werden sollen (Verarbeitungsblock 602).
Die Gateway 102 führt die Bestimmung durch, indem die maschinenlesbare
Information extrahiert wird, die von dem Benutzer ausgewählt wird. Bei einer
Ausführungsform extrahiert die Gateway 102 die ausgewählten Links, indem eine
Erkennungstechnik und eine digitale Dekodiertechnik verwendet wird, die in der
Fachwelt gut bekannt ist. Eine Ausführungsform des Extraktionsprozesses, der von
der Gateway 102 durchgeführt wird, wird unten in Verbindung mit Fig. 7
beschrieben.
Bei einer Ausführungsform wird ein "Strichkode" oder ein "eindimensionales
digitales Papier" ("one-dimensional digital papier") verwendet, das bezüglich der
Auflösungsdifferenzen zwischen unterschiedlichen Bitmap-Darstellungen des Bildes
unempfindlich ist. Die Strichkodes ("bar codes") weisen alternierend schwarze und
weiße Stellen auf. Die Information ist in den relativen Lauflängen des schwarzen
enthalten. Jeder Kode beginnt mit einem speziellen Marker einer schwarzen Stelle,
die von einer weißen Stelle gefolgt wird, die von einer anderen schwarzen Stelle
gefolgt wird, wobei die Länge der weißen Stelle in etwa der Länge jeder der
umgebenden schwarzen Stellen gleich ist. Ein darauffolgender Lauf von schwarz
wird mit der mittleren Länge der Läufe in der Startsequenz verglichen und als ein
Vielfaches jeder Länge interpretiert. Eine Endsequenz, die der Startsequenz ähnelt,
wird für einen gültigen Kode benötigt. Jeglicher langer Lauf in weiß vor der
Endsequenz wird den Kode ungültig machen. Da der maschinenlesbare Kode auf den
relativen Längen der Läufe basiert, ist er hinsichtlich der Auflösung unempfindlich
und kann schnell in einem einzigen Durchgang durch das Bild berechnet werden.
Dickere Kodes (z. B. die Höhe) geben eine Redundanz hinzu und machen ihn
gegenüber einem Versatz und gegenüber Rauschen unempfindlich.
Wenn das Dokument zum Beispiel ein Formular aufweist, kann an die Gateway 102
die Anforderung gestellt werden, eine Erkennung auf bestimmten Gebieten oder
Boxen auf dem Bild durchzuführen, um das zu beschaffende Dokument zu
identifizieren. Die Gateway 102 kann ebenso Markierungen (z. B. "x" etc.)
lokalisieren müssen, die auf dem Dokument von dem Benutzer plaziert werden und
die einen Teil des Dokumentauswahlprozesses darstellen.
Indem der Lokalisierer/Identifizierer verwendet wird, beschafft die Gateway 102 die
gewünschten Dokumente über das Internet 105 (Verarbeitungsblock 603). Bemer
kenswert ist, daß die Gateway 102 ebenso veranlaßt werden kann, Markierungen zu
verwenden (z. B. "x"), die sich auf dem Bild zusammen mit dem Lokalisie
rer/Identifizierer befinden, um ein Dokument zu beschaffen. In einem derartigen Fall
wird ein anderes Dokument gesendet, falls die Markierung an einer anderen Stelle
vorgenommen wird, obwohl der Lokalisierer/Identifizierer derselbe ist. Dies fügt ein
Schlüsselwertpaar zu der URL hinzu, die die Gateway von einem Web-Server
abfragt und das die x-, y-Position der Markierung in dem Bild beinhaltet.
Wenn einmal das gewünschte Dokument erhalten worden ist, erzeugt die Gateway
102 ein Bild eines jeden Dokuments, um es zu dem Benutzer zu übertragen
(Verarbeitungsblock 404). Bei einer Ausführungsform erzeugt die Gateway 102
Bilder, und zwar in dem die Dokumente nach der Syntax analysiert werden,
formatiert werden und übergeben bzw. zurückgegeben werden. Das syntaktische
Analysieren des Dokuments ("parsing") sowie das Formatieren und Zurückgeben der
syntaktisch analysierten Dokumente, beinhaltet die Konversion bzw. Umwandlung
von Dokument-Identifizierern/Lokalisierern, die mit den beschafften Dokumenten in
Beziehung stehen, in einen maschinenlesbaren Kode (z. B. einen Strichkode, digitales
Papier, etc.), die in die Bilder mit aufgenommen werden sollen, die zu dem Benutzer
gefaxt werden (um eine Auswahl von zusätzlichen Dokumenten durch einen Benutzer
zu ermöglichen). Das Zurückgeben ist bei den meisten Dokumenten notwendig, um
die Daten von einem ASCII-Format in ein Raster-Bitmap, das Protokoll, das von
Faxgeräten (und anderen Markiermaschinen) verwendet wird, umzuwandeln.
Wenn einmal das Bild erzeugt worden ist, sendet die Gateway 102 das Bild über das
Fax zu dem Benutzer (Verarbeitungsblock 605). Nach dem Empfang der beschafften
Dokumente von der Gateway 102, kann der Benutzer zusätzliche Dokumente für die
Beschaffung, wie oben beschrieben, auswählen. Auf diese Art und Weise kann ein
Faxgerät jegliches Dokument auf dem Web beschaffen, ohne daß er über einen
Internetanschluß verfügen muß.
Die Gateway 102 kann nicht nur eine angeforderte Seite zurückgeben sondern sie
kann ebenso alle oder manche Seitenzahlen zurückgeben, auf die durch jene Seite
hingewiesen wurde. Auf der anderen Seite kann die Gateway 102 Seiten, die sehr
lang sind, aufspalten und nur einen Teil der Seite zusammen mit einer Verknüpfung
zu dem Rest zurückgeben.
Fig. 7 zeigt eine Ausführungsform des Extraktionsprozesses, der durch die Gateway
102 der vorliegenden Erfindung durchgeführt wird. Nimmt man Bezug auf Fig. 7,
so extrahiert die Gateway 102 anfänglich eingekreiste bzw. umkreiste Regionen von
dem gefaxten Bild, das über sein Faxmodem bzw. über seine Faxmodems empfangen
wurde (Verarbeitungsblock 701). Bei einer Ausführungsform werden die umkreisten
bzw. eingekreisten Regionen extrahiert, indem das ganze Bild mit Ausnahme der
umkreisten Bereiche mit einer einzigen Farbe bemalt wird (z. B. schwarz). Somit
verbleibt nur die maschinenlesbare Information (z. B. die Strichkodes), die eingekreist
ist, nachdem das Bild bemalt wurde. Ein Beispiel eines bemalten Bilds ist in Fig.
8 zu sehen.
Dann durchsucht die Verarbeitungslogik der Gateway 102 das Dokument nach
eingekreisten Bereichen (nicht bemalte Bereiche), und zwar basierend auf der Farbe
der Pixel, bis die eingekreisten Bereiche erhalten bzw. gefunden wurden.
Nachdem die eingekreisten Bereiche extrahiert wurden, wird die Information
rekodiert, um die Identifizierer/Lokalisierer-URL zu bestimmen (Verarbeitungsblock
702). Somit werden die Strichkodes oder andere maschinenlesbare Kodes, die auf
dem empfangenen, gefaxten Bild eingekreist sind, dekodiert, um einen Kode zu
produzieren.
Indem der Kode verwendet wird, erzielt die Gateway 102 den Identifizie
rer/Lokalisierer (z. B. URL) (Verarbeitungsblock 703). Bei einer Ausführungsform
weist der Kode den Identifizierer/Lokalisierer (z. B. die URL). Bei einer alternativen
Ausführungsform wird der Kode, der sich aus der Dekodierung ergibt, die durch die
Gateway 102 durchgeführt wurde, von der Gateway 102 als ein Zeiger auf eine
Speicherstelle, Liste oder Tabelle verwendet, auf die zugegriffen werden kann und
die den Identifizierer, Lokalisierer enthält. Als einen Zeiger kann der Kode einen
ersten Abschnitt beinhalten, der einem Zeiger auf die Liste oder Tabelle darstellt,
und einen zweiten Abschnitt beinhalten, der den Eintrag in der Liste oder Tabelle
anzeigt, die den Identifizierer/Lokalisierer beinhaltet. Bemerkenswert ist, daß bei
einer Ausführungsform alle Identifizierer/Lokalisierer auf der Oberseite des gefaxten
Bildes erscheinen, wobei der Kode anzeigt, welche der aufgelisteten Identifizie
rer/Lokalisierer der Benutzer ausgewählt hat.
Eine Ausführungsform der Gateway der vorliegenden Erfindung umfaßt ein
Computersystem und eine Workstation mit wenigstens einem Prozessor, einem
Speicher mit wahlfreiem Zugriff und einem Bus, und sie betreibt ein Betriebssystem
usw. Fig. 9 ist ein Blockdiagramm einer Ausführungsform des Computersystems,
das die Lehren der vorliegenden Erfindung verkörpern kann. Nimmt man Bezug auf
Fig. 9, so umfaßt das Computersystem 900 einen Bus oder eine andere Kommuni
kationseinrichtung 901, um Information zu übermitteln und einen Prozessor 902, der
mit dem Bus 901 zur Informationsverarbeitung verbunden ist.
Das System 900 weist weiter einen Speicher mit wahlfreiem Zugriff (RAM) oder
eine andere dynamische Speichervorrichtung 904 (Hauptspeicher genannt) auf, die
mit dem Bus 901 zur Speicherung von Information und Befehlen, die durch den
Prozessor 902 ausgeführt werden sollen, verbunden ist. Der Hauptspeicher 904 kann
ebenso zum temporären Speichern von Variablen oder anderen Zwischeninformatio
nen während der Ausführung von Befehlen durch den Prozessor 902 verwendet
werden. Das Computersystem 900 weist ebenso einen Nur-Lesespeicher (ROM)
und/oder andere statische Speichervorrichtungen 906 auf, die mit dem Bus 901 zum
Speichern statischer Information und von Befehlen für einen Prozessor 902
verbunden sind, und sie weist eine Datenspeichervorrichtung 907, wie zum Beispiel
eine magnetische Platte oder eine optische Platte und ihr entsprechendes Disketten
laufwerk bzw. Plattenantriebseinrichtung auf. Die Datenspeichervorrichtung 907 ist
mit dem Bus 901 zum Speichern von Informationen und Befehlen verbunden.
Das Computersystem 900 weist ebenso Faxmodems 940 und eine Internetverbindung
941 auf. Bei der Internetverbindung 941 kann es sich um eine lokale Gebiets
verbindung (z. B. Ethernet) bzw. um ein lokales Netzwerk handeln oder es kann sich
um eine ISDN-Leitung handeln. Bei einer anderen Ausführungsform können sich bei
der Internetverbindung 941 um ein Modem handeln, das ein PPP oder ein SLIP
betreibt. Die vorliegende Erfindung ist nicht auf eine Verwendung mit dem Internet
beschränkt und somit kann die Verbindung 941 für eine Verbindung mit jedem
beliebigen Netzwerk verwendet werden, indem die TCP/IP oder andere Protokolle
verwendet werden, mit denen ein "Router" verbunden ist, der eine Verbindung mit
einem anderen Netzwerk ermöglicht. Die zwei Netzwerke bilden ein
"Inter-Netzwerk". Das Internet bezieht sich auf das größte weltweite Set von derartig
verbundenen Netzwerken, das Information zwischen ihnen hin und her übertragen
kann. Mögliche Verfahren zur Verbindung mit einem Netzwerk beinhalten eine
physikalische Kommunikationsverbindung, wie zum Beispiel Ethernet, ISDN,
Modem- und Telefonleitungen oder drahtlose Modems und TCP/IP, SLIP oder
PPP-Software.
Das Computersystem 900 kann weiter verschiedene Eingabe-/Ausgabe-Periphergerä
te, wie zum Beispiel eine Anzeigevorrichtung, wie zum Beispiel eine Kathoden
strahlröhre (CRT) oder eine Flüssigkristallanzeige (LCD) beinhalten, die mit einem
Bus 901 verbunden ist, um Information einem Computerbenutzer anzuzeigen. Eine
alphanumerische Eingabevorrichtung, die alphanumerische oder andere Tasten mit
einschließt, kann ebenso mit dem Bus 901 verbunden sein, um Information und eine
Befehlsauswahl zu einem Prozessor 902 zu übermitteln. Eine zusätzliche Benutzer
eingabevorrichtung ist die Cursorsteuerung, wie zum Beispiel eine Maus, ein
Trackball, eine Schreibnadel bzw. ein stiftähnliches Abtastgerät ("Stylus") oder
Cursorrichtungstasten, die mit dem Bus 901 verbunden sind, um eine Richtungs
information und eine Befehlsauswahl zu dem Prozessor 902 zu übermitteln und um
eine Cursorbewegung auf einer Anzeige zu steuern. Eine andere Vorrichtung, die mit
dem Bus 901 verbunden sein kann, ist eine Hardcopy-Vorrichtung, die verwendet
werden kann, um Befehle, Daten oder andere Informationen auf einem Medium, wie
zum Beispiel Papier, Film oder ähnlichen Typen von Medien zu drucken.
Bemerkenswert ist es, daß irgendeine oder alle der Bestandteile des Systems 900 und
eine zugeordnete Hardware verwendet werden kann; jedoch kann es begrüßt werden,
daß jeglicher Typ von Konfiguration des Systems für vielfältige Zwecke, wie sie der
Benutzer benötigt, verwendet werden kann.
Der Benutzer oder Kunde braucht nur ein Faxgerät zu haben, das mit der Gateway
der vorliegenden Erfindung gekoppelt ist, die einen Austausch von Dokumenten
(über Telefonleitungen) erlaubt.
Als eine Gateway kann das Computersystem 900 der vorliegenden Erfindung
verschiedene Software ablaufen lassen, um eine Vielfalt von Funktionen durch
zuführen. Bei einer Ausführungsform läßt das Computersystem 900 eine Internet
kommunikations-Protokollsoftware ablaufen, wie zum Beispiel TCP/IP, die bei den
Fachleuten gut bekannt ist. Das Computersystem 900 läßt ebenso eine Faxmodem-
Treibersoftware ablaufen, die verwendet wird, um Faxe zu senden und zu
empfangen. Es läßt auch Hypertext-Transferprotokoll-(HTTP)Serversoftware
ablaufen, wie zum Beispiel CERN- oder NCSA-Serversoftware, die in der Fachwelt
gut bekannt ist. Die Steuersoftware ist ebenso von dem Computersystem 900
ausgeführt, um gefaxte Bilder, wie oben beschrieben, handzuhaben. Das Computer
system 900 kann ebenso eine Charakter-Erkennungssoftware sowie eine
Bitmap-Extraktions- und Verarbeitungssoftware ausführen. Ebenso führt das Computersystem
900 Software (z. B. HTTP-Clientsoftware) aus, um einen Identifizierer/Lokalisierer
(z. B. eine URL) zu beschaffen und sie für ein Faxgerät geeignet zu formatieren.
Bei einer Ausführungsform beschafft die Software, die auf dem Computersystem 900
läuft, die Rückruf-Telefonnummer, um zu bestimmen, wohin die beschafften
Dokumente zurückgegeben werden sollen. Die Telefonnummer kann ebenso während
des Quittungsaustausches bzw. des "Handshaking" erhalten werden, wobei die
Software sie in ein Tiff-Bild mit einbringt. Bei einer alternativen Ausführungsform
verbleibt das Faxgerät in Verbindung mit der Gateway (also verbleibt daran
angeschlossen), während das Dokument beschafft und dann zurückgesendet wird.
Bei einer Ausführungsform beschneidet die Software, die auf dem Computersystem
900 läuft, während der Bildverarbeitung die Ränder des Bildes, identifiziert, welche
aktiven Regionen eingekreist wurden, füllt jene Gebiete des Bildes auf, die nicht
eingekreist wurden, lokalisiert und analysiert syntaktisch jeglichen verbleibenden
Identifizierer, der maschinenlesbar ist, und zwar bezüglich jeder maschinenlesbaren
Papiermarke, die dekodiert ist, und findet die entsprechende URL in einer
Datenbasis bzw. Datenbank von URLs, die zu dem Benutzer gesendet worden ist.
Bemerkenswert ist, daß bei einer Ausführungsform jedes Dokument einer einzigen
ID zugewiesen wird, wenn sie über die Gateway zurückgegeben wird. Diese ID wird
am oberen Ende des Dokuments gedruckt und spezifiziert den Rahmen einer Datei,
die die Abbildung bzw. das Zuordnen ("mapping") zwischen den maschinenlesbaren
Kodes und den URLs beinhaltet bzw. hält.
Nach der Verarbeitung des Bildes übergibt das Computersystem 900 jede URL und
die Rückruftelefonnummer zu der Beschaffungs- und Rückgabesoftware. Die
Beschaffungs- und Rückgabemaschine beschafft die URL, analysiert das Dokument
syntalltisch und gibt es (einschließlich des digitalen Papiers) zurück, aktualisiert die
Datenbank des Dokumentidentifizierers und sendet das zurückgegebene Dokument
über Fax zu der Rückruftelefonnummer.
Die Beschaffungs- und Rückgabesoftware beschafft die URL und wandelt jede URL
in dem beschafften Dokument in eine globale bzw. weltweite URL um, die eine volle
Spezifikation des Orts des Links bzw. der Verbindung beinhaltet.
Bei einer Ausführungsform wandelt die Software das beschaffte Dokument, das sich
in einem HTML-Format befindet, in ein PostScript-Format oder direkt in ein G3-
Faxformat um. Die In-Line-Bilder werden ebenso beschafft und in PostScript
konvertiert, um in dem Dokument mit aufgenommen zu werden. Bemerkenswert ist,
daß bei dieser Ausführungsform eine HTML-Quelle in ein "LaTEX"-Format
umgewandelt wird. Das heißt, die HTML-Quelle wird in eine Quelle für das LaTEX-
Dokument-Formatiersystem umgewandelt. Die LaTEX-Quelle beinhaltet Befehle, um
die digitalen Papiermarken zu erzeugen. Die Software, die auf dem Computersystem
900 läuft, weist Link-Zahlen bzw. Verknüpfungszahlen jedem Link zu und beinhaltet
die geeigneten LaTEX-Befehle in einer LaTEX-Quellendatei, um jene Kodes in
einem maschinenlesbaren Format zu drucken. Bemerkenswert ist, daß eine Marke
erzeugt wird, um das Dokument zu identifizieren, und als ein Kopf auf jeder Seite
gedruckt wird. Die Software speichert ebenso eine Liste von Kodes und die URLs
in einer temporären Datei. Die maschinenlesbaren Identifizierer werden erzeugt und
der maschinenlesbare Kode wird unter dem Text gedruckt. Die Software, die auf
dem Computersystem 900 läuft, erzeugt dann ein PostScript-Bild, in dem zum
Beispiel LaTEX-dvips verwendet werden.
Bei LaTEX handelt es sich um ein Makropaket für Tex, einem Softwareprogramm,
das von Donald Knuth bei der Stanford University, Palo Alto, Kalifornien
geschrieben worden ist. LaTEX erzeugt "dvi" (vorrichtungsunabhängige bzw.
"device independent") Aufgaben, ausgehend von der LaTEX-Quelle. Diese kann in
PostScript übersetzt werden, in dem "dvips" verwendet wird, ein Softwareprogramm,
das von Thomas Rokicki bei der Stanford University, Palo Alto, Kalifornien,
geschrieben wurde. Alle diese Programme sind in der Fachwelt gut bekannt.
Zusammengefaßt kann jedes Dokument auf dem World Wide Web über die Gateway
der vorliegenden Erfindung beschafft werden. Alles was der Benutzer braucht, ist
eine Telefonnummer des Gateways der vorliegenden Erfindung. Eine Gateway kann
ein regionales Gebiet bedienen oder es kann sich um eine Proxy-Maschine für alle
ihr bekannten Faxgeräte handeln.
Weiter kann jede Seite eine gewisse zusätzliche maschinenlesbare Information
beinhalten. Bei einer Ausführungsform identifiziert eine Marke pro Seite die Seite
und ein Bit der maschinenlesbaren Information wird unter jeder aktiven Verknüpfung
bzw. unter jedem aktiven Link gedruckt. Somit kann eine URL-Bezugnahme auf eine
robuste, seitenunabhängige Art und Weise durchgeführt werden.
Schließlich kann es sich bei einer modifizierten Version der Gateway um eine Fax-
Verbesserungs- oder Austausch- bzw. Ersatzmaschine handeln, die einzelne Personen
direkt verwenden können. Diese Maschine wäre in der Lage eine Schnittstelle zu
dem Internetprotokoll direkt bereitzustellen und würde einen Internetzugriffspunkt
direkt anrufen, wenn sie aufgefordert wird, ein Web-Dokument zu beschaffen. In
diesem Fall wäre ein Vorteil eine starke Vereinfachung des Zugriffs zu dem World
Wide Web (und) in dem die Basisfunktionen des Faxgeräts verwendet werden.
Bemerkenswert ist, daß zusätzlich zu dem Web-Zugriff eine derartige Maschine
einen E-mail-Zugriff bereitstellen könnte.
Die Erfindung betrifft insbesondere eine Vorrichtung (insbesondere eine Gateway),
die an ein öffentliches (digitales oder analoges) Telefonnetz (oder ein ähnliches Netz)
und an ein Netzwerk, insbesondere das Internet anschließbar ist und in beide Netze
Daten abgeben und davon empfangen kann. Die Vorrichtung bzw. die Gateway weist
vorzugsweise eine Einrichtung auf, um über das Telefonnetz empfangene Faxnach
richten bzw. Faxinformationen nach Suchanforderungen bzw. -anfragen zu
durchsuchen bzw. zu analysieren und die Suchanforderungen somit festzustellen, und
eine Einrichtung, um aufgrund der festgestellten Suchanforderungen bzw. Suchan
fragen eine Suche in dem Netzwerk durchzuführen und aus dem Netzwerk
Suchergebnisse zu beschaffen. Schließlich weist die Vorrichtung bzw. die Gateway
vorzugsweise eine Einrichtung auf, die so ausgebildet ist, daß sie die beschafften
Suchergebnisse über das Telefonnetz (oder ein ähnliches Netz) an ein Faxgerät
senden kann.
Die Erfindung läßt sich beispielsweise wie folgt zusammenfassen:
Während Web-Server und Web-Clients, wie zum Beispiel Mosiac. die Tür für eine
On-Line-Veröffentlichung und für eine On-Line-Benutzung von Information geöffnet
haben, können diese Dienste nur von denjenigen genutzt werden, die einen
Internetanschluß haben. Mit anderen Worten einzelne Personen, die keinen
Internetanschluß mit einem Computer und einem Datenkanal zum Internet haben,
können nicht nach Dokumenten oder anderen Quellen bzw. Resourcen suchen, die
über das Web verfügbar sind. Die vorliegende Erfindung erhält bzw. verschafft
Dokumente, indem eine Faxübertragung eines Dokuments mit wenigstens einem
Suchterm empfangen wird und indem eine Suche, basierend auf den Suchtermen, die
sich auf dem empfangenen Dokument befinden, durchgeführt wird. Insbesondere
betrifft sie eine Vorrichtung und ein Verfahren zum Empfangen der Faxübertragung
und zum Durchführen der Suche.
201 - erstelle Kommunikation zwischen dem Faxgerät und der Gateway
202 - empfange Dokument(e) von Gateway
203 - fülle Suchformular aus
204 - faxe Formular zu der Gateway
205 - identifiziere Suchtermstellen
206 - detektiere Text bzw. Geschriebenes in Suchtermstellen
207 - extrahiere Bitmap von Suchtermstellen
208 - führe Charaktererkennung mit extrahierten Bitmaps durch
209 - erzeuge Abfrage-String, basierend auf erkannten Charaktern
210 - führe Suche unter Verwendung der Abfrage durch
211 - gebe Suchergebnisse zurück
202 - empfange Dokument(e) von Gateway
203 - fülle Suchformular aus
204 - faxe Formular zu der Gateway
205 - identifiziere Suchtermstellen
206 - detektiere Text bzw. Geschriebenes in Suchtermstellen
207 - extrahiere Bitmap von Suchtermstellen
208 - führe Charaktererkennung mit extrahierten Bitmaps durch
209 - erzeuge Abfrage-String, basierend auf erkannten Charaktern
210 - führe Suche unter Verwendung der Abfrage durch
211 - gebe Suchergebnisse zurück
401 - erstelle Kommunikation zwischen dem Faxgerät und der Gateway
402 - empfange Dokument(e) von Gateway
403 - wähle Links entsprechend dem (den) gewünschten Dokument(en) aus
404 - faxe Dokument zur Gateway
405 - empfange gewünschte(s), von der Gateway beschaffte(s) und gefaxte(s) Dokument(e)
402 - empfange Dokument(e) von Gateway
403 - wähle Links entsprechend dem (den) gewünschten Dokument(en) aus
404 - faxe Dokument zur Gateway
405 - empfange gewünschte(s), von der Gateway beschaffte(s) und gefaxte(s) Dokument(e)
601 - empfange ein Fax vom Benutzer
602 - bestimme Identifizierer/Lokalisierer von zu beschaffenden Dokumenten
603 - beschaffe gewünschte Dokumente, indem Identifizierer/Lokalisierer verwendet werden
604 - erzeuge ein Bild von jedem der beschafften Dokumente
605 - sende Faxübertragung von erzeugten Bildern
602 - bestimme Identifizierer/Lokalisierer von zu beschaffenden Dokumenten
603 - beschaffe gewünschte Dokumente, indem Identifizierer/Lokalisierer verwendet werden
604 - erzeuge ein Bild von jedem der beschafften Dokumente
605 - sende Faxübertragung von erzeugten Bildern
701 - extrahiere eingekreiste Bereiche von empfangenem Faxbild, um maschinenles
bare Info zu erzeugen
702 - dekodiere erhaltene Information
703 - bestimme Identifizierer/Lokalisierer, basierend auf dekodierter Information.
702 - dekodiere erhaltene Information
703 - bestimme Identifizierer/Lokalisierer, basierend auf dekodierter Information.
Claims (29)
1. Verfahren zum Erhalten bzw. Verschaffen von Dokumenten, das die folgenden
Schritte aufweist:
eine Faxübertragung eines Dokuments mit einem Suchterm wird empfangen;
und
eine Suche, basierend auf wenigstens diesen einen genannten Suchterm wird in Antwort auf das Dokument durchgeführt.
eine Faxübertragung eines Dokuments mit einem Suchterm wird empfangen;
und
eine Suche, basierend auf wenigstens diesen einen genannten Suchterm wird in Antwort auf das Dokument durchgeführt.
2. Verfahren nach Anspruch 1, das weiter den Schritt aufweist, wonach die
Suchergebnisse über eine Faxübertragung gesendet werden.
3. Verfahren nach Anspruch 2, bei dem der Schritt des Sendens von Suchergebnissen
das Senden wenigstens eines Dokuments umfaßt.
4. Verfahren nach Anspruch 2 oder 3, bei welchem der Schritt des Sendens von
Suchergebnissen das Senden von einer Quelle bzw. Resource oder mehreren Quellen
bzw. Resourcen umfaßt, und zwar entsprechend dem genannten wenigstens einem
Suchterm.
5. Verfahren nach Anspruch 2, bei welchem der Schritt des Sendens von Suchergeb
nissen die folgenden Schritte aufweist:
ein Dokument wird gesendet, das einen Satz von Resourcen auflistet, die dem wenigstens einem Suchterm entsprechen;
das Dokument wird empfangen, das einen Satz oder mehrere Sätze von hervorgehobenen Resourcen aufweist;
die hervorgehobenen Resourcen werden auf dem Dokument identifiziert:
die hervorgehobenen Resourcen werden erhalten bzw. verschafft; und
die hervorgehobenen Resourcen werden über Faxübertragung gesendet.
ein Dokument wird gesendet, das einen Satz von Resourcen auflistet, die dem wenigstens einem Suchterm entsprechen;
das Dokument wird empfangen, das einen Satz oder mehrere Sätze von hervorgehobenen Resourcen aufweist;
die hervorgehobenen Resourcen werden auf dem Dokument identifiziert:
die hervorgehobenen Resourcen werden erhalten bzw. verschafft; und
die hervorgehobenen Resourcen werden über Faxübertragung gesendet.
6. Verfahren nach Anspruch 1, das weiter die Schritte aufweist:
Stellen von Suchtermen werden auf dem Dokument identifiziert;
Geschriebenes bzw. Text wird bei den Stellen detektiert, die als die Stellen identifiziert sind, die Suchterme beinhalten;
eine Erkennung wird bezüglich der Suchterme durchgeführt: und
eine Suchabfrage wird basierend auf den erkannten Suchtermen erzeugt.
Stellen von Suchtermen werden auf dem Dokument identifiziert;
Geschriebenes bzw. Text wird bei den Stellen detektiert, die als die Stellen identifiziert sind, die Suchterme beinhalten;
eine Erkennung wird bezüglich der Suchterme durchgeführt: und
eine Suchabfrage wird basierend auf den erkannten Suchtermen erzeugt.
7. Verfahren nach Anspruch 6, bei welchem der Schritt der Identifizierung von
Stellen die Lokalisierung von Strichkodes auf dem Dokument aufweist.
8. Verfahren nach Anspruch 6, bei welchem der Schritt der Identifizierung von
Stellen von Suchtermen, die Lokalisierung von wenigstens einer Box auf dem
Dokument, das einen Suchterm oder mehrere Suchterme aufweist, umfaßt.
9. Verfahren nach Anspruch 6, bei welchem der Schritt der Durchführung einer
Erkennung, den Schritt umfaßt, wonach ein Bitmap einer Suchstelle einer
Erkennungsmaschine bereitgestellt wird bzw. der Erkennungsmaschine zugeführt
wird.
10. Verfahren nach Anspruch 9, bei welchem der Schritt der Durchführung einer
Erkennung, den Schritt der Durchführung einer Handschrifterkennung aufweist.
11. Verfahren nach Anspruch 1, das weiter den Schritt der Modifizierung einer
Suchabfrage umfaßt, die eine Fuzzy-Anpassung verwendet.
12. Verfahren nach Anspruch 2, das weiter den Schritt aufweist, wonach die
Ergebnisse, basierend auf einer Metrik, gefiltert werden.
13. Verfahren nach Anspruch 12, bei welchem der Schritt, wonach Ergebnisse
gefiltert werden, das Entfernen von Duplikaten aus den Suchergebnissen umfaßt.
14. Verfahren nach Anspruch 1, bei welchem die Suche erzeugt wird, indem eine
URL erzeugt wird und ein Dokument beschafft wird, das mit einer URL von einem
Web-Server in Beziehung steht.
15. Verfahren zum Erhalten von Dokumenten, das die folgenden Schritte aufweist:
Bitmaps werden aus Suchstellen auf einem Dokument extrahiert, das über eine Faxübertragung empfangen wird;
die Bitmaps werden zu einer Erkennungsmaschine übergeben, von der eine Ausgabe erzeugt wird;
eine erste Netzwerk-Suchmaschine wird mit einer Abfrage abgefragt, die auf der Ausgabe basiert; und
Suchergebnisse werden gesendet.
Bitmaps werden aus Suchstellen auf einem Dokument extrahiert, das über eine Faxübertragung empfangen wird;
die Bitmaps werden zu einer Erkennungsmaschine übergeben, von der eine Ausgabe erzeugt wird;
eine erste Netzwerk-Suchmaschine wird mit einer Abfrage abgefragt, die auf der Ausgabe basiert; und
Suchergebnisse werden gesendet.
16. Verfahren nach Anspruch 15, das weiter den Schritt aufweist, wonach eine
zweite Netzwerk-Suchmaschine mit der Abfrage abgefragt wird, und Antworten von
der ersten und der zweiten Netzwerk-Suchmaschine in den Suchergebnissen korreliert
werden.
17. System zum Suchen nach Dokumenten auf einem Netzwerk, das folgendes
aufweist:
ein Faxgerät;
eine Überleiteinrichtung bzw. eine Gateway, die mit dem Faxgerät und dem Netzwerk verbunden ist, wobei die Gateway folgendes aufweist:
eine Erkennungsmaschine, die angeschlossen ist, um Bitmaps als Eingabe zu empfangen, wobei eine Ausgabe der Erkennungsmaschine wenigstens ein Suchformu lar bzw. eine Suchform aufweist;
eine Suchmaschine, die angeschlossen ist, um die wenigstens eine Suchform bzw. das wenigstens eine Suchformular von der Erkennungsmaschine zu empfangen,
wobei die Suchmaschine eine Ausgabe von Suchergebnissen aufweist, die auf Suchtermen auf dem wenigstens einem Suchformular basiert.
ein Faxgerät;
eine Überleiteinrichtung bzw. eine Gateway, die mit dem Faxgerät und dem Netzwerk verbunden ist, wobei die Gateway folgendes aufweist:
eine Erkennungsmaschine, die angeschlossen ist, um Bitmaps als Eingabe zu empfangen, wobei eine Ausgabe der Erkennungsmaschine wenigstens ein Suchformu lar bzw. eine Suchform aufweist;
eine Suchmaschine, die angeschlossen ist, um die wenigstens eine Suchform bzw. das wenigstens eine Suchformular von der Erkennungsmaschine zu empfangen,
wobei die Suchmaschine eine Ausgabe von Suchergebnissen aufweist, die auf Suchtermen auf dem wenigstens einem Suchformular basiert.
18. System, das im Anspruch 17 definiert ist, bei welchem die Suchmaschine an dem
Faxgerät angeschlossen ist und bei welchem das Faxgerät ein Dokument ausgibt, das
die Suchergebnisse aufweist.
19. System, das im Anspruch 18 definiert ist, bei welchem das Dokument, das
Suchergebnisse aufweist, eine Liste von Dokumenten beinhaltet.
20. System nach Anspruch 18, das weiter eine Dokumentbeschaffungseinheit
aufweist, die angeschlossen ist, um das Dokument zu empfangen, das Suchergebnisse
aufweist, wobei eine Ausgabe der Dokumentbeschaffungseinheit ein Dokument oder
mehrere Dokumente aufweist, die in dem Dokument ausgewählt wurden, das
Suchergebnisse aufweist.
21. System nach Anspruch 20, bei welchem die Dokumentbeschaffungseinheit an das
Faxgerät angeschlossen ist und bei dem weiter das Dokument, das Suchergebnisse
aufweist, mittels der Dokumentbeschaffungseinheit von dem Faxgerät empfangen
wird.
22. System, das im Anspruch 20 festgelegt ist, bei welchem die Dokument
beschaffungseinheit an das Faxgerät angeschlossen ist und bei welchem weiter eine
Eingabe des Faxgeräts ein Dokument oder mehrere Dokumente von der Dokument
beschaffungseinheit aufweist, wobei das Faxgerät das eine Dokument oder die
mehreren Dokumente sendet.
23. System nach Anspruch 17, bei welchem die Erkennungsmaschine eine
Handschrifterkennungsmaschine aufweist.
24. System nach Anspruch 17, bei welchem die Suchmaschine eine
HTTP-Suchmaschine aufweist.
25. System nach Anspruch 17, bei welchem die Gateway weiter einen Schreibdetek
tor aufweist, der angeschlossen ist, um eine elektronische Version einer Suchform
von dem Faxgerät zu empfangen, und bei welchem eine Ausgabe des Detektors
weitere Bitmaps von Suchtermen in der elektronischen Version der Suchform bzw.
des Suchformulars aufweist.
26. System nach Anspruch 25, bei welchem der Detektor Stellen von Suchtermen auf
der elektronischen Version der Suchform bzw. des Suchformulars identifiziert und
Geschriebenes bzw. Text bei den identifizierten Stellen detektiert.
27. System nach Anspruch 26, bei welchem der Detektor Bitmaps der identifizierten
Stellen ausgibt, bei denen Geschriebenes bzw. Text detektiert wurde.
28. System nach Anspruch 26, bei welchem der Detektor Stellen identifiziert, indem
Strichkodes auf der elektronischen Version des Suchformulars bzw. der Suchform
lokalisiert werden.
29. Apparat zum Suchen von Dokumenten, der folgendes aufweist:
eine Einrichtung zum Empfangen einer Form bzw. eines Formulars von einem Faxgerät;
eine Einrichtung zum Extrahieren von Bitmaps von Stellen auf der Form;
eine Einrichtung zum Durchführen einer Erkennung auf dem Bitmap;
eine Einrichtung zum Abfragen eines Netzwerks mit einer Abfrage, die auf einer Ausgabe von der Einrichtung zur Durchführung der Erkennung basiert; und
eine Einrichtung zum Zurückgeben von Suchergebnissen.
eine Einrichtung zum Empfangen einer Form bzw. eines Formulars von einem Faxgerät;
eine Einrichtung zum Extrahieren von Bitmaps von Stellen auf der Form;
eine Einrichtung zum Durchführen einer Erkennung auf dem Bitmap;
eine Einrichtung zum Abfragen eines Netzwerks mit einer Abfrage, die auf einer Ausgabe von der Einrichtung zur Durchführung der Erkennung basiert; und
eine Einrichtung zum Zurückgeben von Suchergebnissen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/632,681 US5873077A (en) | 1995-01-13 | 1996-04-16 | Method and apparatus for searching for and retrieving documents using a facsimile machine |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19715696A1 true DE19715696A1 (de) | 1997-11-06 |
Family
ID=24536492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19715696A Pending DE19715696A1 (de) | 1996-04-16 | 1997-04-15 | Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird |
Country Status (2)
Country | Link |
---|---|
US (1) | US5873077A (de) |
DE (1) | DE19715696A1 (de) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19811407A1 (de) * | 1998-03-16 | 1999-09-23 | Cit Alcatel | Verfahren zum Empfang von Faxnachrichten anstelle eines Faxgerätes eines Teilnehmers sowie Faxempfangseinrichtung, Server und Vermittlungsstelle hierzu |
DE19737826C2 (de) * | 1996-09-03 | 1999-12-23 | Dci Datenbank Fuer Wirtschafts | Internet-Server und Verfahren zum Bereitstellen einer Web-Seite |
EP1014676A2 (de) * | 1998-12-15 | 2000-06-28 | DeTeMobil Deutsche Telekom MobilNet GmbH | Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax |
DE19957895C1 (de) * | 1999-11-19 | 2001-06-21 | Guideguide Ag | System und Verfahren zum Erstellen von Kleinanzeigen im Internet sowie Set für ein System der vorgenannten Art |
KR100308262B1 (ko) * | 1997-12-31 | 2001-10-19 | 구자홍 | 인터넷예약검색및저장장치및방법 |
Families Citing this family (167)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6678864B1 (en) * | 1992-02-25 | 2004-01-13 | Irving Tsai | Method and apparatus for linking designated portions of a received document image with an electronic address |
US6026429A (en) * | 1995-06-07 | 2000-02-15 | America Online, Inc. | Seamless integration of internet resources |
US7562392B1 (en) | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
ATE311728T1 (de) | 1995-12-11 | 2005-12-15 | Hewlett Packard Co | Verfahren zur versorgung von fernmeldediensten |
GB9603582D0 (en) | 1996-02-20 | 1996-04-17 | Hewlett Packard Co | Method of accessing service resource items that are for use in a telecommunications system |
DE69635386T2 (de) | 1995-12-11 | 2006-06-22 | Hewlett-Packard Development Co., L.P., Houston | Verfahren zum Bereitstellen von Telekommunikationsdiensten |
WO1997022212A1 (en) | 1995-12-11 | 1997-06-19 | Hewlett-Packard Company | Method of accessing service resource items that are for use in a telecommunications system |
JPH09269914A (ja) * | 1996-03-29 | 1997-10-14 | Fujitsu Ltd | クライアント・サーバシステムにおけるローカルファイル転送方法及びシステム |
JP3478681B2 (ja) * | 1996-10-07 | 2003-12-15 | 株式会社リコー | 文書情報管理システム |
US6016307A (en) | 1996-10-31 | 2000-01-18 | Connect One, Inc. | Multi-protocol telecommunications routing optimization |
US6473404B1 (en) * | 1998-11-24 | 2002-10-29 | Connect One, Inc. | Multi-protocol telecommunications routing optimization |
US6754181B1 (en) | 1996-11-18 | 2004-06-22 | Mci Communications Corporation | System and method for a directory service supporting a hybrid communication system architecture |
US6690654B2 (en) | 1996-11-18 | 2004-02-10 | Mci Communications Corporation | Method and system for multi-media collaboration between remote parties |
US6335927B1 (en) | 1996-11-18 | 2002-01-01 | Mci Communications Corporation | System and method for providing requested quality of service in a hybrid network |
US6131095A (en) * | 1996-12-11 | 2000-10-10 | Hewlett-Packard Company | Method of accessing a target entity over a communications network |
US6731625B1 (en) | 1997-02-10 | 2004-05-04 | Mci Communications Corporation | System, method and article of manufacture for a call back architecture in a hybrid network with support for internet telephony |
US6070798A (en) * | 1997-02-21 | 2000-06-06 | Nethery; Kee | Purchaser generated transaction recording and negotiable instrument payment system |
US6366698B1 (en) * | 1997-03-11 | 2002-04-02 | Casio Computer Co., Ltd. | Portable terminal device for transmitting image data via network and image processing device for performing an image processing based on recognition result of received image data |
JP2959545B2 (ja) * | 1997-03-25 | 1999-10-06 | セイコーエプソン株式会社 | 画像情報入出力装置及び画像情報入出力装置の制御方法及び画像情報処理システム |
US6163536A (en) * | 1997-06-11 | 2000-12-19 | International Business Machines Corporation | Communication system including a client controlled gateway for concurrent voice/data messaging with a data server |
JP3478725B2 (ja) * | 1997-07-25 | 2003-12-15 | 株式会社リコー | 文書情報管理システム |
US6006217A (en) * | 1997-11-07 | 1999-12-21 | International Business Machines Corporation | Technique for providing enhanced relevance information for documents retrieved in a multi database search |
US6415278B1 (en) * | 1997-11-14 | 2002-07-02 | Adobe Systems Incorporated | Retrieving documents transitively linked to an initial document |
US6789080B1 (en) | 1997-11-14 | 2004-09-07 | Adobe Systems Incorporated | Retrieving documents transitively linked to an initial document |
US6272492B1 (en) * | 1997-11-21 | 2001-08-07 | Ibm Corporation | Front-end proxy for transparently increasing web server functionality |
US6381592B1 (en) * | 1997-12-03 | 2002-04-30 | Stephen Michael Reuning | Candidate chaser |
US6314422B1 (en) * | 1997-12-09 | 2001-11-06 | Chrysler Corporation | Method for softlinking between documents in a vehicle diagnostic system |
US6661933B1 (en) * | 1998-01-13 | 2003-12-09 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for image data processing |
US6167451A (en) * | 1998-01-20 | 2000-12-26 | Netscape Communications Corporation | Multiple push protocol unifying system |
US7098206B2 (en) * | 1998-01-21 | 2006-08-29 | Smithkline Beecham Corporation | Pharmaceutically active morpholinol |
JPH11249777A (ja) * | 1998-02-27 | 1999-09-17 | Toshiba Corp | ドキュメント管理システムおよび同システムのドキュメント管理方法 |
US6348970B1 (en) * | 1998-04-29 | 2002-02-19 | Qwest Communications Int'l., Inc. | Apparatus and method for interfacing a computer network to a facsimile machine |
US6279013B1 (en) * | 1998-07-20 | 2001-08-21 | Xerox Corporation | Interactive newspaper |
US7010177B1 (en) * | 1998-08-27 | 2006-03-07 | Intel Corporation | Portability of digital images |
AU720645B2 (en) * | 1998-10-02 | 2000-06-08 | Citibank, N.A. | System and method of using E-mail centered internet interaction |
US6938033B1 (en) | 1998-10-02 | 2005-08-30 | Citibank, N.A. | System and method of using e-mail centered internet interaction |
US6845370B2 (en) * | 1998-11-12 | 2005-01-18 | Accenture Llp | Advanced information gathering for targeted activities |
US7003719B1 (en) | 1999-01-25 | 2006-02-21 | West Publishing Company, Dba West Group | System, method, and software for inserting hyperlinks into documents |
US6351747B1 (en) * | 1999-04-12 | 2002-02-26 | Multex.Com, Inc. | Method and system for providing data to a user based on a user's query |
US6341282B1 (en) * | 1999-04-19 | 2002-01-22 | Electronic Data Systems Corporation | Information retrieval system and method |
US6253198B1 (en) * | 1999-05-11 | 2001-06-26 | Search Mechanics, Inc. | Process for maintaining ongoing registration for pages on a given search engine |
US6501779B1 (en) * | 1999-05-26 | 2002-12-31 | Nxi Communications, Inc. | Network communication system |
US7640318B1 (en) * | 1999-09-17 | 2009-12-29 | Ricoh Co., Ltd. | Method and apparatus for publishing documents over a network |
US6823370B1 (en) | 1999-10-18 | 2004-11-23 | Nortel Networks Limited | System and method for retrieving select web content |
US7711738B1 (en) * | 1999-11-15 | 2010-05-04 | West Services, Inc. | Method, system and computer-readable medium for accessing and retrieving court records, items and documents |
US6597808B1 (en) | 1999-12-06 | 2003-07-22 | Matsushita Electric Industrial Co., Ltd. | User drawn circled region extraction from scanned documents |
US6867875B1 (en) | 1999-12-06 | 2005-03-15 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for simplifying fax transmissions using user-circled region detection |
US6690396B1 (en) * | 1999-12-27 | 2004-02-10 | Gateway, Inc. | Scannable design of an executable |
FR2805111B1 (fr) * | 2000-02-11 | 2003-09-26 | Sagem | Procede pour l'execution d'une tache par un serveur informatique multitache, sur requete d'un terminal telephonique |
DE50008829D1 (de) * | 2000-02-15 | 2005-01-05 | Siemens Ag | Verfahren zur Uebermittlung einer Nachricht sowie Gateway |
US7180638B1 (en) * | 2000-02-16 | 2007-02-20 | Ricoh Co., Ltd. | Network fax machine using a web page as a user interface |
WO2001063906A2 (en) * | 2000-02-24 | 2001-08-30 | Geoffrey Marshall | Faxing paper documents to a plurality of address types |
US6785670B1 (en) * | 2000-03-16 | 2004-08-31 | International Business Machines Corporation | Automatically initiating an internet-based search from within a displayed document |
US8023131B2 (en) * | 2000-03-28 | 2011-09-20 | Mongonet | Method and system for combining separate digitized representations of documents for retransmission via computer network transfer protocols |
US7079275B2 (en) * | 2000-03-28 | 2006-07-18 | Mongonet | Method and system for facilitating paper to electronic communications |
US7944573B2 (en) * | 2000-03-28 | 2011-05-17 | Mongonet | Methods and apparatus for authenticating facsimile transmissions to electronic storage destinations |
US6424426B1 (en) * | 2000-03-28 | 2002-07-23 | Mongonet | Fax-to-email and email-to-fax communication system and method |
US20090059271A1 (en) * | 2000-03-28 | 2009-03-05 | Mongonet | Methods and apparatus for web-based status of facsimile transmissions to electronic storage destinations |
US8023132B2 (en) * | 2000-03-28 | 2011-09-20 | Mongonet | Method and system for transferring digitized representations of documents via computer network transfer protocols |
US7746496B2 (en) * | 2000-03-28 | 2010-06-29 | Mongonet | Method and system for pay per use document transfer via computer network transfer protocols |
US7940411B2 (en) * | 2000-03-28 | 2011-05-10 | Mongonet | Method and system for entry of electronic data via fax-to-email communication |
US7826100B2 (en) * | 2000-03-28 | 2010-11-02 | Mongonet | Methods and apparatus for facsimile transmissions to electronic storage destinations including embedded barcode fonts |
US8045203B2 (en) * | 2000-03-28 | 2011-10-25 | Mongonet | Methods and apparatus for secure facsimile transmissions to electronic storage destinations |
US7817295B2 (en) * | 2000-03-28 | 2010-10-19 | Mongonet | Method and system for modified document transfer via computer network transfer protocols |
US8275100B2 (en) * | 2000-03-28 | 2012-09-25 | Mongonet | Methods and apparatus for billing of facsimile transmissions to electronic storage destinations |
US8035834B2 (en) * | 2000-03-28 | 2011-10-11 | Mongonet | Methods and apparatus for manipulating and providing facsimile transmissions to electronic storage destinations |
US8184318B2 (en) * | 2000-03-28 | 2012-05-22 | Mongonet | Methods and apparatus for compositing facsimile transmissions to electronic storage destinations |
US8045204B2 (en) * | 2000-03-28 | 2011-10-25 | Mongonet | Methods and apparatus for facsimile transmissions to electronic storage destinations including tracking data |
US20070236750A1 (en) * | 2000-03-28 | 2007-10-11 | Mongonet | Methods and apparatus for facilitating facsimile transmissions to electronic storage destinations |
US7755790B2 (en) | 2000-03-28 | 2010-07-13 | Mongonet | Method and system for transferring sponsored digitized representations of documents via computer network transfer protocols |
US6883001B2 (en) * | 2000-05-26 | 2005-04-19 | Fujitsu Limited | Document information search apparatus and method and recording medium storing document information search program therein |
US20010053252A1 (en) * | 2000-06-13 | 2001-12-20 | Stuart Creque | Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store |
US7573616B2 (en) * | 2000-08-11 | 2009-08-11 | Ctb/Mcgraw-Hill Llc | Enhanced data capture from imaged documents |
US6671706B1 (en) * | 2000-08-12 | 2003-12-30 | Keith Vinh | Method and system for editing the content of a web site with a facsimile transmission |
US6801932B1 (en) | 2000-11-07 | 2004-10-05 | Pitney Bowes Inc | Method and system for remote retrieval of documents |
US6744528B2 (en) | 2000-11-30 | 2004-06-01 | Pitney Bowes Inc. | Method and system for remote printing of documents |
US6654601B2 (en) | 2000-11-30 | 2003-11-25 | Pitney Bowes Inc. | Method and system for remote retrieval of messages using spontaneous networking technology |
US6972863B2 (en) * | 2001-03-19 | 2005-12-06 | Hewlett-Packard Development Company, L.P. | Direct barcode printing from internet database |
US20020198847A1 (en) * | 2001-03-21 | 2002-12-26 | Christer Fahraeus | Communications services, methods and systems |
US7392287B2 (en) * | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
US6999204B2 (en) * | 2001-04-05 | 2006-02-14 | Global 360, Inc. | Document processing using color marking |
US6829605B2 (en) * | 2001-05-24 | 2004-12-07 | Microsoft Corporation | Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval |
US7113300B2 (en) * | 2001-07-12 | 2006-09-26 | Pitney Bowes Inc. | Method and system for secure delivery and printing of documents |
US7072473B2 (en) * | 2001-07-12 | 2006-07-04 | Pitney Bowes Inc. | Method and system for secure delivery and retrieval of documents utilizing a facsimile machine |
US6751732B2 (en) | 2001-07-12 | 2004-06-15 | Pitney Bowes Inc. | Method and system for secure delivery and printing of documents via a network device |
US8909595B2 (en) * | 2001-08-01 | 2014-12-09 | T-System, Inc. | Method for entering, recording, distributing and reporting data |
US7106470B2 (en) * | 2001-08-10 | 2006-09-12 | Hewlett-Packard Development Company, L.P. | Direct printing from internet database |
US7075668B2 (en) * | 2001-08-10 | 2006-07-11 | Hewlett-Packard Development Company, L.P. | Direct printing from internet database |
US6996235B2 (en) * | 2001-10-08 | 2006-02-07 | Pitney Bowes Inc. | Method and system for secure printing of documents via a printer coupled to the internet |
US7304757B2 (en) * | 2001-12-21 | 2007-12-04 | Hewlett-Packard Development Company, L.P. | System and method for secure printing |
US7333966B2 (en) * | 2001-12-21 | 2008-02-19 | Thomson Global Resources | Systems, methods, and software for hyperlinking names |
JP3997812B2 (ja) * | 2002-03-28 | 2007-10-24 | ブラザー工業株式会社 | 画像形成装置 |
US7640267B2 (en) | 2002-11-20 | 2009-12-29 | Radar Networks, Inc. | Methods and systems for managing entities in a computing device using semantic objects |
US7356768B1 (en) | 2002-11-27 | 2008-04-08 | Adobe Systems Incorporated | Using document templates to assemble a collection of documents |
US7242496B2 (en) * | 2003-10-10 | 2007-07-10 | Murata Kikai Kabushiki Kaisha | Facsimile machine and data conversion device |
AR047362A1 (es) | 2003-12-31 | 2006-01-18 | Thomson Global Resources Ag | Sistemas, metodos, interfases y software para recoleccion automatizada e integracion de datos de entidades en bases de datos y directorios profesionales en linea. |
US7433876B2 (en) | 2004-02-23 | 2008-10-07 | Radar Networks, Inc. | Semantic web portal and platform |
US7970171B2 (en) * | 2007-01-18 | 2011-06-28 | Ricoh Co., Ltd. | Synthetic image and video generation from ground truth data |
US8868555B2 (en) * | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US9373029B2 (en) * | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8838591B2 (en) * | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US7669148B2 (en) * | 2005-08-23 | 2010-02-23 | Ricoh Co., Ltd. | System and methods for portable device for mixed media system |
US8144921B2 (en) * | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US8385589B2 (en) * | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US7812986B2 (en) * | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US8600989B2 (en) * | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8856108B2 (en) * | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US7920759B2 (en) | 2005-08-23 | 2011-04-05 | Ricoh Co. Ltd. | Triggering applications for distributed action execution and use of mixed media recognition as a control input |
US8369655B2 (en) * | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8086038B2 (en) * | 2007-07-11 | 2011-12-27 | Ricoh Co., Ltd. | Invisible junction features for patch recognition |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US8005831B2 (en) * | 2005-08-23 | 2011-08-23 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment with geographic location information |
US8184155B2 (en) * | 2007-07-11 | 2012-05-22 | Ricoh Co. Ltd. | Recognition and tracking using invisible junctions |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8176054B2 (en) * | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US8332401B2 (en) * | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US8335789B2 (en) * | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US8156427B2 (en) * | 2005-08-23 | 2012-04-10 | Ricoh Co. Ltd. | User interface for mixed media reality |
US8521737B2 (en) * | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US8825682B2 (en) * | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US7885955B2 (en) * | 2005-08-23 | 2011-02-08 | Ricoh Co. Ltd. | Shared document annotation |
US8156116B2 (en) * | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8510283B2 (en) * | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8195659B2 (en) * | 2005-08-23 | 2012-06-05 | Ricoh Co. Ltd. | Integration and use of mixed media documents |
US7917554B2 (en) * | 2005-08-23 | 2011-03-29 | Ricoh Co. Ltd. | Visibly-perceptible hot spots in documents |
US8276088B2 (en) * | 2007-07-11 | 2012-09-25 | Ricoh Co., Ltd. | User interface for three-dimensional navigation |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US7991778B2 (en) * | 2005-08-23 | 2011-08-02 | Ricoh Co., Ltd. | Triggering actions with captured input in a mixed media environment |
US9466048B2 (en) | 2005-05-16 | 2016-10-11 | Thomson Reuters Global Resources | Systems, methods, software and interfaces for integration of online research tasks into law firm workflow |
WO2006127596A2 (en) | 2005-05-20 | 2006-11-30 | Hillcrest Laboratories, Inc. | Dynamic hyperlinking approach |
US7769772B2 (en) * | 2005-08-23 | 2010-08-03 | Ricoh Co., Ltd. | Mixed media reality brokerage network with layout-independent recognition |
US20070115500A1 (en) * | 2005-11-21 | 2007-05-24 | Xerox Corporation | Method for operating communication device |
US9020966B2 (en) * | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8489987B2 (en) * | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US8676810B2 (en) * | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US8201076B2 (en) * | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9063952B2 (en) * | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8073263B2 (en) * | 2006-07-31 | 2011-12-06 | Ricoh Co., Ltd. | Multi-classifier selection and monitoring for MMR-based image recognition |
US9176984B2 (en) * | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US20080227075A1 (en) | 2007-03-15 | 2008-09-18 | Ctb/Mcgraw-Hill, Llc | Method and system for redundant data capture from scanned documents |
US20080235564A1 (en) * | 2007-03-21 | 2008-09-25 | Ricoh Co., Ltd. | Methods for converting electronic content descriptions |
US8584042B2 (en) * | 2007-03-21 | 2013-11-12 | Ricoh Co., Ltd. | Methods for scanning, printing, and copying multimedia thumbnails |
US8812969B2 (en) * | 2007-03-21 | 2014-08-19 | Ricoh Co., Ltd. | Methods for authoring and interacting with multimedia representations of documents |
US8612412B2 (en) * | 2007-05-24 | 2013-12-17 | International Business Machines Corporation | Searching for a directory in a file system |
US20090015875A1 (en) * | 2007-06-20 | 2009-01-15 | Ctb/Mcgraw-Hill Companies, Inc. | Image manipulation of digitized images of documents |
US8526766B2 (en) * | 2007-10-31 | 2013-09-03 | Ctb/Mcgraw-Hill Llc | Use of composite bitmapped images in conjunction with display of captured data |
US8924374B2 (en) * | 2008-02-22 | 2014-12-30 | Tigerlogic Corporation | Systems and methods of semantically annotating documents of different structures |
US8145632B2 (en) * | 2008-02-22 | 2012-03-27 | Tigerlogic Corporation | Systems and methods of identifying chunks within multiple documents |
US8924421B2 (en) * | 2008-02-22 | 2014-12-30 | Tigerlogic Corporation | Systems and methods of refining chunks identified within multiple documents |
US9129036B2 (en) * | 2008-02-22 | 2015-09-08 | Tigerlogic Corporation | Systems and methods of identifying chunks within inter-related documents |
US8078630B2 (en) | 2008-02-22 | 2011-12-13 | Tigerlogic Corporation | Systems and methods of displaying document chunks in response to a search request |
US8195540B2 (en) * | 2008-07-25 | 2012-06-05 | Mongonet | Sponsored facsimile to e-mail transmission methods and apparatus |
US9037567B2 (en) | 2009-04-15 | 2015-05-19 | Vcvc Iii Llc | Generating user-customized search results and building a semantics-enhanced search engine |
US10628847B2 (en) | 2009-04-15 | 2020-04-21 | Fiver Llc | Search-enhanced semantic advertising |
US8200617B2 (en) | 2009-04-15 | 2012-06-12 | Evri, Inc. | Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata |
US8862579B2 (en) * | 2009-04-15 | 2014-10-14 | Vcvc Iii Llc | Search and search optimization using a pattern of a location identifier |
US8238538B2 (en) | 2009-05-28 | 2012-08-07 | Comcast Cable Communications, Llc | Stateful home phone service |
US8385660B2 (en) * | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
US20110119262A1 (en) * | 2009-11-13 | 2011-05-19 | Dexter Jeffrey M | Method and System for Grouping Chunks Extracted from A Document, Highlighting the Location of A Document Chunk Within A Document, and Ranking Hyperlinks Within A Document |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US20130182974A1 (en) * | 2012-01-13 | 2013-07-18 | Honeywell International, Inc. doing business as (d.b.a.) Honeywell Scanning & Mobility | System and method for obtaining and routing electronic copies of documents |
US8824750B2 (en) * | 2012-03-19 | 2014-09-02 | Next Level Security Systems, Inc. | Distributive facial matching and notification system |
CN110046309A (zh) * | 2019-04-02 | 2019-07-23 | 北京字节跳动网络技术有限公司 | 文档输入内容的处理方法、装置、电子设备和存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2458119C3 (de) * | 1974-12-09 | 1980-08-14 | Siemens Ag, 1000 Berlin Und 8000 Muenchen | Verfahren und Anordnung zur Faksimilecodierung |
JPS59128661A (ja) * | 1983-01-14 | 1984-07-24 | Fuji Xerox Co Ltd | 画像フアイル装置 |
US4553261A (en) * | 1983-05-31 | 1985-11-12 | Horst Froessl | Document and data handling and retrieval system |
US4553206A (en) * | 1983-10-03 | 1985-11-12 | Wang Laboratories, Inc. | Image storage and retrieval |
JPH0827831B2 (ja) * | 1986-05-16 | 1996-03-21 | 株式会社日立製作所 | 画像登録方式 |
US4760606A (en) * | 1986-06-30 | 1988-07-26 | Wang Laboratories, Inc. | Digital imaging file processing system |
US5099340A (en) * | 1989-05-15 | 1992-03-24 | Sharp Kabushiki Kaisha | Electronic filing apparatus |
US5068888A (en) * | 1989-08-11 | 1991-11-26 | Afd Systems, Inc. | Interactive facsimile information retrieval system and method |
JPH03161873A (ja) * | 1989-11-20 | 1991-07-11 | Ricoh Co Ltd | データベース構築機能を有する電子フアイリング装置 |
JPH03196266A (ja) * | 1989-12-25 | 1991-08-27 | Toshiba Corp | 画像形成記憶装置 |
JPH03202967A (ja) * | 1989-12-28 | 1991-09-04 | Toshiba Corp | 電子ファイリング装置 |
US5170266A (en) * | 1990-02-20 | 1992-12-08 | Document Technologies, Inc. | Multi-capability facsimile system |
JP3098783B2 (ja) * | 1990-04-20 | 2000-10-16 | 株式会社リコー | 画像蓄積機能付きファクシミリ装置 |
US5115326A (en) * | 1990-06-26 | 1992-05-19 | Hewlett Packard Company | Method of encoding an e-mail address in a fax message and routing the fax message to a destination on a network |
US5563955A (en) * | 1990-11-21 | 1996-10-08 | The Board Of Trustees Of The University Of Arkansas | Apparatus and/or method for recognizing printed data in an image |
US5175684A (en) * | 1990-12-31 | 1992-12-29 | Trans-Link International Corp. | Automatic text translation and routing system |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
US5436960A (en) * | 1991-05-20 | 1995-07-25 | Campana, Jr.; Thomas J. | Electronic mail system with RF communications to mobile processors and method of operation thereof |
US5241466A (en) * | 1991-06-26 | 1993-08-31 | Perry Victor A | System for administering a central depository for living wills and other associated information |
US5301315A (en) * | 1991-09-27 | 1994-04-05 | Computer Concepts Corp. | Indexing/compression scheme for supporting graphics and data selection |
US5579407A (en) * | 1992-04-21 | 1996-11-26 | Murez; James D. | Optical character classification |
US5341222A (en) * | 1992-05-18 | 1994-08-23 | Demand Publishing, Inc. | Distributed facsimile information system and method |
US5337362A (en) * | 1993-04-15 | 1994-08-09 | Ricoh Corporation | Method and apparatus for placing data onto plain paper |
US5576954A (en) * | 1993-11-05 | 1996-11-19 | University Of Central Florida | Process for determination of text relevancy |
US5461488A (en) * | 1994-09-12 | 1995-10-24 | Motorola, Inc. | Computerized facsimile (FAX) system and method of operation |
US5530852A (en) * | 1994-12-20 | 1996-06-25 | Sun Microsystems, Inc. | Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics |
CA2139081C (en) * | 1994-12-23 | 1999-02-02 | Alastair Gordon | Unified messaging system and method |
-
1996
- 1996-04-16 US US08/632,681 patent/US5873077A/en not_active Expired - Lifetime
-
1997
- 1997-04-15 DE DE19715696A patent/DE19715696A1/de active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19737826C2 (de) * | 1996-09-03 | 1999-12-23 | Dci Datenbank Fuer Wirtschafts | Internet-Server und Verfahren zum Bereitstellen einer Web-Seite |
KR100308262B1 (ko) * | 1997-12-31 | 2001-10-19 | 구자홍 | 인터넷예약검색및저장장치및방법 |
DE19811407A1 (de) * | 1998-03-16 | 1999-09-23 | Cit Alcatel | Verfahren zum Empfang von Faxnachrichten anstelle eines Faxgerätes eines Teilnehmers sowie Faxempfangseinrichtung, Server und Vermittlungsstelle hierzu |
EP1014676A2 (de) * | 1998-12-15 | 2000-06-28 | DeTeMobil Deutsche Telekom MobilNet GmbH | Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax |
DE19857901A1 (de) * | 1998-12-15 | 2000-06-29 | Deutsche Telekom Mobil | Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax |
EP1014676A3 (de) * | 1998-12-15 | 2004-10-27 | T-Mobile Deutschland GmbH | Verfahren zum Abrufen von Informationen aus dem Internet und von Emails via Fax |
DE19957895C1 (de) * | 1999-11-19 | 2001-06-21 | Guideguide Ag | System und Verfahren zum Erstellen von Kleinanzeigen im Internet sowie Set für ein System der vorgenannten Art |
Also Published As
Publication number | Publication date |
---|---|
US5873077A (en) | 1999-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19715696A1 (de) | Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird | |
DE10236188B4 (de) | Verfahren, System und Programmprodukt zum Bereitstellen eines Inhalts einer Quellwebsite an eine Verbraucherwebsite durch einen Bildumwandlungsdienst | |
DE60028561T2 (de) | Bereitstellung von kundendiensten, die daten aus datenquellen abrufen, wobei die datenquellen die vom kunden geforderten formate nicht notwendigerweise unterstützen | |
DE60129652T2 (de) | Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung | |
DE10135445B4 (de) | Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage | |
DE69434620T2 (de) | Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten | |
DE10236190B4 (de) | Verfahren, System, Programmprodukt und Druckerwebdienst zum Erzeugen eines Druckauftrags zum Drucken eines Dokuments | |
DE69736373T2 (de) | Web-browser, der die Navigation zwischen Hypertextobjekten mit einer Abstandsbedienung ermöglicht | |
DE60116343T2 (de) | Webserver | |
DE10236189B4 (de) | Verfahren, System und Programmprodukt zum Drucker eines Dokuments, das eine Mehrzahl von Seiten aufweist | |
DE19936314A1 (de) | Verfahren und System zur Inhaltskonvertierung von elektronischen Daten unter Verwendung von Konvertierungspräferenzen | |
DE19962192A1 (de) | Verfahren und System zur Inhaltskonvertierung von elektronischen Daten für drahtlose Vorrichtungen | |
DE10048940A1 (de) | Erzeugen von Dokumenteninhalten durch Transcodierung mit Hilfe von Java Server Pages | |
DE10309241A1 (de) | Drucken mit variablen Daten unter Verwendung einer dynamischen Ausschießvorlage | |
DE10050172A1 (de) | Systeme, Verfahren und Computerprogrammprodukte zur Überprüfung eines für die Anzeige in pervasive Computereinheiten angepassten Web-Inhaltes | |
DE10122231A1 (de) | System, Methode, und Programmprodukt zum Speichern eines vorgelegten Formulars einer Web Page | |
DE60003278T2 (de) | Hierarchische Auflösung von Adressen in einem Datennetzwerk | |
DE19963981A1 (de) | Verfahren und Vorrichtung zum Auffinden von Dokumenten unter Verwendung von Hyperlinks | |
DE60026788T2 (de) | Vorrichtung zum Suchen eines Gerätes in einem Netzwerk | |
DE102016015381A1 (de) | Verwendung von Bloom-Filtern zur Vereinfachung der Erweiterung und Unterteilung eines dynamischen Fonts | |
DE10236182B4 (de) | Verfahren, ein System und ein Programmprodukt zum Drucken eines Dokuments gemäß einer vorbestimmten Druckspezifikation | |
EP1211099A2 (de) | Verfahren zum digitalen Drucken von zusammengesetzten Dokumenten | |
DE10330826A1 (de) | Bestimmen einer Ziel-E-Mail-Adresse zum Senden gescannter Dokumente | |
DE60215271T2 (de) | Datenerfassungssystem und -Verfahren mit Verwendung von Antwortformularen | |
DE10296924T5 (de) | Anwenderbestimmtes selektives Neuladen von Bildern |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law |