WO2003012681A1 - Method and system for automatically enhancing semantic resources with a real-time question-answer electronic system - Google Patents

Method and system for automatically enhancing semantic resources with a real-time question-answer electronic system Download PDF

Info

Publication number
WO2003012681A1
WO2003012681A1 PCT/FR2002/002513 FR0202513W WO03012681A1 WO 2003012681 A1 WO2003012681 A1 WO 2003012681A1 FR 0202513 W FR0202513 W FR 0202513W WO 03012681 A1 WO03012681 A1 WO 03012681A1
Authority
WO
WIPO (PCT)
Prior art keywords
arguments
question
search
answer
documents
Prior art date
Application number
PCT/FR2002/002513
Other languages
French (fr)
Inventor
Olivier Collin
Florence Duclaye
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Priority to EP02791500A priority Critical patent/EP1407389A1/en
Publication of WO2003012681A1 publication Critical patent/WO2003012681A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation

Definitions

  • the invention relates to a system for the automatic enrichment of semantic resources from a real-time electronic question-answer system.
  • electronic question-answer system a system according to which a user asks a question in natural language from a computer tool such as a microcomputer (PC) connected through a communication network to a system comprising a database server in order to obtain information constituting the answer to his question.
  • a computer tool such as a microcomputer (PC) connected through a communication network
  • a system comprising a database server in order to obtain information constituting the answer to his question.
  • the most recent systems incorporate a linguistic analysis to translate the question into a specialized language adapted to the search for information by a search engine.
  • the invention provides a method for automatic enrichment of semantic resources from a real-time electronic question-and-answer system.
  • the real-time electronic question and answer system is the tool used in accordance with the invention to automatically enrich the semantic resources of a semantic network.
  • This enrichment system can therefore be used to enrich the semantic resources of a real-time electronic question-answer system and more generally of a semantic network.
  • the system is capable of subjecting the question posed to a linguistic analysis operation in order to construct a pattern for finding the answer which is presented in the simplest form: argumentl - relation - argument2. This pattern is then sought and extracted (by direct matching) from the documents reported by the search engine or argument 1 is the response sought.
  • the system integrates an operation of re-formulation of the questions in order to search for the same answer by means of several formulations which are se cantically equivalent.
  • the re-formulation of the questions increases the quantity of documents that can provide an answer.
  • the re-formulation of the questions is done by learning and makes it possible to automatically obtain a set of formulations semantically equivalent to a first formulation of a relationship between two arguments.
  • the invention more particularly relates to a method for enriching semantic resources mainly characterized in that it consists in using an electronic real time system of question answers to obtain an automatic enrichment of said resources.
  • the method comprises the following phases:
  • a learning phase comprising: • a search for one or more re-formulations of the relationship formulated in the pattern of the initial question, based on the arguments known by this question and the answer or answers obtained,
  • the search for a re-formulation includes:
  • the subject of the invention is also a system of enrichment of semantic resources, mainly characterized in that it is coupled to an electronic real time system of question answers to obtain an automatic enrichment of said resources.
  • the system includes: - means for implementing an initialization phase of these means comprising:
  • the means of searching for a re-formulation include:
  • the reference means, the means of extracting sentences containing the arguments known to these documents and the means of linguistic analysis of the sentences are produced by modules of computer programs or processes capable of implementing the stated functions and the means of search are carried out by a program called search engine.
  • FIGS. 2A, 2B represent the detailed functional diagrams of the system of FIG. 1, - Figure 3 shows the device for implementing the functional blocks of Figures 2A and 2B according to one embodiment.
  • an electronic system for real-time information search is used.
  • This system is coupled to the system of enrichment of semantic resources through a communication network.
  • a communication network can be an intra-net network giving access to one or more databases which can provide answers to questions asked by a user. It can also be the Internet.
  • the search system whatever it is, is qualified as a basic system, it being understood that it can rely only on a linguistic analysis operation making it possible to extract at least one answer to a question asked in natural language by a user using to do this keywords.
  • system is capable of constructing the question in the form of a search pattern: argument 1, relation, argument 2.
  • This pattern then allows thanks to the search engine of the system to extract the response "X" in the phase found in one or more documents found at the end of the search "X killed Kennedy".
  • This basic search system carries the reference
  • FIG. 1 It is coupled through a communication network R to one or more databases 3.
  • the system also includes a device for automatic enrichment of linguistic resources 2.
  • This device carries out learning operations for re-formulations to automatically obtain a set of semantic formulations equivalent to a first formulation of a relationship between two arguments. .
  • the question is submitted to a linguistic analysis allowing to build a pattern of research for the answer; the pattern which is then sought makes it possible to extract the response.
  • step by step the system establishes several relationships which globally form a more abstract relationship generalizable by the same predicate of the type:
  • the treatment of the question also makes it possible to obtain semantic labels: Who killed President Kennedy? allows to extract the “president” label by a simple syntactic treatment.
  • the overall process consists in acquiring new data and new relationships by building on the previously acquired data and relationships. For a given statement, it is a question of exploring a new category of relations, starting from a known category by limiting the variable element.
  • this technique makes it possible to gradually enrich all of the known relationships of a natural language processing system (for example a semantic network).
  • a natural language processing system for example a semantic network
  • This system allows the automatic creation of a semantic network. This enrichment can then be used for all applications using such a system.
  • the system is directly usable for the extraction of information involving the acquired relationships. For example, to extract from a text all of the assassins and destroyed people, we can use the relationships learned as "murderer of" and "killed”. Second consequence: the system allows in the same way to acquire formulations in another language by using multilingual data from the WEB.
  • the query [X, Kennedy] we get: X assassinated Kennedy, X killed Kennedy. This constitutes a learning system for translation and which makes it possible to provide a translation into another language.
  • FIGS. 2A and 2B make it possible to illustrate in detail the operations implemented during the initialization phase I and during the learning phase II operated respectively by the search system 1 and by the device enrichment 2 illustrated in Figure 1.
  • the initial phase is carried out by a search system which according to a preferred embodiment implements operations 10 to 17 of FIG. 2A.
  • the question asked relates triplets of the type Argumentl, Relation, Argument2 (step 10).
  • a linguistic analysis (step 11) makes it possible to obtain the extraction pattern of Argumentl: semantic type of Argl, Structure Relation-Arg2 (step 15).
  • the search engine searches Arg2 close to Relation on the databases to which it has access or across the Web. According to the example taken:.
  • a second linguistic analysis makes it possible to search in these documents for the structure of the Argumentl-Relation-Argument2 type (step 16). Knowing Argument 2 and Relation (from the question) the analyzer extracts Argument 1. Step 16 thus makes it possible to extract the answer Argument 1. For each question asked the system proceeds to this first phase to find at least one answer . The system continues with the next phase II which allows it to carry out a learning process. Knowing Argument 1 and Argument 2 (step 20; Arg 1 and Arg 2 are known after the initialization step), the search engine performs a search using the keywords Argument 1 close to Argument 2 (step 21) . The search engine finds documents in response and provides them in HTML format (step 22). These documents are filtered to obtain a well-formed text format and language paragraphs.
  • step 23 a filter is used to extract sentences containing Argument 1 and Argument 2. A linguistic analysis is performed on these sentences (step 24).
  • the system obtains synonyms of the desired relationship and more generally paraphrases and stores these synonyms in a database.
  • the system therefore makes it possible to enrich the resources for research on a question asked.
  • Element 1 for searching for the first answer comprises a module 100 for formatting and calling a module for linguistic analysis 110 and a search engine 120.
  • the module 100 receives on an input to the question Q in ASCII coming from an html interface; this module formats this question according to a format predetermined in practice in a file usable by the linguistic analysis module 11.
  • This module 100 delivers to an output c the question formatted in the desired format.
  • This module 100 receives at another input b the data extracted by the analysis module on the typology of the question.
  • This data includes keywords and other characteristic data.
  • the module 100 makes it possible to deliver to another output e keywords.
  • the other characteristic data are in the form of computer files and are stored in the data memory of the linguistic module 110.
  • the keywords are transmitted to the search engine 12 so that it can provide the intermediate response as an output.
  • This response is a candidate sentence containing the keywords.
  • the 2000 response processing set includes:
  • a module 200 for receiving on an input has the intermediate response, formatting it according to a predetermined format, delivering to an output c the formatted response, and supplying another output with the final response in a format suitable for the transmission over the network;
  • a linguistic analysis module 110 in practice, this is the same module as that which extracts the keywords and other data.
  • This module 110 is capable of receiving at an input the formatted intermediate response, of verifying this response from the stored characteristic data other than the keywords, extracting the final response after this verification, and output the final response.
  • FIG. 1 shows a unit 1100 representing the operating program memory of the module, which comprises a program allowing to pilot all the operations of this module and the launching of the execution of a linguistic analysis program.
  • the learning phase is also executed by this device and enriches the data memory.

Abstract

The invention concerns a method for enhancing semantic resources. The invention is characterised in that it consists in using a real-time question/answer electronic system (1) to obtain automatic enhancement of said resources (2).

Description

PROCEDE ET SYSTEME D'ENRICHISSEMENT AUTOMATIQUE DE RESSOURCES SEMANTIQUES A PARTIR D'UN SYSTEME ELECTRONIQUE TEMPS REEL DE QUESTION-REPONSE. METHOD AND SYSTEM FOR AUTOMATICALLY ENRICHING SEMANTIC RESOURCES FROM A REAL-TIME QUESTION-ANSWER ELECTRONIC SYSTEM.
L'invention concerne un système d'enrichissement automatique de ressources sémantiques à partir d'un système électronique temps réel de question-réponse .The invention relates to a system for the automatic enrichment of semantic resources from a real-time electronic question-answer system.
On entend par système électronique de question- réponse un système selon lequel un utilisateur pose une question en langue naturelle à partir d'un outil informatique tel qu'un micro-ordinateur (PC) connecté à travers un réseau de communication à un système comprenant un serveur base de données afin d'obtenir une information constituant la réponse à sa question.By electronic question-answer system is meant a system according to which a user asks a question in natural language from a computer tool such as a microcomputer (PC) connected through a communication network to a system comprising a database server in order to obtain information constituting the answer to his question.
Le plus souvent les questions ne peuvent se présenter que sous une forme extrêmement simplifiée, c'est-à-dire sous forme des mots clés. En effet, les systèmes les plus anciens ne sont pas capables de comprendre une phrase et ne peuvent fonctionner qu'avec des mots clés .Most often the questions can only be presented in an extremely simplified form, that is to say in the form of keywords. Indeed, the oldest systems are not able to understand a sentence and can only work with keywords.
Les systèmes les plus récents intègrent une analyse linguistique pour traduire la question en un langage spécialisé et adapté à la recherche d'information par un moteur de recherche.The most recent systems incorporate a linguistic analysis to translate the question into a specialized language adapted to the search for information by a search engine.
Malheureusement les systèmes actuels sont limités s'ils ne disposent pas de ressources linguistiques importantes. En effet, le système peut être tout à fait capable de trouver la réponse à la question : « Qui a tué Kennedy ?" et pas du tout capable de répondre à la question. « Qui est le meurtrier de Kennedy ? », s'il ne dispose pas d'une base de données de mots synonymes ou de paraphrases . La présente invention permet de remédier à ce problème .Unfortunately current systems are limited if they do not have significant linguistic resources. Indeed, the system may be quite capable of finding the answer to the question, "Who killed Kennedy?" And not at all capable of answering the question. "Who is Kennedy's murderer?" does not have a database of synonyms words or paraphrases. The present invention overcomes this problem.
L'invention propose un procédé d'enrichissement automatique de ressources sémantiques à partir d'un système électronique temps réel de questions-réponses. Le système électronique temps réel de questions- réponses est l'outil utilisé conformément à l'invention pour enrichir de façon automatique les ressources sémantiques d'un réseau sémantique. Ce système d'enrichissement peut donc être utilisé pour enrichir les ressources sémantiques d'un système électronique temps réel de questions-réponses et plus généralement d'un réseau sémantique.The invention provides a method for automatic enrichment of semantic resources from a real-time electronic question-and-answer system. The real-time electronic question and answer system is the tool used in accordance with the invention to automatically enrich the semantic resources of a semantic network. This enrichment system can therefore be used to enrich the semantic resources of a real-time electronic question-answer system and more generally of a semantic network.
Selon l'invention, le système est apte à soumettre la question posée à une opération d'analyse linguistique afin de construire un patron de recherche de la réponse qui se présente sous la forme la plus simple : argumentl - relation - argument2. Ce patron est ensuite recherché et extrait (par appariement direct) des documents rapportés par le moteur de recherche ou argument 1 est la réponse recherchée.According to the invention, the system is capable of subjecting the question posed to a linguistic analysis operation in order to construct a pattern for finding the answer which is presented in the simplest form: argumentl - relation - argument2. This pattern is then sought and extracted (by direct matching) from the documents reported by the search engine or argument 1 is the response sought.
Selon l'invention le système intègre une opération de re-formulation des questions afin de rechercher une même réponse par le biais de plusieurs formulations sé antiquement équivalentes. La re-formulation des questions permet d'augmenter la quantité des documents pouvant apporter une réponse.According to the invention, the system integrates an operation of re-formulation of the questions in order to search for the same answer by means of several formulations which are se cantically equivalent. The re-formulation of the questions increases the quantity of documents that can provide an answer.
Selon l'invention la re-formulation des questions se fait par apprentissage et permet d'obtenir de façon automatique un ensemble de formulations sémantiquement équivalentes à une première formulation d'une relation entre deux arguments .According to the invention, the re-formulation of the questions is done by learning and makes it possible to automatically obtain a set of formulations semantically equivalent to a first formulation of a relationship between two arguments.
L'invention a plus particulièrement pour objet un procédé d'enrichissement de ressources sémantiques principalement caractérisé en ce qu'il consiste à utiliser un système électronique temps réel de question réponses pour obtenir un enrichissement automatique desdites ressources . Selon une autre caractéristique, le procédé comprend les phases suivantes :The invention more particularly relates to a method for enriching semantic resources mainly characterized in that it consists in using an electronic real time system of question answers to obtain an automatic enrichment of said resources. According to another characteristic, the method comprises the following phases:
-une phase d'initialisation comprenant :-an initialization phase including:
• l'établissement d'un patron de recherche sous la forme d'une relation entre deux arguments ou plus à partir des mots clés de la question initiale reçue, la recherche portant sur l'un des arguments du patron les autres étant connus,• the establishment of a search pattern in the form of a relationship between two or more arguments based on the keywords of the initial question received, the research relating to one of the boss's arguments being known,
• la recherche d'au moins une réponse à partir d'un système de recherche couplé à une ou plusieurs bases de données de textes formulés en langage naturel à travers un ou plusieurs réseaux de communication,• the search for at least one answer from a search system coupled to one or more databases of texts formulated in natural language through one or more communication networks,
• l'extraction d'une ou plusieurs réponse à partir de documents fournis par la recherche,• the extraction of one or more responses from documents provided by the research,
- une phase d'apprentissage comprenant : • une recherche d'une ou plusieurs re-formulations de la relation formulée dans le patron de la question initiale, à partir des arguments connus par cette question et de la ou des réponses obtenues,- a learning phase comprising: • a search for one or more re-formulations of the relationship formulated in the pattern of the initial question, based on the arguments known by this question and the answer or answers obtained,
• le stockage de ces re-formulations sur une base de données couplée à l'un des réseaux de communication.• the storage of these re-formulations on a database coupled to one of the communication networks.
Selon une autre caractéristique, la recherche d'une re-formulation comprend :According to another characteristic, the search for a re-formulation includes:
- le renvoi des arguments connus pour déterminer au moins une autre relation entre ces arguments, - la recherche de documents contenant lesdits arguments connus,- returning known arguments to determine at least one other relationship between these arguments, - searching for documents containing said known arguments,
- l'extraction de phrases contenant les arguments connus, de ces documents, - une analyse linguistique des phrases pour en extraire une ou plusieurs relations du type paraphrase de la relation présente dans le patron de la question initiale, - le stockage des relations de type paraphrase de la relation de la question initiale.- extracting sentences containing known arguments from these documents, - a linguistic analysis of the sentences to extract one or more relations of the paraphrase type from the relation present in the pattern of the initial question, - the storage of relations of the paraphrase type from the relation of the initial question.
L'invention a également pour objet un système d'enrichissement de ressources sémantiques, principalement caractérisé en ce qu'il est couplé à un système électronique temps réel de question réponses pour obtenir un enrichissement automatique desdites ressources.The subject of the invention is also a system of enrichment of semantic resources, mainly characterized in that it is coupled to an electronic real time system of question answers to obtain an automatic enrichment of said resources.
Selon une autre caractéristique, le système comprend : - des moyens de mise en œuvre d'une phase d'initialisation de ces moyens comportant :According to another characteristic, the system includes: - means for implementing an initialization phase of these means comprising:
• des moyens d'établissement d'un patron de recherche sous la forme d'une relation entre deux arguments ou plus à partir des mots clés de la question initiale reçue, la recherche portant sur l'un des arguments du patron les autres étant connus,• means of establishing a search pattern in the form of a relationship between two or more arguments from the keywords of the initial question received, the search relating to one of the pattern of the other's arguments being known ,
• des moyens de recherche d'au moins une réponse, couplés à une ou plusieurs bases de données à travers un ou plusieurs réseaux de communication, • des moyens d'extraction d'une ou plusieurs réponse à partir de documents fournis par les moyens de recherche, des moyens de mise en œuvre d'une phase d'apprentissage comportant : • des moyens de recherche d'une ou plusieurs reformulations de la relation formulée dans le patron de la question initiale à partir des arguments connus par cette question et de la ou des réponses obtenues, • des moyens de stockage de ces re-formulations sur une base de donnée couplée à l'un des réseaux de communication.• means for searching for at least one response, coupled to one or more databases through one or more communication networks, • means for extracting one or more responses from documents provided by the means of research, means of implementing a learning phase comprising: • means of researching one or more reformulations of the relation formulated in the pattern of the initial question from the arguments known by this question and from the or answers obtained, • means for storing these re-formulations on a database coupled to one of the communication networks.
Selon une autre caractéristique, les moyens de recherche d'une re-formulation comprennent :According to another characteristic, the means of searching for a re-formulation include:
- des moyens de renvoi des arguments connus par la question initiale,- means of returning the arguments known by the original question,
- des moyens de recherche de documents contenant ces arguments, - des moyens d'extraction de phrases contenant les arguments connus, de ces documents,- means of searching for documents containing these arguments, - means of extracting sentences containing known arguments, from these documents,
- des moyens d'analyse linguistique des phrases pour en extraire une ou plusieurs relations du type paraphrase de la relation présente dans le patron de la question initiale,- means of linguistic analysis of sentences to extract one or more relations of the paraphrase type from the relation present in the pattern of the initial question,
- des moyens de stockage des relations du type paraphrase de la relation de la question initiale.- means for storing relations of the paraphrase type of the relation of the initial question.
Les moyens de renvoi, les moyens d'extraction de phrases contenant les arguments connus de ces documents et les moyens d'analyse linguistique des phrases sont réalisés par des modules de programmes ou processus informatiques aptes à mettre en œuvre les fonctions énoncées et les moyens de recherche sont réalisés par un programme dit moteur de recherche.The reference means, the means of extracting sentences containing the arguments known to these documents and the means of linguistic analysis of the sentences are produced by modules of computer programs or processes capable of implementing the stated functions and the means of search are carried out by a program called search engine.
D'autres particularités et avantages apparaîtront clairement à la lecture de la description qui est faite et qui est donnée à titre d'exemple non limitatif et en regard des dessins sur lesquels : - la figure 1 représente le schéma fonctionnel d'un système d'enrichissement automatique de ressources sémantiques selon l'invention,Other particularities and advantages will appear clearly on reading the description which is made and which is given by way of nonlimiting example and with reference to the drawings in which: - Figure 1 represents the functional diagram of a system of automatic enrichment of semantic resources according to the invention,
- les figures 2A, 2B, représentent les schémas fonctionnels détaillés du système de la figure 1, - la figure 3, représente le dispositif de mise en œuvre des blocs fonctionnels des figures 2A et 2B selon un mode de réalisation.FIGS. 2A, 2B represent the detailed functional diagrams of the system of FIG. 1, - Figure 3 shows the device for implementing the functional blocks of Figures 2A and 2B according to one embodiment.
Selon l'invention on utilise un système électronique de recherche temps réel d'informations. Ce système est couplé au système d'enrichissement de ressources sémantiques à travers d'un réseau de communication. Il peut s'agir d'un réseau intra-net donnant accès à une ou plusieurs bases de données pouvant apporter des éléments de réponse aux questions posées par un utilisateur. Il peut s'agir également du réseau Internet .According to the invention, an electronic system for real-time information search is used. This system is coupled to the system of enrichment of semantic resources through a communication network. It can be an intra-net network giving access to one or more databases which can provide answers to questions asked by a user. It can also be the Internet.
Le système de recherche quel qu'il soit est qualifié de système de base étant entendu qu'il peut ne reposer que sur une opération d'analyse linguistique permettant d'extraire au moins une réponse à une question posée en langue naturelle par un utilisateur utilisant pour ce faire des mots clés.The search system, whatever it is, is qualified as a basic system, it being understood that it can rely only on a linguistic analysis operation making it possible to extract at least one answer to a question asked in natural language by a user using to do this keywords.
On considère en outre selon l'invention que le système est capable de construire la question sous la forme d'un patron de recherche : argument 1, relation, argument 2.It is further considered according to the invention that the system is capable of constructing the question in the form of a search pattern: argument 1, relation, argument 2.
Par exemple à la question : « Qui a tué Kennedy ? », le patron le plus simple a la forme « meurtrier » a tué Kennedy.For example to the question: "Who killed Kennedy? ", The simplest boss in the" murderous "form killed Kennedy.
Ce patron permet alors grâce au moteur de recherche du système d'extraire la réponse « X » dans la phase trouvée dans un ou plusieurs documents trouvés à l'issue de la recherche « X a tué Kennedy ». Ce système de recherche de base porte la référenceThis pattern then allows thanks to the search engine of the system to extract the response "X" in the phase found in one or more documents found at the end of the search "X killed Kennedy". This basic search system carries the reference
I sur la figure 1. Il est couplé à travers un réseau de communication R à une ou plusieurs bases de données 3.I in FIG. 1. It is coupled through a communication network R to one or more databases 3.
II peut s'agir bien entendu du WEB dans le cas où le réseau est Internet. Le système comporte en outre un dispositif d'enrichissement automatique des ressources linguistiques 2. Ce dispositif effectue des opérations d'apprentissage de re-formulations pour obtenir de manière automatique un ensemble de formulations sémantiques équivalentes à une première formulation d'une relation entre deux arguments.It can of course be the WEB in the case where the network is Internet. The system also includes a device for automatic enrichment of linguistic resources 2. This device carries out learning operations for re-formulations to automatically obtain a set of semantic formulations equivalent to a first formulation of a relationship between two arguments. .
Le processus global s'inspire des méthodes dites de « bootstrapping » qui permettent de modéliser des classes d'exemples similaires à partir d'un ensemble d'exemples limité.The overall process is inspired by the so-called “bootstrapping” methods which make it possible to model classes of similar examples from a limited set of examples.
L'apprentissage fait suite à l'initialisation d'une acquisition (bloc 1, figure 1) .Learning follows the initialization of an acquisition (block 1, figure 1).
Comme on l'a vu dans l'étape d'initialisation d'une acquisition les termes principaux de la question sont extraits pour construire une requête destinée au moteur de recherche « standard » prenant la forme d'une suite de mots clés ou d'une chaîne de texte unique : Question : Qui a tué Kennedy ? Mots clés : « tué, Kennedy » .As we saw in the initialization stage of an acquisition, the main terms of the question are extracted to build a query for the "standard" search engine taking the form of a series of keywords or a single text string: Question: Who killed Kennedy? Keywords: "killed, Kennedy".
La question est soumise à une analyse linguistique permettant de construire un patron de recherche pour la réponse ; le patron qui est ensuite recherché permet d'extraire la réponse. Lorsque la réponse est connue, on utilise à nouveau les données des bases de données ou du WEB pour retrouver des relations liant la réponse (X) et l'argument 2 (Kennedy) par une requête contenant ces deux arguments : X, Kennedy.The question is submitted to a linguistic analysis allowing to build a pattern of research for the answer; the pattern which is then sought makes it possible to extract the response. When the answer is known, we again use the data from the databases or the WEB to find relations linking the answer (X) and argument 2 (Kennedy) by a query containing these two arguments: X, Kennedy.
On utilise d'autre part un opérateur de proximité pour contrôler la distance entre les arguments et s'affranchir d'insertions apportant une complexité syntaxique . Cet opérateur permet un contrôle de distance entre les arguments en nombre de mots (1, 2,On the other hand, we use a proximity operator to control the distance between the arguments and to get rid of insertions providing syntactic complexity. This operator allows control of distance between arguments in number of words (1, 2,
Les phrases solutions : X, meurtrier de Kennedy ... Le meurtrier de Kennedy, X....Solution sentences: X, Kennedy's murderer ... Kennedy's murderer, X ...
Un traitement syntaxique simple permet d'extraire les relations synonymes et plus généralement les paraphrases : « meurtrier », « assassin », « criminel »A simple syntactic treatment makes it possible to extract the synonymous relationships and more generally the paraphrases: "murderer", "assassin", "criminal"
De manière duale, les formulations obtenues à partir d'arguments initiaux dont la catégorie sémantique est connue, permettent de catégoriser de nouveaux arguments :In a dual way, the formulations obtained from initial arguments of which the semantic category is known, allow to categorize new arguments:
« meurtrier » assassine « nom» « meurtrier » a tué « nom » « meurtrier » tue « nom »."Murderer" kills "name" "murderer" killed "name" "murderer" kills "name".
En utilisant la requête : « meurtrier », on peut extraire des arguments dont les étiquettes sont « meurtrier» et « nom » et générer ainsi une liste de meurtriers et de personnes assassinées.Using the query: "murderer", we can extract arguments whose labels are "murderer" and "name" and thus generate a list of murderers and murdered people.
On voit que de proche en proche, le système établit plusieurs relations qui forment globalement une relation plus abstraite généralisable par un même prédicat du type :We see that, step by step, the system establishes several relationships which globally form a more abstract relationship generalizable by the same predicate of the type:
[meurtrier] [prédicat_générer] [nom][murderer] [predicate_generate] [name]
Le traitement de la question permet aussi d'obtenir des étiquettes sémantiques : Qui a tué le président Kennedy? permet d'extraire l'étiquette « président » par un traitement syntaxique simple. Ainsi, le processus global consiste à acquérir de nouvelles données et de nouvelles relations en s 'appuyant sur les données et relations précédemment acquises. Pour un énoncé donné, il s'agit d'explorer une nouvelle catégorie de relations, à partir d'une catégorie connue en limitant l'élément variable.The treatment of the question also makes it possible to obtain semantic labels: Who killed President Kennedy? allows to extract the “president” label by a simple syntactic treatment. Thus, the overall process consists in acquiring new data and new relationships by building on the previously acquired data and relationships. For a given statement, it is a question of exploring a new category of relations, starting from a known category by limiting the variable element.
Première conséquence : cette technique permet d'enrichir progressivement l'ensemble des relations connues d'un système de traitement de la langue naturelle (par exemple un réseau sémantique) .First consequence: this technique makes it possible to gradually enrich all of the known relationships of a natural language processing system (for example a semantic network).
Ce système permet la constitution automatique d'un réseau sémantique. Cet enrichissement est ensuite utilisable pour toutes les applications utilisant un tel système. En particulier, le système est directement utilisable pour l'extraction d'informations mettant en jeu les relations acquises. Par exemple, pour extraire d'un texte l'ensemble des assassins et des personnes assassinées, on pourra utiliser les relations apprises comme « meurtrier de » et « a tué». Deuxième conséquence : le système permet de la même manière d'acquérir des formulations dans une autre langue en utilisant les données multilingues du WEB. En réponse à la requête [X, Kennedy] , on obtient : X assassinated Kennedy, X killed Kennedy. Ceci constitue un système d'apprentissage à la traduction et ce qui permet de fournir une traduction dans une autre langue.This system allows the automatic creation of a semantic network. This enrichment can then be used for all applications using such a system. In particular, the system is directly usable for the extraction of information involving the acquired relationships. For example, to extract from a text all of the assassins and murdered people, we can use the relationships learned as "murderer of" and "killed". Second consequence: the system allows in the same way to acquire formulations in another language by using multilingual data from the WEB. In response to the query [X, Kennedy], we get: X assassinated Kennedy, X killed Kennedy. This constitutes a learning system for translation and which makes it possible to provide a translation into another language.
Les différents blocs fonctionnels des figures 2A et 2B permettent d'illustrer de façon détaillée les opérations mises en œuvre lors de la phase d'initialisation I et lors de la phase d'apprentissage II opérées respectivement par le système de recherche 1 et par le dispositif d'enrichissement 2 illustrés sur la figure 1. La phase initiale est réalisée par un système de recherche qui selon un mode préféré de réalisation met en œuvre les opérations 10 à 17 de la figure 2A.The different functional blocks of FIGS. 2A and 2B make it possible to illustrate in detail the operations implemented during the initialization phase I and during the learning phase II operated respectively by the search system 1 and by the device enrichment 2 illustrated in Figure 1. The initial phase is carried out by a search system which according to a preferred embodiment implements operations 10 to 17 of FIG. 2A.
Dans l'exemple pris, la question posée met en relation des triplets du type Argumentl, Relation, Argument2 (étape 10) . Une analyse linguistique (étape 11) permet d'obtenir le patron d'extraction de Argumentl : type sémantique de Argl, Structure Relation-Arg2 (étape 15) . Le moteur de recherche, recherche Arg2 proche de Relation sur les bases de données aux quelles il a accès ou à travers le Web. Selon l'exemple pris : .In the example taken, the question asked relates triplets of the type Argumentl, Relation, Argument2 (step 10). A linguistic analysis (step 11) makes it possible to obtain the extraction pattern of Argumentl: semantic type of Argl, Structure Relation-Arg2 (step 15). The search engine searches Arg2 close to Relation on the databases to which it has access or across the Web. According to the example taken:.
Relation = meurtrier deRelationship = murderer of
Argument2= Kennedy On obtient ainsi des documents HTML (étape 13),Argument2 = Kennedy We thus obtain HTML documents (step 13),
Une extraction des phrases contenant Relation et Arg2 est mise en œuvre par le système de base (étape 15) .An extraction of the sentences containing Relation and Arg2 is implemented by the basic system (step 15).
Une deuxième analyse linguistique permet de rechercher dans ces documents la structure de type Argumentl-Relation-Argument2 (étape 16) . Connaissant Argument 2 et Relation (à partir de la question) l'analyseur extrait Argument 1. L'étape 16 permet ainsi d'extraire la réponse Argument 1. A chaque question posée le système procède à cette première phase pour trouver au moins une réponse. Le système poursuit par la phase II suivante qui lui permet d'effectuer un apprentissage. En effet connaissant Argument 1 et Argument 2 (étape 20 ; Arg 1 et Arg 2 sont connus après l'étape d'initialisation), le moteur de recherche effectue une recherche à partir des mots clés Argument 1 proche de Argument 2 (étape 21) . Le moteur de recherche trouve des documents en réponse et les fournit au format HTML (étape 22) . Ces documents sont filtrés afin d'obtenir un format de texte et des paragraphes linguistiques bien formés.A second linguistic analysis makes it possible to search in these documents for the structure of the Argumentl-Relation-Argument2 type (step 16). Knowing Argument 2 and Relation (from the question) the analyzer extracts Argument 1. Step 16 thus makes it possible to extract the answer Argument 1. For each question asked the system proceeds to this first phase to find at least one answer . The system continues with the next phase II which allows it to carry out a learning process. Knowing Argument 1 and Argument 2 (step 20; Arg 1 and Arg 2 are known after the initialization step), the search engine performs a search using the keywords Argument 1 close to Argument 2 (step 21) . The search engine finds documents in response and provides them in HTML format (step 22). These documents are filtered to obtain a well-formed text format and language paragraphs.
A l'étape 23 un filtre permet d'extraire des phrases contenant Argument 1 et Argument 2. Une analyse linguistique est opérée sur ces phrases (étape 24) .In step 23, a filter is used to extract sentences containing Argument 1 and Argument 2. A linguistic analysis is performed on these sentences (step 24).
Cette analyse permet d'extraire N instances deThis analysis extracts N instances of
« Relation » entre Argument 1 et Argument 2 (étape 25) ."Relation" between Argument 1 and Argument 2 (step 25).
En fin de chaque phase d'apprentissage le système obtient des synonymes de la relation recherchée et plus généralement des paraphrases et stocke dans une base de données ces synonymes . Le système permet par conséquent d'enrichir les ressources pour la recherche à une question posée.At the end of each learning phase, the system obtains synonyms of the desired relationship and more generally paraphrases and stores these synonyms in a database. The system therefore makes it possible to enrich the resources for research on a question asked.
En effet au moment de la deuxième analyse linguistique le système apporte les synonymes stockés.Indeed at the time of the second linguistic analysis the system brings the stored synonyms.
Il peut bien entendu être prévu que la phase d'apprentissage soit inhibée automatiquement lorsque pour une question donnée, déjà posée un grand nombre de fois, un nombre suffisant de synonyme ou paraphrase soit enregistré. Pour cela un seuil pour ce nombre sera fixé. Il suffit alors que le programme mettant en œuvre les étapes qui viennent d'être décrites prévoit un test de comparaison entre la valeur du seuil et le nombre de synonymes enregistrés . On va détailler dans la suite les différents modules permettant de mettre en œuvre les étapes qui viennent d'être détaillées. Ces modules sont des processus informatiques ou programmes aptes à mettre en œuvre les fonctions énoncées .. L'élément 1 de recherche de la première réponse (figure 1) comporte un module 100 de mise en forme et d'appel d'un module d'analyse linguistique 110 et d'un moteur de recherche 120. Le module 100 reçoit sur une entrée a la question Q en ASCII provenant d'une interface html; ce module met en forme cette question selon un format prédéterminé en pratique dans un fichier exploitable par le module d'analyse linguistique 11.It can of course be provided that the learning phase is automatically inhibited when for a given question, already asked a large number of times, a sufficient number of synonym or paraphrase is recorded. For this a threshold for this number will be fixed. It then suffices that the program implementing the steps which have just been described provides for a comparison test between the threshold value and the number of synonyms recorded. We will detail in the following the different modules to implement the steps that have just been detailed. These modules are computer processes or programs capable of implementing the stated functions. Element 1 for searching for the first answer (FIG. 1) comprises a module 100 for formatting and calling a module for linguistic analysis 110 and a search engine 120. The module 100 receives on an input to the question Q in ASCII coming from an html interface; this module formats this question according to a format predetermined in practice in a file usable by the linguistic analysis module 11.
Ce module 100 délivre à une sortie c la question mise en forme au format désiré. Ce module 100 reçoit à une autre entrée b les données extraites par le module d'analyse sur la typologie de la question. Ces données comprennent des mots clés et d'autre données caractéristiques. Le module 100 permet de délivrer à une autre sortie e des mots clés . Les autres données caractéristiques se trouvent sous la forme de fichiers informatiques et sont stockées en mémoire de données du module linguistique 110.This module 100 delivers to an output c the question formatted in the desired format. This module 100 receives at another input b the data extracted by the analysis module on the typology of the question. This data includes keywords and other characteristic data. The module 100 makes it possible to deliver to another output e keywords. The other characteristic data are in the form of computer files and are stored in the data memory of the linguistic module 110.
Les mots clés sont transmis au moteur de recherche 12 pour lui permettant de fournir en sortie la réponse intermédiaire. Cette réponse est une phrase candidate contenant les mots clés . L'ensemble 2000 de traitement de la réponse comprend :The keywords are transmitted to the search engine 12 so that it can provide the intermediate response as an output. This response is a candidate sentence containing the keywords. The 2000 response processing set includes:
- un module 200 pour recevoir sur une entrée a la réponse intermédiaire, la mettre en forme selon un format prédéterminé, délivrer à une sortie c la réponse mise en forme, et fournir à une autre sortie d la réponse définitive dans un format adapté pour la transmission sur le réseau; un module d'analyse linguistique 110, en pratique, il s'agit du même module que celui qui effectue l'extraction des mots clés et des autres données. Ce module 110 est apte à recevoir à une entrée la réponse intermédiaire mise en forme, à vérifier cette réponse à partir des données caractéristiques mémorisées autres que les mots clés, extraire la réponse définitive à l'issue de cette vérification, et fournir en sortie la réponse définitive.a module 200 for receiving on an input has the intermediate response, formatting it according to a predetermined format, delivering to an output c the formatted response, and supplying another output with the final response in a format suitable for the transmission over the network; a linguistic analysis module 110, in practice, this is the same module as that which extracts the keywords and other data. This module 110 is capable of receiving at an input the formatted intermediate response, of verifying this response from the stored characteristic data other than the keywords, extracting the final response after this verification, and output the final response.
Les données autres que les mots clés, sont stockées dans une mémoire de données 1200 par le programme de fonctionnement du module d'analyse 110. On a représenté sur la figure une unité 1100 représentant la mémoire de programme de fonctionnement du module, laquelle comporte un programme permettant de piloter toutes les opérations de ce module et le lancement de l'exécution d'un programme d'analyse linguistique.The data, other than the keywords, are stored in a data memory 1200 by the operating program of the analysis module 110. FIG. 1 shows a unit 1100 representing the operating program memory of the module, which comprises a program allowing to pilot all the operations of this module and the launching of the execution of a linguistic analysis program.
La phase d'apprentissage est également exécutée par ce dispositif et vient enrichir la mémoire de données. The learning phase is also executed by this device and enriches the data memory.

Claims

REVENDICATIONS
1. Procédé d'enrichissement de ressources sémantiques caractérisé en ce qu'il consiste à utiliser un système électronique temps réel de question réponses pour obtenir un enrichissement automatique desdites ressources et en ce qu'il comprend :1. A method of enriching semantic resources characterized in that it consists in using a real time electronic system of question answers to obtain an automatic enrichment of said resources and in that it comprises:
-une phase d'initialisation comprenant :-an initialization phase including:
• l'établissement d'un patron de recherche sous la forme d'une relation entre deux arguments ou plus à partir des mots clés de la question initiale reçue, la recherche portant sur l'un des arguments du patron les autres étant connus,• the establishment of a search pattern in the form of a relationship between two or more arguments based on the keywords of the initial question received, the research relating to one of the boss's arguments being known,
• la recherche d'au moins une réponse à partir d'un système de recherche couplé à une ou plusieurs bases de données de textes formulés en langage naturel à travers un ou plusieurs réseaux de communication,• the search for at least one answer from a search system coupled to one or more databases of texts formulated in natural language through one or more communication networks,
• l'extraction d'une ou plusieurs réponse à partir de documents fournis par la recherche,• the extraction of one or more responses from documents provided by the research,
- une phase d'apprentissage comprenant :- a learning phase comprising:
• une recherche d'une ou plusieurs re-formulations de la relation formulée dans le patron de la question initiale, à partir des arguments connus par cette question et de la ou des réponses obtenues,• a search for one or more re-formulations of the relation formulated in the pattern of the initial question, from the arguments known by this question and the answer or answers obtained,
• le stockage de ces re-formulations sur une base de donnée couplée à l'un des réseaux de communication.• the storage of these re-formulations on a database coupled to one of the communication networks.
2. Procédé d'enrichissement automatique selon la revendication 1, caractérisé en ce que la recherche d'une re-formulation comprend :2. Automatic enrichment method according to claim 1, characterized in that the search for a re-formulation comprises:
- le renvoi des arguments connus pour déterminer au moins une autre relation entre ces arguments, - la recherche de documents apportant au moins une réponse à cette nouvelle question, l'extraction de phrases contenant lesdits arguments connus, de ces documents, - une analyse linguistique des phrases pour en extraire une ou plusieurs relations de type paraphrase de la relation présente dans le patron de la question initiale,- returning known arguments to determine at least one other relationship between these arguments, - the search for documents providing at least one answer to this new question, the extraction of sentences containing said known arguments, from these documents, - a linguistic analysis of sentences to extract one or more relations of the paraphrase type from the relation present in the boss of the original question,
- le stockage des relations de type paraphrase de la relation de la question initiale.- the storage of the paraphrase type relations of the relation of the initial question.
3. Système d'enrichissement de ressources sémantiques, caractérisé en ce qu'il est couplé à un système électronique temps réel de question réponses pour obtenir un enrichissement automatique desdites ressources et en ce qu'il comprend : des moyens de mise en œuvre d'une phase d'initialisation de ces moyens comportant :3. Semantic resource enrichment system, characterized in that it is coupled to a real time electronic question and answer system to obtain an automatic enrichment of said resources and in that it comprises: means for implementing an initialization phase of these means comprising:
• des moyens d'établissement d'un patron de recherche sous la forme d'une relation entre deux arguments ou plus à partir des mots clés de la question initiale reçue, la recherche portant sur l'un des arguments du patron les autres étant connus,• means of establishing a search pattern in the form of a relationship between two or more arguments from the keywords of the initial question received, the search relating to one of the pattern of the other's arguments being known ,
• des moyens de recherche d'au moins une réponse, couplés à une ou plusieurs bases de données de textes formulés en langage naturel à travers un ou plusieurs réseaux de communication,Means of searching for at least one response, coupled to one or more databases of texts formulated in natural language through one or more communication networks,
• des moyens d'extraction d'une ou plusieurs réponse à partir de documents fournis par les moyens de recherche, des moyens de mise en œuvre d'une phase d'apprentissage comportant :Means for extracting one or more responses from documents provided by the research means, means for implementing a learning phase comprising:
• des moyens de recherche d'une ou plusieurs reformulations de la relation formulée dans le patron de la question initiale à partir des arguments connus par cette question et de la ou des réponses obtenues,• means of finding one or more reformulations of the relationship formulated in the pattern of the initial question from the arguments known by this question and the answer (s) obtained,
• des moyens de stockage de ces re-formulations sur une base de donnée couplée à l'un des réseaux de communication.• means for storing these re-formulations on a database coupled to one of the communication networks.
4. Système d'enrichissement automatique selon la revendication 3, caractérisé en ce les moyens de recherche d'une re-formulation comprennent : - des moyens de renvoi des arguments connus par la question initiale,4. Automatic enrichment system according to claim 3, characterized in that the means for seeking a re-formulation comprise: - means for returning the arguments known by the initial question,
- des moyens de recherche de documents contenant ces arguments,- means of searching for documents containing these arguments,
- des moyens d'extraction de phrases contenant les arguments connus, de ces documents,- means of extracting sentences containing known arguments, from these documents,
- des moyens d'analyse linguistique des phrases pour en extraire une ou plusieurs relations de type paraphrase de la relation présente dans le patron de la question initiale, - des moyens de stockage des relations de type paraphrase de la relation de la question initiale.- means of linguistic analysis of the sentences to extract one or more relations of the paraphrase type from the relation present in the pattern of the initial question, - means of storage of the relations of the paraphrase type from the relation of the initial question.
5. Système d'enrichissement automatique selon la revendication 4, caractérisé en ce que les moyens de renvoi, les moyens d'extraction de phrases contenant les arguments connus, de ces documents et les moyens d'analyse linguistique des phrases sont réalisés par des modules de programmes ou processus informatiques aptes à mettre en œuvre les fonctions énoncées et en ce que les moyens de recherche sont réalisés par un programme dit moteur de recherche. 5. Automatic enrichment system according to claim 4, characterized in that the reference means, the means for extracting sentences containing the known arguments, from these documents and the means for linguistic analysis of the sentences are produced by modules computer programs or processes capable of implementing the stated functions and in that the search means are carried out by a program called the search engine.
PCT/FR2002/002513 2001-07-19 2002-07-15 Method and system for automatically enhancing semantic resources with a real-time question-answer electronic system WO2003012681A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP02791500A EP1407389A1 (en) 2001-07-19 2002-07-15 Method and system for automatically enhancing semantic resources with a real-time question-answer electronic system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR01/09684 2001-07-19
FR0109684A FR2827685B1 (en) 2001-07-19 2001-07-19 METHOD AND SYSTEM FOR AUTOMATICALLY ENRICHING SEMANTIC RESOURCES FROM A REAL-TIME QUESTION-ANSWER ELECTRONIC SYSTEM

Publications (1)

Publication Number Publication Date
WO2003012681A1 true WO2003012681A1 (en) 2003-02-13

Family

ID=8865718

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2002/002513 WO2003012681A1 (en) 2001-07-19 2002-07-15 Method and system for automatically enhancing semantic resources with a real-time question-answer electronic system

Country Status (3)

Country Link
EP (1) EP1407389A1 (en)
FR (1) FR2827685B1 (en)
WO (1) WO2003012681A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004722A1 (en) * 2006-07-03 2008-01-10 Ismaker Co., Ltd. System and method for realtime question and answer by communication media transferring interactive data and voice
CN112528005A (en) * 2020-12-25 2021-03-19 中山大学 Chinese dialogue knowledge retrieval method based on knowledge retrieval graph and pre-training model

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0631244A2 (en) * 1993-06-24 1994-12-28 Xerox Corporation A method and system of information retrieval
WO2000057302A1 (en) * 1999-03-19 2000-09-28 Ask Jeeves, Inc. Grammar template query system
WO2001020500A2 (en) * 1999-09-17 2001-03-22 Sri International Information retrieval by natural language querying
US6263335B1 (en) 1996-02-09 2001-07-17 Textwise Llc Information extraction system and method using concept-relation-concept (CRC) triples

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0631244A2 (en) * 1993-06-24 1994-12-28 Xerox Corporation A method and system of information retrieval
US6263335B1 (en) 1996-02-09 2001-07-17 Textwise Llc Information extraction system and method using concept-relation-concept (CRC) triples
WO2000057302A1 (en) * 1999-03-19 2000-09-28 Ask Jeeves, Inc. Grammar template query system
WO2001020500A2 (en) * 1999-09-17 2001-03-22 Sri International Information retrieval by natural language querying

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008004722A1 (en) * 2006-07-03 2008-01-10 Ismaker Co., Ltd. System and method for realtime question and answer by communication media transferring interactive data and voice
US8046342B2 (en) 2006-07-03 2011-10-25 Ismaker Co., Ltd. System and method for providing real time answering service by using communication media capable of transmitting and receiving data and voice
CN112528005A (en) * 2020-12-25 2021-03-19 中山大学 Chinese dialogue knowledge retrieval method based on knowledge retrieval graph and pre-training model
CN112528005B (en) * 2020-12-25 2022-08-09 中山大学 Chinese dialogue knowledge retrieval method based on knowledge retrieval graph and pre-training model

Also Published As

Publication number Publication date
FR2827685A1 (en) 2003-01-24
EP1407389A1 (en) 2004-04-14
FR2827685B1 (en) 2003-09-26

Similar Documents

Publication Publication Date Title
RU2747425C2 (en) Real-time answer system to questions from different fields of knowledge
US6199067B1 (en) System and method for generating personalized user profiles and for utilizing the generated user profiles to perform adaptive internet searches
US6671681B1 (en) System and technique for suggesting alternate query expressions based on prior user selections and their query strings
EP0996899B1 (en) Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
EP1364316A2 (en) Device for retrieving data from a knowledge-based text
US6766320B1 (en) Search engine with natural language-based robust parsing for user query and relevance feedback learning
US20030182391A1 (en) Internet based personal information manager
WO2007136402A1 (en) Systems and methods for answering user questions
Lenz et al. CBR for document retrieval: The FA ll Q project
Zechner A literature survey on information extraction and text summarization
WO2001090934A1 (en) Automatic and secure data search method using a data transmission network
WO2003012681A1 (en) Method and system for automatically enhancing semantic resources with a real-time question-answer electronic system
US20090234836A1 (en) Multi-term search result with unsupervised query segmentation method and apparatus
US20030204500A1 (en) Process and apparatus for automatic retrieval from a database and for automatic enhancement of such database
KR100225855B1 (en) Schedule management method
CN113987146B (en) Dedicated intelligent question-answering system of electric power intranet
Bruder et al. GETESS: Constructing a linguistic search index for an Internet search engine
De Roeck et al. The YPA–An Assistant for Classified Directory Enquiries
Klein et al. Distributed knowledge-based parsing for document analysis and understanding
Buzikashvili An exploratory web log study of multitasking
Nwe et al. Replacing same meaning in sentences using natural language understanding
CN114722170A (en) Interactive information pushing method and device based on user intention
FR2839168A1 (en) Information extraction method through Internet, involves transmitting additional documents for specialized processing and formatted information, to server
Johansson Computer forensic text analysis with open source software
FR3096157A1 (en) multidimensional textual content indexing process

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BY BZ CA CH CN CO CR CU CZ DE DM DZ EC EE ES FI GB GD GE GH HR HU ID IL IN IS JP KE KG KP KR LC LK LR LS LT LU LV MA MD MG MN MW MX MZ NO NZ OM PH PL PT RU SD SE SG SI SK SL TJ TM TN TR TZ UA UG US UZ VN YU ZA ZM

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ UG ZM ZW AM AZ BY KG KZ RU TJ TM AT BE BG CH CY CZ DK EE ES FI FR GB GR IE IT LU MC PT SE SK TR BF BJ CF CG CI GA GN GQ GW ML MR NE SN TD TG US

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2002791500

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2002791500

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP