WO2009053613A1 - Method and system for annotating multimedia documents - Google Patents

Method and system for annotating multimedia documents Download PDF

Info

Publication number
WO2009053613A1
WO2009053613A1 PCT/FR2008/051823 FR2008051823W WO2009053613A1 WO 2009053613 A1 WO2009053613 A1 WO 2009053613A1 FR 2008051823 W FR2008051823 W FR 2008051823W WO 2009053613 A1 WO2009053613 A1 WO 2009053613A1
Authority
WO
WIPO (PCT)
Prior art keywords
sections
annotation
automatic
document
section
Prior art date
Application number
PCT/FR2008/051823
Other languages
French (fr)
Inventor
Stéphane Canu
Bruno Grilheres
Stephan Brunessaux
Original Assignee
Eads Defence And Security Systems
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eads Defence And Security Systems filed Critical Eads Defence And Security Systems
Priority to DE112008002713T priority Critical patent/DE112008002713T8/en
Priority to GB1007180A priority patent/GB2466752A/en
Publication of WO2009053613A1 publication Critical patent/WO2009053613A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Definitions

  • the present invention relates to a method and a system for annotating multimedia documents as well as a computer program product for implementing the method.
  • An annotation system is a system for adding high-level information called metadata to a multimedia document, that is, a text, image, audio and / or video document.
  • Annotations are of various granularities and apply to a complete document as to any section of a document. They are also of varied nature. For example, annotations are temporal, spatial, semantic, and so on. and apply to either a document section or multiple sections in the case of relation extraction.
  • the annotation then allows advanced processing on documents. For example, it allows filtering against annotations, reasoning, or advanced annotation searches.
  • the annotation is usually done manually by a person responsible for reading the documents. Manually annotating documents, however, is a particularly time-consuming task. Also, in some cases, the annotation is performed completely automatically but then no improvement of the system over time is possible, except to change version of the annotation engine.
  • All automatic systems are based on an annotation model that contains the relationships between the annotations and the characteristics of the document, or a part / section of the document. Thus, when a new document is to be annotated, the system looks for characteristics identical to those contained in the model in order to apply the corresponding annotations to the document.
  • a semantic annotation platform is based on matching (in English "matching") the instances of a domain ontology with the content of a document, generally with a step of semantic disambiguation making it possible to find the best instance of ontology according to the context of the section to annotate.
  • Some annotation platforms allow you to learn an annotation model from examples. In this case, the generated models are often unclear to a non-expert user and can not be easily validated by him. It would be desirable to define a method and an annotation system that combine the efficiency of automatic systems with the flexibility and versatility of manual systems.
  • a method of annotating a plurality of multimedia documents, each multimedia document comprising at least one section, and each section comprising at least one characteristic comprises the steps of:
  • the annotation method advantageously creates a model based on a set of annotations provided by the user. It is therefore understandable that, by a suitable selection of manually annotated documents, the user has a decisive influence on the quality of this model.
  • Particular features or embodiments of this method are:
  • It also includes a step of manual validation of the automatic annotation, followed by an iteration of at least the step of automatic model creation to replace the annotation model to take into account the validated annotations, the steps automatic creation, automatic annotation and manual validation thus forming an iterative loop for improving the annotation model.
  • a relation between a representative graph of the annotation classes and a representative graph of the characteristics of the documents is defined as the product of exponential families based on the sections, and a cost function is defined as the log likelihood of at least a part sections so that the automatic creation of the model consists of minimizing the cost function by selecting the most representative sections and adjusting the weights.
  • the method advantageously makes it possible to create an iterative loop for improving the annotation model because the validation and the possible correction of the annotations generated automatically makes it possible to on the one hand, to provide new input data for the automatic creation of the model and, on the other hand, to validate the quality of the model by the number of corrections to be made.
  • the method of automatic creation of the model also advantageously allows to limit as much as possible the number of sections used by it while retaining only those which are most representative of the links of the model.
  • a computer program product includes program code instructions recorded on a computer readable medium, for implementing the steps of the preceding method when said program is running on a computer.
  • a system for annotating a plurality of multimedia documents each multimedia document comprising at least one section, and each section comprising at least one characteristic, comprises:
  • User interface means adapted to manually annotate at least one document of the plurality of documents by assigning to each section of said document at least one annotation class; means for automatically creating a document; annotation model defining relations between the annotation classes and the characteristics of the sections, said automatic creation means comprising iterative learning means based on the selection of relevant sections, as well as means for • selection of the document section most representative of all the existing sections and the farthest from the previously selected sections,
  • the interface means are further adapted to manually validate the automatic annotation, and in that the automatic model creation means are adapted to take account of the validated annotations.
  • a relation between a representative graph of the annotation classes and a representative graph of the characteristics of the documents is defined as the product of exponential families based on the sections, and a cost function is defined as the log likelihood of at least a part sections so that the automatic creation of the model consists of minimizing the cost function by selecting the most representative sections and adjusting the weights.
  • FIG. 1 is a schematic view of an annotation system according to one embodiment of the invention.
  • FIG. 2 is a flowchart of an annotation method according to one embodiment of the invention.
  • an annotation system comprises a terminal 1 having a man / machine interface 3.
  • This interface 3 is adapted to annotate a document manually, it is classically based on a hardware information presentation interface composed, for example, of a screen, and on information input means composed, for example, of a keyboard and a mouse.
  • This interface 3 allows various elementary operations related to manual document annotation.
  • a section corresponds to a variable granularity representing a certain homogeneity.
  • a section is a word in a text or a sequence of images in a video.
  • the interface 3 allows the user to assign each section at least one class, or type, of annotation. For example, the user assigns syntactic annotations to text and / or semantic annotations as a class of an ontology.
  • the interface includes selection tools. In a relatively simple form, these tools may be only list forms allowing a choice of annotation among a predefined list. In more sophisticated forms, these tools may offer annotations based on a first automatic analysis of the document or section concerned, for example using a pre-existing annotation template.
  • the human / machine interface 3 thus includes a specialized editor for adding, modifying or deleting annotations to a multimedia document.
  • the terminal 1 is connected to a learning server 5 by a data link 6.
  • the learning server 5 comprises means 7 for automatically creating an annotation model defining relations between the annotation classes and the characteristics of the sections.
  • the automatic creation means 7 use manually annotated documents from the terminal 1 as input parameters.
  • the learning server 5 also comprises means 9 for automatic annotation of a non-annotated document by application of the created annotation model.
  • a user annotates a multimedia document using the terminal 1 and the adapted man-machine interface 3.
  • the annotated document is sent at 13 to the learning server 5.
  • the learning server 5 then starts, step 15, the execution of the means 7 of automatic model creation.
  • These perform iteratively the following steps: • selection, step 17, of the section of the most representative document of the set and the furthest away from the sections that have already been possibly selected.
  • distant section, or near, another section is meant a distance in the mathematical sense of the term defined in a section metric.
  • a close section is a section that has substantially the same characteristics or very similar characteristics of other sections.
  • step 19 Adjustment, in step 19, of the weightings associated with the various selected sections, deletion, step 21, of the least representative sections of all the documents or sections closest to the selected sections.
  • a new document is annotated, step 23, automatically either at the request of the user or as part of a batch process.
  • the automatically annotated document is sent to the terminal 1 so that the user can study, and possibly modify, in step 27, the annotations proposed by the system.
  • the step 15 of launching the model creation is again executed by integrating into the input data of this creation the new document with its annotations modified by the user. .
  • the model is refined to reach a level of quality such that no user intervention is necessary. is no longer necessary.
  • the creation of the model then consists in minimizing the log likelihood of a sample while limiting the number of cores to use.
  • the selection of the nuclei and the adjustment of the weights ⁇ is done according to the iterative algorithm below.
  • the selected nuclei are then those that minimize the gradient: A- - 1 T ⁇ £ (Xjk (X jx k) ⁇ (k yj.y) +] TK (x, .x k) (f ⁇ ) (y k ⁇ x) - ⁇ (y, .y k ))
  • kernels correspond to the sections of annotated documents and thus constitute the annotation model.
  • the distribution between terminal and learning server may actually correspond to a functional distribution, all the functions of the system being realized on a workstation programmed accordingly.
  • an embodiment corresponds to a software implementation of the annotation method and that thus a computer program product includes instructions such as, executed on a computer, the annotation method is implemented.
  • the method can also be implemented in hardware form, for example, by programming a network of doors of type FPGA (user programmable gate array) or in a combined hardware-software form according to design rules well known to those skilled in the art.
  • FPGA field programmable gate array

Abstract

A method of annotating a plurality of multimedia documents, each multimedia document comprising at least one section, and each section comprising at least one characteristic, comprises the steps of: manual annotation (11) of at least one document of the plurality of documents by assigning each section of said document at least one annotation class, automatic creation (15) of an annotation model defining relationships between the annotation classes and the characteristics of the sections, said automatic creation being carried out by iterative learning based on the selecting of relevant sections, automatic annotation (23) of an unannotated document of the plurality of multimedia documents by applying the annotation model, charcterised in that the step of automatic creation comprises the sub-steps of selection, adjustment and suppression.

Description

PROCEDE ET SYSTEME D'ANNOTATION DE DOCUMENTS METHOD AND SYSTEM FOR ANNOTATING DOCUMENTS
MULTIMEDIA.MULTIMEDIA.
La présente invention concerne un procédé et un système d'annotation de documents multimédia ainsi qu'un produit programme d'ordinateur pour mettre en œuvre Ie procédé. Un système d'annotation est un système qui permet d'ajouter de l'information de haut niveau appelée métadonnées sur un document multimédia, c'est-à-dire un document textuel, d'image, audio et/ou vidéo. Les annotations sont de granularités diverses et s'appliquent à un document complet comme à une section quelconque d'un document. Elles sont aussi de nature variée. Par exemple, les annotations sont de type temporel, spatial, sémantique, etc. et s'appliquent soit à une section de document, soit à plusieurs sections dans le cas de l'extraction de relation.The present invention relates to a method and a system for annotating multimedia documents as well as a computer program product for implementing the method. An annotation system is a system for adding high-level information called metadata to a multimedia document, that is, a text, image, audio and / or video document. Annotations are of various granularities and apply to a complete document as to any section of a document. They are also of varied nature. For example, annotations are temporal, spatial, semantic, and so on. and apply to either a document section or multiple sections in the case of relation extraction.
L'annotation permet ensuite des traitements avancés sur les documents. Par exemple, elle permet le filtrage par rapport aux annotations, des raisonnements, ou des recherches avancées sur les annotations.The annotation then allows advanced processing on documents. For example, it allows filtering against annotations, reasoning, or advanced annotation searches.
L'annotation est généralement réalisée de façon manuelle par une personne chargée de la lecture des documents. L'annotation manuelle de documents est cependant une tâche particulièrement chronophage. Aussi, dans certains cas, l'annotation est réalisée de façon complètement automatique mais alors aucune amélioration du système au cours du temps n'est possible, sauf à changer de version du moteur d'annotation.The annotation is usually done manually by a person responsible for reading the documents. Manually annotating documents, however, is a particularly time-consuming task. Also, in some cases, the annotation is performed completely automatically but then no improvement of the system over time is possible, except to change version of the annotation engine.
Tous les systèmes automatiques sont basés sur un modèle d'annotation qui contient les relations entre les annotations et les caractéristiques du document, ou d'une partie/section du document. Ainsi quand un nouveau document est à annoter, le système recherche des caractéristiques identiques à celles contenues dans le modèle pour appliquer au document les annotations correspondantes.All automatic systems are based on an annotation model that contains the relationships between the annotations and the characteristics of the document, or a part / section of the document. Thus, when a new document is to be annotated, the system looks for characteristics identical to those contained in the model in order to apply the corresponding annotations to the document.
De façon générale, une plateforme d'annotation sémantique se base sur la mise en relation (en anglais « matching ») des instances d'une ontologie de domaine avec le contenu d'un document, avec généralement une étape de désambiguïsation sémantique permettant de trouver la meilleure instance de l'ontologie en fonction du contexte de la section à annoter. Certaines plateformes d'annotation permettent l'apprentissage d'un modèle d'annotation à partir d'exemples. Dans ce cas, les modèles générés sont souvent peu compréhensibles d'un utilisateur non expert et ne peuvent pas être validés facilement par lui. II serait ainsi souhaitable de définir un procédé et un système d'annotation qui combinent l'efficacité des systèmes automatiques avec la souplesse et la versatilité des systèmes manuels.Generally speaking, a semantic annotation platform is based on matching (in English "matching") the instances of a domain ontology with the content of a document, generally with a step of semantic disambiguation making it possible to find the best instance of ontology according to the context of the section to annotate. Some annotation platforms allow you to learn an annotation model from examples. In this case, the generated models are often unclear to a non-expert user and can not be easily validated by him. It would be desirable to define a method and an annotation system that combine the efficiency of automatic systems with the flexibility and versatility of manual systems.
Pour résoudre un ou plusieurs des inconvénients cités précédemment, un procédé d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comporte les étapes de :To solve one or more of the aforementioned drawbacks, a method of annotating a plurality of multimedia documents, each multimedia document comprising at least one section, and each section comprising at least one characteristic, comprises the steps of:
• annotation manuelle d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation, • création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, ladite création automatique étant réalisée par un apprentissage itératif basé sur la sélection de sections pertinentes, cette étape comportant les sous- étapes de : • sélection de la section de document la plus représentative de l'ensemble des sections annotées et la plus éloignée des sections précédemment sélectionnées,Manual annotation of at least one of the plurality of documents by assigning to each section of said document at least one annotation class, automatic creation of an annotation model defining relations between the annotation classes and the characteristics of the sections, said automatic creation being performed by iterative learning based on the selection of relevant sections, this step comprising the sub-steps of: selecting the most representative document section of the set of annotated sections and the furthest from the previously selected sections,
• ajustement de pondérations associées aux différentes sections,• adjustment of weights associated with the different sections,
• suppression des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées.• deleting sections with weights lower than a predetermined value or sections substantially identical to the selected sections.
• annotation automatique d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation.• Automatic annotation of a non-annotated document of the plurality of multimedia documents by application of the annotation template.
Ainsi, le procédé d'annotation crée avantageusement un modèle basé sur un ensemble d'annotations fournies par l'utilisateur. On comprend donc que, par une sélection adaptée des documents annotés manuellement, l'utilisateur a une influence déterminante sur la qualité de ce modèle. Des caractéristiques ou des modes de réalisation particuliers de ce procédé sont :Thus, the annotation method advantageously creates a model based on a set of annotations provided by the user. It is therefore understandable that, by a suitable selection of manually annotated documents, the user has a decisive influence on the quality of this model. Particular features or embodiments of this method are:
• il comporte en outre une étape de validation manuelle de l'annotation automatique, suivi d'une itération d'au moins l'étape de création automatique de modèle afin de remplacer le modèle d'annotation pour tenir compte des annotations validées, les étapes de création automatique, d'annotation automatique et de validation manuelle formant ainsi une boucle itérative d'amélioration du modèle d'annotation.• It also includes a step of manual validation of the automatic annotation, followed by an iteration of at least the step of automatic model creation to replace the annotation model to take into account the validated annotations, the steps automatic creation, automatic annotation and manual validation thus forming an iterative loop for improving the annotation model.
• une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations.• a relation between a representative graph of the annotation classes and a representative graph of the characteristics of the documents is defined as the product of exponential families based on the sections, and a cost function is defined as the log likelihood of at least a part sections so that the automatic creation of the model consists of minimizing the cost function by selecting the most representative sections and adjusting the weights.
• la minimisation du coût comporte les étapes itératives suivantes :• Cost minimization involves the following iterative steps:
• création d'un ensemble de sections actives initialisé à vide,• creation of a set of active sections initialized empty,
• itération tant que la fonction de coût diminue des sous-étapes :• iteration as long as the cost function decreases substeps:
• génération de l'ensemble des sections possibles sur les documents annotés,• generation of all possible sections on annotated documents,
• calcul, pour chaque section sélectionnée, d'un gradient de la fonction de coût pour une pondération nulle,Calculating, for each selected section, a gradient of the cost function for zero weighting,
• ajout à l'ensemble des sections actives, de la ou les sections dont le gradient est maximum, • itération tant que les pondérations des sections de l'ensemble des sections actives évoluent des sous-étapes : o calcul de la fonction de coût et des gradients associés, o calcul des pondérations des sections de l'ensemble des sections actives par une méthode de descente de gradient.• addition to the set of active sections, of the section or sections whose gradient is maximum, • iteration as long as the weightings of the sections of the set of active sections change substeps: o calculation of the cost function and associated gradients, o calculating the weights of the sections of the set of active sections by a gradient descent method.
Ainsi, le procédé permet avantageusement de créer une boucle itérative d'amélioration du modèle d'annotation car la validation et la correction éventuelle des annotations générées automatiquement permet d'une part de fournir de nouvelles données en entrée de la création automatique du modèle et d'autre part de valider la qualité du modèle par le nombre de corrections à apporter.Thus, the method advantageously makes it possible to create an iterative loop for improving the annotation model because the validation and the possible correction of the annotations generated automatically makes it possible to on the one hand, to provide new input data for the automatic creation of the model and, on the other hand, to validate the quality of the model by the number of corrections to be made.
Le procédé de création automatique du modèle permet également avantageusement de limiter au maximum le nombre de sections utilisées par celui-ci en ne conservant que celles qui sont les plus représentatives des liaisons du modèle.The method of automatic creation of the model also advantageously allows to limit as much as possible the number of sections used by it while retaining only those which are most representative of the links of the model.
Il se base sur les modèles CRF décrits dans John Lafferty, Andrew McCallum et Fernando Pereira, "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Séquence Data", Proceedings of the International Conférence on Machine Learning (ICML-2001), 2001.It is based on the CRF models described in John Lafferty, Andrew McCallum and Fernando Pereira, "Conditional Random Fields: Probabilistic Models for Segmenting and Sequence Data Labeling", Proceedings of the International Conference on Machine Learning (ICML-2001), 2001.
Il se base également sur les modèles KCRF décrits dans John Lafferty, Xiaojin Zhu et Yan Liu, « Kernel conditional random fields: représentation and clique sélection", ICML '04: Proceedings of the twenty-first international conférence on Machine learning.It is also based on the KCRF models described in John Lafferty, Xiaojin Zhu and Yan Liu, "Kernel conditional random fields: representation and clique selection", ICML '04: Proceedings of the twenty-first international conference on Machine learning.
Cependant le procédé permet avantageusement de rendre ces modèles itératifs et incrémentaux.However, the method advantageously makes it possible to make these models iterative and incremental.
Dans un deuxième aspect de l'invention, un produit programme d'ordinateur comprend des instructions de code de programme enregistrées sur un support lisible par un ordinateur, pour mettre en œuvre les étapes du procédé précédent lorsque ledit programme fonctionne sur un ordinateur.In a second aspect of the invention, a computer program product includes program code instructions recorded on a computer readable medium, for implementing the steps of the preceding method when said program is running on a computer.
Dans un troisième aspect de l'invention, un système d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comporte :In a third aspect of the invention, a system for annotating a plurality of multimedia documents, each multimedia document comprising at least one section, and each section comprising at least one characteristic, comprises:
• des moyens d'interface avec un utilisateur adaptés pour annoter manuellement d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation, • des moyens de création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, lesdits moyens de création automatique comportant des moyens d'apprentissage itératif basé sur la sélection de sections pertinentes, ainsi que des moyens de • sélection de la section de document la plus représentative de l'ensemble des sections existantes et la plus éloignée des sections précédemment sélectionnées,User interface means adapted to manually annotate at least one document of the plurality of documents by assigning to each section of said document at least one annotation class; means for automatically creating a document; annotation model defining relations between the annotation classes and the characteristics of the sections, said automatic creation means comprising iterative learning means based on the selection of relevant sections, as well as means for • selection of the document section most representative of all the existing sections and the farthest from the previously selected sections,
• ajustement de pondérations associées aux différentes sections, • suppression des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées,• adjustment of weightings associated with the different sections, • deletion of sections having weights lower than a predetermined value or sections substantially identical to the selected sections,
• des moyens d'annotation automatique d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation.Means for automatically annotating a non-annotated document of the plurality of multimedia documents by applying the annotation model.
Des caractéristiques ou des modes de réalisation particuliers de ce système sont :Features or particular embodiments of this system are:
• les moyens d'interface sont adaptés en outre pour valider manuellement l'annotation automatique, et en ce que les moyens de création automatique de modèle sont adaptés pour tenir compte des annotations validées.The interface means are further adapted to manually validate the automatic annotation, and in that the automatic model creation means are adapted to take account of the validated annotations.
• une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations.• a relation between a representative graph of the annotation classes and a representative graph of the characteristics of the documents is defined as the product of exponential families based on the sections, and a cost function is defined as the log likelihood of at least a part sections so that the automatic creation of the model consists of minimizing the cost function by selecting the most representative sections and adjusting the weights.
L'invention sera mieux comprise à la lecture de la description qui suit, faite uniquement à titre d'exemple, et en référence aux figures en annexe dans lesquelles :The invention will be better understood on reading the description which follows, given solely by way of example, and with reference to the appended figures in which:
- la figure 1 est une vue schématique d'un système d'annotation selon un mode de réalisation de l'invention ; etFIG. 1 is a schematic view of an annotation system according to one embodiment of the invention; and
- la figure 2 est un ordinogramme d'un procédé d'annotation selon un mode de réalisation de l'invention.FIG. 2 is a flowchart of an annotation method according to one embodiment of the invention.
En référence à la figure 1 , un système d'annotation comporte un terminal 1 ayant une interface homme/machine 3. Cette interface 3 est adaptée pour annoter manuellement un document, II est basé classiquement sur une interface matérielle de présentation d'information composée, par exemple, d'un écran, et sur des moyens de saisie d'information composés, par exemple, d'un clavier et d'une souris.With reference to FIG. 1, an annotation system comprises a terminal 1 having a man / machine interface 3. This interface 3 is adapted to annotate a document manually, it is classically based on a hardware information presentation interface composed, for example, of a screen, and on information input means composed, for example, of a keyboard and a mouse.
Cette interface 3 permet différentes opérations élémentaires liées à l'annotation manuelle de document.This interface 3 allows various elementary operations related to manual document annotation.
Elle permet ainsi de découper le document en une ou plusieurs sections homogènes sur lesquelles seront basées les annotations. Suivant le type de document, une section correspond à une granularité variable représentant une certaine homogénéité. Par exemple, une section correspond à un mot dans un texte ou à une séquence d'images dans une vidéo.It thus makes it possible to cut the document into one or more homogeneous sections on which the annotations will be based. Depending on the type of document, a section corresponds to a variable granularity representing a certain homogeneity. For example, a section is a word in a text or a sequence of images in a video.
Le découpage en sections est soit automatique, c'est-à-dire que le système effectue seul celui-ci, soit manuel et donc réalisé par l'opérateur au moyen de l'interface, soit semi-automatique permettant à l'opérateur de modifier un découpage préparé par le système. Une fois le document découpé en sections, l'interface 3 permet à l'utilisateur d'affecter à chaque section au moins une classe, ou type, d'annotation. Par exemple, l'utilisateur affecte des annotations syntaxiques à un texte et/ou des annotations sémantiques sous forme de classe d'une ontologie. Pour aider à cette affectation, l'interface comporte des outils d'aide à la sélection. Dans une forme relativement simple, ces outils peuvent n'être que des formulaires de liste permettant un choix d'annotation parmi une liste prédéfinie. Dans des formes plus sophistiquées, ces outils peuvent proposer des annotations en se basant sur une première analyse automatique du document ou de la section concernée, par exemple en utilisant un modèle d'annotation préexistant.The division into sections is either automatic, that is to say that the system performs only this one, either manual and therefore performed by the operator by means of the interface, or semi-automatic allowing the operator to modify a slice prepared by the system. Once the document is cut into sections, the interface 3 allows the user to assign each section at least one class, or type, of annotation. For example, the user assigns syntactic annotations to text and / or semantic annotations as a class of an ontology. To help with this assignment, the interface includes selection tools. In a relatively simple form, these tools may be only list forms allowing a choice of annotation among a predefined list. In more sophisticated forms, these tools may offer annotations based on a first automatic analysis of the document or section concerned, for example using a pre-existing annotation template.
L'interface homme/machine 3 comporte ainsi un éditeur spécialisé permettant d'ajouter, modifier ou supprimer des annotations à un document multimédia.The human / machine interface 3 thus includes a specialized editor for adding, modifying or deleting annotations to a multimedia document.
Le terminal 1 est connecté à un serveur d'apprentissage 5 par une liaison de données 6. Le serveur d'apprentissage 5 comporte des moyens 7 de création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections. Les moyens 7 de création automatique utilisent les documents annotés manuellement en provenance du terminal 1 comme paramètres d'entrée.The terminal 1 is connected to a learning server 5 by a data link 6. The learning server 5 comprises means 7 for automatically creating an annotation model defining relations between the annotation classes and the characteristics of the sections. The automatic creation means 7 use manually annotated documents from the terminal 1 as input parameters.
Le serveur d'apprentissage 5 comporte également des moyens 9 d'annotation automatique d'un document non annoté par application du modèle d'annotation créé.The learning server 5 also comprises means 9 for automatic annotation of a non-annotated document by application of the created annotation model.
Le fonctionnement du système va maintenant être décrit en relation avec la figure 2.The operation of the system will now be described in connection with FIG.
Dans une étape 11 , un utilisateur annote un document multimédia en utilisant le terminal 1 et l'interface homme-machine 3 adaptée.In a step 11, a user annotates a multimedia document using the terminal 1 and the adapted man-machine interface 3.
Le document annoté est envoyé en 13 au serveur d'apprentissage 5. Le serveur d'apprentissage 5 lance alors, étape 15, l'exécution des moyens 7 de création automatique de modèle. Ceux-ci exécutent de façon itérative les étapes suivantes : • sélection, étape 17, de la section du document la plus représentative de l'ensemble et la plus éloignée des sections ayant déjà été éventuellement sélectionnées. Par section éloignée, ou proche, d'une autre section, il faut entendre une distance au sens mathématique du terme définie dans une métrique des sections. Ainsi, une section proche est une section qui comporte pratiquement les mêmes caractéristiques ou des caractéristiques très similaires d'autres sections.The annotated document is sent at 13 to the learning server 5. The learning server 5 then starts, step 15, the execution of the means 7 of automatic model creation. These perform iteratively the following steps: • selection, step 17, of the section of the most representative document of the set and the furthest away from the sections that have already been possibly selected. By distant section, or near, another section, is meant a distance in the mathematical sense of the term defined in a section metric. Thus, a close section is a section that has substantially the same characteristics or very similar characteristics of other sections.
• ajustement, étape 19, des pondérations associées aux différentes sections sélectionnées, • suppression, étape 21 , éventuelle des sections les moins représentatives de l'ensemble des documents ou des sections les plus proches des sections sélectionnées.Adjustment, in step 19, of the weightings associated with the various selected sections, deletion, step 21, of the least representative sections of all the documents or sections closest to the selected sections.
Ces trois étapes 17, 19 et 21 de sélection, ajustement et suppression sont itérées jusqu'à obtenir un modèle satisfaisant, ce qui correspond, par exemple, à une minimisation d'une fonction de coût comme expliqué ci- dessous.These three steps 17, 19 and 21 of selection, adjustment and deletion are iterated until a satisfactory model is obtained, which corresponds, for example, to a minimization of a cost function as explained below.
Le modèle étant créé, un nouveau document est annoté, étape 23, automatiquement soit à la demande de l'utilisateur, soit dans le cadre d'un traitement par lots. A l'étape 25, le document annoté automatiquement est envoyé sur le terminal 1 pour que l'utilisateur puisse étudier, et éventuellement modifier, à l'étape 27, les annotations proposées par le système.With the template created, a new document is annotated, step 23, automatically either at the request of the user or as part of a batch process. In step 25, the automatically annotated document is sent to the terminal 1 so that the user can study, and possibly modify, in step 27, the annotations proposed by the system.
En particulier dans le cas où l'utilisateur modifie les annotations, l'étape 15 de lancement de la création de modèle est de nouveau exécutée en intégrant dans les données d'entrée de cette création le nouveau document avec ses annotations modifiées par l'utilisateur.In particular, in the case where the user modifies the annotations, the step 15 of launching the model creation is again executed by integrating into the input data of this creation the new document with its annotations modified by the user. .
Ainsi, par itérations successives alternant étape automatique de création de modèle, application du modèle sur un nouveau document et correction des annotations proposées par le modèle, le modèle est raffiné pour atteindre un niveau de qualité tel qu'aucune intervention de l'utilisateur n'est plus nécessaire.Thus, by successive iterations alternating automatic step of model creation, application of the model on a new document and correction of the annotations proposed by the model, the model is refined to reach a level of quality such that no user intervention is necessary. is no longer necessary.
Un algorithme de création de modèle, ou d'apprentissage, particulièrement bien adapté au système d'annotation décrit ci-dessus va maintenant être décrit.A template creation or learning algorithm particularly well suited to the annotation system described above will now be described.
Mathématiquement, on considère un modèle comme exprimant la loi conditionnelle d'un graphe d'étiquettes Y (les annotations) en fonction d'un graphe d'observation X (les caractéristiques des documents multimédia).Mathematically, we consider a model as expressing the conditional law of a label graph Y (annotations) as a function of an observation graph X (the characteristics of multimedia documents).
Cette loi conditionnelle s'exprime comme le produit de familles exponentielles faisant intervenir des noyaux ou distances entre graphes, soit :This conditional law is expressed as the product of exponential families involving nuclei or distances between graphs, namely:
Figure imgf000010_0001
Figure imgf000010_0001
La création du modèle consiste alors à minimiser la log vraisemblance d'un échantillon tout en limitant le nombre de noyaux à utiliser.The creation of the model then consists in minimizing the log likelihood of a sample while limiting the number of cores to use.
Cette log vraisemblance, qui apparaît comme une fonction de coût, s'écrit :This log likelihood, which appears as a cost function, is written:
#κty.x i
Figure imgf000010_0002
# κty.xi
Figure imgf000010_0002
La sélection des noyaux et le réglage des pondérations α, se fait selon l'algorithme itératif ci-dessous. Les noyaux sélectionnés sont alors ceux qui minimisent le gradient : A- - 1 T λ £ (XjK(X j.xk )δ(yj.yk ) + ]T K(x, .xk ) (f\)(yk\x,) - δ(y, .yk))The selection of the nuclei and the adjustment of the weights α, is done according to the iterative algorithm below. The selected nuclei are then those that minimize the gradient: A- - 1 T λ £ (Xjk (X jx k) δ (k yj.y) +] TK (x, .x k) (f \) (y k \ x) - δ (y, .y k ))
L'algorithme itératif de sélection des noyaux et de réglage des pondérations s'exprime en pseudo-langage :The iterative algorithm of selection of the kernels and adjustment of the weights is expressed in pseudo-language:
• générer l'ensemble des noyaux possibles sur l'ensemble des documents annotés,• generate all the possible kernels on all the annotated documents,
• initialiser l'ensemble A des noyaux actifs à vide,• initialize set A active cores empty,
• tant que le coût C continue à diminuer faire : o sélectionner R noyaux aléatoirement parmi les M noyaux existants, R pouvant être égale à M ce qui correspond à la sélection de l'ensemble des noyaux, o calculer le gradient au point αι = 0 de chacun des R da, noyaux sélectionnés, o ajouter le ou les noyaux dont le gradient est• as long as the cost C continues to decrease: o select R nuclei randomly among the M existing nuclei, R can be equal to M which corresponds to the selection of all the nuclei, o calculate the gradient at the point αι = 0 of each of the R da, selected nuclei, o add the nuclei whose gradient is
Oa1 maximum à l'ensemble des noyaux actifs A, o tant que les pondérations at des noyaux de l'ensemble des noyaux actifs A continuent à évoluer faireOa 1 up to all active nuclei A, o as the weights has been the nuclei of all active nuclei A continue to evolve
• calculer le coût C et les gradients , dat • calculate the cost C and the gradients, da t
• recalculer les valeurs des pondérations ai pour h € [A] par une méthode de descente de gradient, telle que, par exemple, la méthode de quasi- newton, o fin tant que• recalculate the values of the ai weights for h € [A] by a gradient descent method, such as, for example, the quasi- newton method, o as long as
• fin tant que• end as long as
II est à noter que les noyaux correspondent aux sections de documents annotés et constituent donc le modèle d'annotation.It should be noted that the kernels correspond to the sections of annotated documents and thus constitute the annotation model.
L'invention a été illustrée et décrite en détail dans les dessins et la description précédente. Celle-ci doit être considérée comme illustrative et donnée à titre d'exemple et non comme limitant l'invention à cette seule description. De nombreuses variantes de réalisation sont possibles. Par exemple, la répartition entre terminal et serveur d'apprentissage peut correspondre en fait à une répartition fonctionnelle, toutes les fonctions du système se réalisant sur une station de travail programmée en conséquence. On comprend également qu'un mode de réalisation correspond à une implémentation logicielle du procédé d'annotation et qu'ainsi un produit programme d'ordinateur comprend des instructions telles que, exécutées sur un ordinateur, le procédé d'annotation est mis en œuvre.The invention has been illustrated and described in detail in the drawings and the foregoing description. This must be considered as illustrative and given by way of example and not as limiting the invention to this description alone. Many alternative embodiments are possible. For example, the distribution between terminal and learning server may actually correspond to a functional distribution, all the functions of the system being realized on a workstation programmed accordingly. It is also understood that an embodiment corresponds to a software implementation of the annotation method and that thus a computer program product includes instructions such as, executed on a computer, the annotation method is implemented.
Cependant, il peut apparaître que pour des raisons techniques, telles que, par exemple, une recherche de rapidité d'exécution, le procédé peut également être mis en œuvre sous forme matérielle, par exemple, par programmation d'un réseau de portes de type FPGA ( réseau de portes programmable par l'utilisateur) ou sous une forme combinée matérielle- logicielle selon les règles de conception bien connues de l'homme du métier. Dans les revendications, le mot « comprenant » n'exclue pas d'autres éléments et l'article indéfini « un/une » n'exclut pas une pluralité. However, it may appear that for technical reasons, such as, for example, a search for speed of execution, the method can also be implemented in hardware form, for example, by programming a network of doors of type FPGA (user programmable gate array) or in a combined hardware-software form according to design rules well known to those skilled in the art. In the claims, the word "comprising" does not exclude other elements and the indefinite article "a" does not exclude a plurality.

Claims

REVENDICATIONS , Procédé d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comportant les étapes de :CLAIMS, Method for annotating a plurality of multimedia documents, each multimedia document comprising at least one section, and each section comprising at least one characteristic, comprising the steps of:
• annotation manuelle (11) d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation,Manual annotation (11) of at least one of the plurality of documents by assigning to each section of said document at least one annotation class,
• création automatique (15) d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, ladite création automatique étant réalisée par un apprentissage itératif basé sur la sélection de sections pertinentes,Automatic creation (15) of an annotation model defining relations between the annotation classes and the characteristics of the sections, said automatic creation being performed by iterative learning based on the selection of relevant sections,
• annotation automatique (23) d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation, caractérisé en ce que l'étape de création automatique (15) comporte les sous-étapes de :Automatic annotation (23) of a non-annotated document of the plurality of multimedia documents by application of the annotation model, characterized in that the automatic creation step (15) comprises the sub-steps of:
• sélection (17) de la section de document la plus représentative de l'ensemble des sections annotées et la plus éloignée des sections précédemment sélectionnées, • ajustement (19) de pondérations associées aux différentes sections,Selecting (17) the most representative document section of the set of annotated sections and the farthest from the previously selected sections; adjusting (19) weights associated with the different sections;
• suppression (21) des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées.• deleting (21) sections having weights less than a predetermined value or sections substantially identical to the selected sections.
Procédé selon la revendication 1 , caractérisé en ce qu'il comporte en outre une étape de validation manuelle (27) de l'annotation automatique, suivi d'une itération d'au moins l'étape de création automatique de modèle afin de remplacer le modèle d'annotation pour tenir compte des annotations validées, les étapes de création automatique, d'annotation automatique et de validation manuelle formant ainsi une boucle itérative d'amélioration du modèle d'annotation. A method according to claim 1, characterized in that it further comprises a step of manual validation (27) of the automatic annotation, followed by an iteration of at least the automatic model creation step in order to replace the annotation model to account for validated annotations, the steps of automatic creation, automatic annotation and manual validation thus forming an iterative loop for improving the annotation model.
3. Procédé selon la revendication 1 , caractérisé en ce qu'une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme le produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations.3. Method according to claim 1, characterized in that a relation between a graph representative of the annotation classes and a representative graph of the characteristics of the documents is defined as the product of exponential families based on the sections, and a cost function. is defined as the log likelihood of at least a portion of the sections so that automatic model creation consists of minimizing the cost function by selecting the most representative sections and adjusting the weights.
4. Procédé selon la revendication 3, caractérisé en ce que la minimisation du coût comporte les étapes itératives suivantes :4. Method according to claim 3, characterized in that the minimization of the cost comprises the following iterative steps:
• création d'un ensemble de sections actives initialisé à vide,• creation of a set of active sections initialized empty,
• itération tant que la fonction de coût diminue des sous-étapes :• iteration as long as the cost function decreases substeps:
• génération de l'ensemble des sections possibles sur les documents annotés,• generation of all possible sections on annotated documents,
• calcul, pour chaque section sélectionnée, d'un gradient de la fonction de coût pour une pondération nulle,Calculating, for each selected section, a gradient of the cost function for zero weighting,
• ajout à l'ensemble des sections actives, de la ou les sections dont le gradient est maximum, • itération tant que les pondérations des sections de l'ensemble des sections actives évoluent des sous-étapes : o calcul de la fonction de coût et des gradients associés, o calcul des pondérations des sections de l'ensemble des sections actives par une méthode de descente de gradient.• addition to the set of active sections, of the section or sections whose gradient is maximum, • iteration as long as the weightings of the sections of the set of active sections change substeps: o calculation of the cost function and associated gradients, o calculating the weights of the sections of the set of active sections by a gradient descent method.
5. Produit programme d'ordinateur comprenant des instructions de code de programme enregistrées sur un support lisible par un ordinateur, pour mettre en œuvre les étapes du procédé selon l'une quelconque des revendications 1 à 4 lorsque ledit programme fonctionne sur un ordinateur. A computer program product comprising program code instructions recorded on a computer readable medium, for carrying out the steps of the method according to any one of claims 1 to 4 when said program is running on a computer.
6. Système d'annotation d'une pluralité de documents multimédia, chaque document multimédia comportant au moins une section, et chaque section comportant au moins une caractéristique, comportant :An annotation system of a plurality of multimedia documents, each multimedia document having at least one section, and each section comprising at least one feature, comprising:
• des moyens (3) d'interface avec un utilisateur adaptés pour annoter manuellement d'au moins un document de la pluralité de documents par affectation à chaque section dudit document d'au moins une classe d'annotation,Means (3) for interfacing with a user adapted to manually annotate at least one of the plurality of documents by assigning each section of said document with at least one annotation class,
• des moyens (7) de création automatique d'un modèle d'annotation définissant des relations entre les classes d'annotation et les caractéristiques des sections, lesdits moyens de création automatique comportant des moyens d'apprentissage itératif basé sur la sélection de sections pertinentes,Means (7) for automatically creating an annotation model defining relations between the annotation classes and the characteristics of the sections, said automatic creation means comprising iterative learning means based on the selection of relevant sections ,
• des moyens (9) d'annotation automatique d'un document non annoté de la pluralité de documents multimédia par application du modèle d'annotation, caractérisé en ce que les moyens de création automatique comporte des moyens de :Means (9) for automatic annotation of a non-annotated document of the plurality of multimedia documents by application of the annotation model, characterized in that the automatic creation means comprises means for:
• sélection de la section de document la plus représentative de l'ensemble des sections existantes et la plus éloignée des sections précédemment sélectionnées,• selection of the document section most representative of all the existing sections and the farthest from the previously selected sections,
• ajustement de pondérations associées aux différentes sections,• adjustment of weights associated with the different sections,
• suppression des sections ayant des pondérations inférieures à une valeur prédéterminée ou des sections sensiblement identiques aux sections sélectionnées.• deleting sections with weights lower than a predetermined value or sections substantially identical to the selected sections.
7. Système selon la revendication 6, caractérisé en ce que les moyens d'interface sont adaptés en outre pour valider manuellement l'annotation automatique, et en ce que les moyens de création automatique de modèle sont adaptés pour tenir compte des annotations validées.7. System according to claim 6, characterized in that the interface means are further adapted to manually validate the automatic annotation, and in that the automatic model creation means are adapted to take into account validated annotations.
8. Système selon la revendication 6, caractérisé en qu'une relation entre un graphe représentatif des classes d'annotation et un graphe représentatif des caractéristiques des documents est définie comme Ie produit de familles exponentielles basées sur les sections, et une fonction de coût est définie comme la log vraisemblance d'au moins une partie des sections de telle sorte que la création automatique du modèle consiste à minimiser la fonction de coût par sélection des sections les plus représentatives et ajustement des pondérations. 8. System according to claim 6, characterized in that a relation between a graph representative of the annotation classes and a representative graph document characteristics is defined as the product of section-based exponential families, and a cost function is defined as the log likelihood of at least some of the sections so that automatic model creation consists of minimizing the function cost by selecting the most representative sections and adjusting the weights.
PCT/FR2008/051823 2007-10-10 2008-10-08 Method and system for annotating multimedia documents WO2009053613A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE112008002713T DE112008002713T8 (en) 2007-10-10 2008-10-08 Annotation and annotation system for multimedia documents
GB1007180A GB2466752A (en) 2007-10-10 2008-10-08 Method and system for annotating multimedia documents

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0707100 2007-10-10
FR0707100A FR2922338A1 (en) 2007-10-10 2007-10-10 METHOD AND SYSTEM FOR ANNOTATING MULTIMEDIA DOCUMENTS

Publications (1)

Publication Number Publication Date
WO2009053613A1 true WO2009053613A1 (en) 2009-04-30

Family

ID=39276102

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2008/051823 WO2009053613A1 (en) 2007-10-10 2008-10-08 Method and system for annotating multimedia documents

Country Status (4)

Country Link
DE (1) DE112008002713T8 (en)
FR (1) FR2922338A1 (en)
GB (1) GB2466752A (en)
WO (1) WO2009053613A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110880021A (en) * 2019-11-06 2020-03-13 创新奇智(北京)科技有限公司 Model-assisted data annotation system and annotation method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040205482A1 (en) * 2002-01-24 2004-10-14 International Business Machines Corporation Method and apparatus for active annotation of multimedia content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040205482A1 (en) * 2002-01-24 2004-10-14 International Business Machines Corporation Method and apparatus for active annotation of multimedia content

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DENOYER L ET AL ASSOCIATION FOR COMPUTING MACHINERY: "Structured Multimedia Document Classification", PROCEEDINGS OF THE 2003 ACM SYMPOSIUM ON DOCUMENT ENGINEERING. DOCENG 2003. GRENOBLE, FRANCE, NOV. 20 - 22, 2003, ACM SYMPOSIUM ON DOCUMENT ENGINEERING, NEW YORK, NY : ACM, US, 20 November 2003 (2003-11-20), pages 153 - 160, XP002382731, ISBN: 1-58113-724-9 *
GRILHERES B ET AL: "A Platform for Semantic Annotations and Ontology Population Using Conditional Random Fields", WEB INTELLIGENCE, 2005. PROCEEDINGS. THE 2005 IEEE/WIC/ACM INTERNATIONAL CONFERENCE ON COMPIEGNE, FRANCE 19-22 SEPT. 2005, PISCATAWAY, NJ, USA,IEEE, 19 September 2005 (2005-09-19), pages 790 - 793, XP010841825, ISBN: 0-7695-2415-X *
HANNA WALLACH: "Efficient Training of Conditional Random Fields", MASTER OF SCIENCE THESIS, 2002, University of Edinburgh, UK, XP002476899, Retrieved from the Internet <URL:http://citeseer.ist.psu.edu/wallach02efficient.html> [retrieved on 20080416] *
JOHN LAFFERTY, ANDREW MCCALLUM, FERNANDO PEREIRA: "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data", PROC. 18TH INTERNATIONAL CONF. ON MACHINE LEARNING, 28 June 2001 (2001-06-28) - 1 July 2001 (2001-07-01), Williamstown, MA, USA, XP002476900, Retrieved from the Internet <URL:http://citeseer.ist.psu.edu/lafferty01conditional.html> [retrieved on 20080416] *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110880021A (en) * 2019-11-06 2020-03-13 创新奇智(北京)科技有限公司 Model-assisted data annotation system and annotation method
CN110880021B (en) * 2019-11-06 2021-03-16 创新奇智(北京)科技有限公司 Model-assisted data annotation system and annotation method

Also Published As

Publication number Publication date
DE112008002713T8 (en) 2011-03-24
GB2466752A (en) 2010-07-07
FR2922338A1 (en) 2009-04-17
DE112008002713T5 (en) 2010-11-11
GB201007180D0 (en) 2010-06-09

Similar Documents

Publication Publication Date Title
US11263250B2 (en) Method and system for analyzing entities
US11562169B2 (en) Generating multimodal image edits
US11335004B2 (en) Generating refined segmentation masks based on uncertain pixels
FR2821186A1 (en) DEVICE FOR EXTRACTING INFORMATION FROM A KNOWLEDGE BASED TEXT
FR2698977A1 (en) Multimedia information system.
CN111950287A (en) Text-based entity identification method and related device
FR2914081A1 (en) METHOD FOR PROTECTING DIGITAL DOCUMENTS AGAINST UNAUTHORIZED USES
WO2007077378A1 (en) Assistance method and device for building the arborescence of an electronic document group
EP2996040A1 (en) A method for determining by optimization a multi-core architecture
WO2009053613A1 (en) Method and system for annotating multimedia documents
US9501684B1 (en) Providing non-destructive editing reconciliation
WO2021257195A1 (en) Topic graph-based comment generation
EP4073765A1 (en) Method and system for generating 3d digital models
FR2944633A1 (en) METHOD FOR ASSISTING THE DEVELOPMENT OR USE OF A COMPLEX SYSTEM.
CN112559680A (en) Text classification method, model and storage medium based on multi-level feature extraction
EP3924850A1 (en) Method for constructing behavioural software signatures
FR3022659A1 (en) RELATIVE COPY-GLUE METHOD
Samii et al. Iterative learning: Leveraging the computer as an on-demand expert artist
EP1713243A1 (en) Method and system of automatic generation of software components for the design of voice services
FR2986882A1 (en) METHOD FOR IDENTIFYING A SET OF PHRASES OF A DIGITAL DOCUMENT, METHOD FOR GENERATING A DIGITAL DOCUMENT, ASSOCIATED DEVICE
US20240069870A1 (en) Computer-based software development and product management
US20160371236A1 (en) Optimizing update operations in hierarchically structured documents
EP1435054A2 (en) Method for indexing and comparing multimedia documents
EP3114597A1 (en) Method for analysing a plurality of messages, and associated computer programme product and device
FR3132155A3 (en) Method for automatically selecting and displaying the selection of a significant digest in textual content

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08842467

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 1120080027137

Country of ref document: DE

ENP Entry into the national phase

Ref document number: 1007180

Country of ref document: GB

Kind code of ref document: A

Free format text: PCT FILING DATE = 20081008

WWE Wipo information: entry into national phase

Ref document number: 1007180.1

Country of ref document: GB

122 Ep: pct application non-entry in european phase

Ref document number: 08842467

Country of ref document: EP

Kind code of ref document: A1

RET De translation (de og part 6b)

Ref document number: 112008002713

Country of ref document: DE

Date of ref document: 20101111

Kind code of ref document: P