CN1282928A - 提供本国语言查询服务的方法和系统 - Google Patents

提供本国语言查询服务的方法和系统 Download PDF

Info

Publication number
CN1282928A
CN1282928A CN99110540A CN99110540A CN1282928A CN 1282928 A CN1282928 A CN 1282928A CN 99110540 A CN99110540 A CN 99110540A CN 99110540 A CN99110540 A CN 99110540A CN 1282928 A CN1282928 A CN 1282928A
Authority
CN
China
Prior art keywords
url
query
search engine
inquiry word
prefix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99110540A
Other languages
English (en)
Other versions
CN1176432C (zh
Inventor
潘越
杨力平
林顿·罗宾逊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CNB991105400A priority Critical patent/CN1176432C/zh
Priority to TW088114553A priority patent/TW429354B/zh
Priority to EP00305822A priority patent/EP1072984A3/en
Priority to KR10-2000-0040799A priority patent/KR100413309B1/ko
Priority to JP2000225285A priority patent/JP3548098B2/ja
Priority to US09/627,372 priority patent/US7058626B1/en
Publication of CN1282928A publication Critical patent/CN1282928A/zh
Application granted granted Critical
Publication of CN1176432C publication Critical patent/CN1176432C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Abstract

本发明提供一种为因特网用户提供本国语言查询服务的方法,其中利用了多个搜索引擎,包括以下步骤:(a)在一个站点接收用户的原始查询请求,其中含有用户的本国语言查询字;(b)选择一个适用的搜索引擎;(c)将本国语言查询字翻译为搜索引擎的专用语言查询字;(d)构造针对于该搜索引擎的新查询请求;(e)发送新查询请求并且接收返回的查询结果;(f)将查询结果作为与原始查询请求相关的查询结果返回给用户。

Description

提供本国语言查询服务的方法和系统
本发明涉及信息检索方法和系统,尤其涉及为因特网用户或数据库用户提供查询服务的方法和系统,并且更具体地涉及为因特网用户或数据库用户提供本国语言查询服务的方法和系统
诸如远程网络这样的计算机化的信息源的发展允许数据处理系统的用户与其他服务器和网络连接,并从而检索以前在电子介质中不能获得的大量电子信息。这种电子信息正在越来越多地代替象报纸、杂志甚至是电视这样的传统信息传送媒介。
在通信中,能够彼此区别开的计算机网络通过“网关”结合在一起,网关处理从发送网络到接收网络的数据传输以及报文转换。网关是用来连接不同的网络(即,使用不同通信协议的网络)的装置,使得电子信息能够从一个网络传送到另一个网络。网关传输电子信息,把这种信息转换为与第二个网络使用的协议兼容的形式以便于传输和传递。
近年来通常使用的一种远程网络是因特网。因特网是全球最大的、开放的、由众多网络相互连接而成的计算机网络。它是由美国阿帕网(ARPAnet)发展而成的。主要采用TCP/IP协议。TCP/IP是“传输控制协议/互联网协议”的首字母缩略语,是美国国防部开发的用于计算机之间通信的软件协议。可以将因特网描述为由执行允许用户交互共享网络信息的联网协议的计算机互连而成的地理上分布的远程计算机网络系统。因为这种广泛使用的信息共享,诸如因特网这种远程网络已经非常全面地发展为“开放”系统。对于该系统,开发者能够基本上没有限制地设计软件应用程序以便执行特定的操作或者服务。对于有关因特网的节点、对象和链接的细节,可参见教科书《通晓因特网-Mastering the Internet》,作者为G.H.Cady等人,该书于1996年由美国加利弗尼亚州Alameda市的Sybex公司出版。
在数据处理网络之间传输的电子信息通常是以超文本方式提供的。超文本是一种用复杂的非顺序关联网将文本、图象、声音和动作链接在一起的信息表示方法,它允许用户通过相关的标题进行“浏览”或“漫游”。术语“超文本”是十九世纪六十年代创造的,用于描述由计算机提供的文件,展现了与书籍、胶片和语言的线性格式不同的非线性结构。
另一方面,最近引入的术语“超媒体”几乎与“超文本”是同义词,但是侧重于诸如动画、记录的声音和视频等超文本的非文本成分。通过超媒体,将图象、声音、视频或它们的任意组合综合成信息存储和检索的综合系统。超媒体以及超文本,特别是按可由用户控制选择的交互格式,围绕着提供与人类思维平行的工作和学习环境的想法被构成。这就是说,允许用户在标题之间而不是象字母表那样顺序地从一个到下一个的运动之间建立相关性。超媒体以及超文本以这样的方式被链接,即它允许用户在搜索信息期间从一个主题跳到另一个相关的主题。超链接信息包含在超媒体和超文本文件中,这些文件允许用户只要“点击”(即,使用鼠标或其他指点装置)超链接的标题就能够获得文件或访问站点。
万维网(WWW),或简称为“Web”,是因特网的多媒体信息检索系统。它是因特网环境下最常用的传送数据的方法。其他方法还包括FTP(文件传送协议)和Gopher等等,但未达到Web所具有的普通性。在Web环境中,客户机利用超文本传输协议(HTTP)实现对Web服务器的事务处理,其中HTTP是众所周知的应用程序协议,该协议允许用户利用称为超文本标记语言(HTML)的标准页面描述语言访问各种文件(如文本、图形、图象、声音、视频等文件)。HTML提供基础文件格式,并且允许开发者规定与其他服务器及文件的链接。在因特网应用中,利用统一资源定位符(URL)规定至某服务器的网络路径,URL具有定义网络连接的专用语法。
URL典型地为这样的格式:http://somehost/somedirectory?parameters…,其中“somehost”是该URL的宿主名位置,“somedirectory”是可以找到该Web网页的目录。把URL分解成为一个Web服务器的实际IP地址的常用方式是通过一个域名服务器。在互联网或内联网中,域名服务器把URL中的宿主名变换成实际的网址。域名服务器的一个例子是目前在因特网中实现的域名服务(DNS)。Web用户从域名服务器请求宿主名和地址的过程有时称为解析。在TCP/IP中,域名服务器把宿主名解析成一个或多个IP地址的列表,这些IP地址回送给HTTP请求上的Web客户。每个IP地址规定一个服务器,该服务器用来处理由浏览器发出的请求内容。
采用超文本协议的万维网遵循客户/服务器结构。万维网服务的客户端采用浏览器程序,可向万维网服务器发送各种请求,并且对服务器返回的由HTML语言定义的超文本信息和各种多媒体数据格式进行解释、显示和播放。
随着成千上万的公司、大学、政府机关、博物馆及市政当局发布“主页”,因特网已经成为非常宝贵的信息资源。即使一个新用户,只要很少的练习,也能够浏览成百万个Web网页或成千个新闻组。因特网访问和相关的应用市场正在迅速扩展。
因此,可以说万维网提供了一个“信息海洋”。在这个“信息海洋”中,信息是以超文本网页的形式组织的。网页数量如此之多,以致于根本不可能逐个站点、逐条链接地检索。如何在万维网中有效地、快速地和方便地检索到所感兴趣的信息,对用户来说是十分重要的。
目前有多种信息检索工具。一种信息检索工具是目录服务。在目录服务中,将站点/网页按类进行划分,每类又进一步划分为更小的子类。对这些类和子类按层次结构组织起来,并且以网页的形式显示各类或子类。在这些网页中,含有指向子类的链接。通过一层一层地检索,用户最终可以发现一组相关的站点/网页。随着站点/网页数量的迅猛增长,目录的规模也变得非常巨大。例如,Yahoo!目前已有25000个类,可检索到的站点超过50万。
另一种信息检索工具是搜索引擎。在搜索引擎中,利用关键词对站点/网页进行索引,用户只要输入查询字(即,搜索引擎所能接受的某些关键词),即可通过搜索引擎检索到相关的站点/网页。因此,多数用户更趋向于使用搜索引擎,而不使用目录服务。另外,也可以对目录条目进行索引,从而利用搜索引擎进行检索。例如,在Yahoo!中,搜索结果既包括站点,也包括目录条目。
象因特网搜索引擎这样的免费或廉价的计算机应用软件使得人们容易查询到站点,从这些站点获得有关标题信息。当用户在因特网中冲浪时,目录服务和搜索引擎为用户提供了很大的帮助。因此,目录服务和搜索引擎往往被称为“入门站点”。著名的目录服务/搜索引擎包括Yahoo!、AltaVista、Exite等等。另外,新浪网(www.sina.com.cn)是一个非常著名的中文入门站点。然而,大多数网页都是用英文编写的,对网页分类和索引也使用英文。如果用户不懂英文,则他/她们便不能享受目录服务/搜索引擎所提供的便利。
为了解决这种问题,目前已开发了多种网页翻译软件,这些软件能够将网页从一种语言静态地或动态地翻译成用户的本国语言,例如可以将英文编写的网页翻译成中文,或者将德文编写的网页翻译成英文,等等。其中一些网页翻译软件在对网页进行翻译的同时,保留了网页中的HTML标记结构,从而用户可以毫无困难地阅读并点击以其本国语言标记的链接。另外,由于分类名称也可被翻译成用户的本国语言,所以用户能够利用其本国语言方便地使用目录服务。
然而,这种网页翻译软件不能解决因特网用户利用其本国语言进行检索和查询的问题。原因在于,这些网页翻译软件不能将用户查询命令中的用户本国语言查询字翻译成搜索引擎可接受的语言查询字。
为了解决因特网用户利用其本国语言进行检索和查询的问题,已经开发了几种查询翻译原型或解决方案。这些原型或方案向用户提供预定的表格,收集用户输入,然后将用户输入翻译成搜索引擎可接受的语言,构造查询命令,发往特定的搜索引擎。但是,这些原型或方案具有如下所述的缺点。
第一,丧失了许多因特网搜索引擎所支持的组合查询和/或二次查询功能。这些组合查询和/或二次查询功能的目的是缩小检索范围。在组合查询的情况下,被匹配为检索条件的字串在逻辑上与其他检索条件比如待检索的类或出版日期组合在一起。在二次查询的情况下,第二次查询只在第一次查询返回的结果中进行。
第二,不能适当地处理多义字带来的问题。当将一种语言的某个文字翻译成另一种语言的文字时,常常有多种译文。前述查询翻译原型或方案不能适当处理这种多译文的情形。另外,当对各种语言尤其是中文中的多义字进行翻译时,这一问题就更复杂了。这里多义字是指具有多种含义的文字。例如,汉字“腔”(其拼音为qiangl)具有四种含义,而每种含义又对应几个英文单词。第一种含义的“腔”可被翻译成英文“cavity”和“chamber”。第二种含义的“腔”可被翻译成英文“speech”。第三种含义的“腔”可被翻译成英文“tune”和“pitch”。第四种含义的“腔”可被翻译成英文“accent”和“tone”。汉语中有许多这样的多义字。目前的查询翻译软件
本发明旨在解决以上现有技术中存在的诸多问题。
因此,本发明的第一个目的在于提供一种为因特网用户提供本国语言查询服务的方法。
本发明的第二个目的在于提供一种为因特网用户提供本国语言查询服务的系统。
本发明的第三个目的在于提供一种为数据库用户提供本国语言查询服务的系统。
为实现上述第一个目的,本发明提供一种为因特网用户提供本国语言查询服务的方法,该方法中利用了因特网中的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述方法的特征在于包括以下步骤:
(a)在一个站点接收所述因特网用户的原始查询请求,所述原始查询请求中含有所述用户的本国语言查询字;
(b)从所述多个搜索引擎中选择一个适用的搜索引擎;
(c)将所述本国语言查询字翻译为所选择的搜索引擎的专用语言查询字;
(d)根据所述原始查询请求和所述专用语言查询字构造针对于所选择的搜索引擎的新查询请求;
(e)向所选择的搜索引擎发送所述新查询请求并且接收返回的查询结果;
(f)将所述查询结果作为与所述原始查询请求相关的查询结果返回给所述用户。
本发明还提供一种为因特网用户提供本国语言查询服务的方法,该方法中利用了因特网中的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述方法的特征在于包括以下步骤:
(a)在一个站点接收所述因特网用户的原始查询请求,所述原始查询请求中含有用户所请求的URL,所述URL带有一个用于限定所述站点的前缀;
(b)去除所述URL的前缀;
(c)从所述多个搜索引擎中选择一个适用的搜索引擎;
(d)如果所去除的前缀为重定向前缀,则执行以下步骤:
(d1)向所选择的搜索引擎发送含有所述URL的请求并且接收作为响应的网页;
(d2)在所述网页中,在需要输入查询字的URL之前增加翻译前缀,在其他URL之前增加重定向前缀,从而构成一个新网页;(e)如果所去除的前缀为翻译前缀,则执行以下步骤:
(e1)将所述URL的参数中的用户本国语言查询字翻译为所选择的搜索引擎的专用语言查询字;
(e2)用所述专用语言查询字替换所述URL的参数中的用户本国语言查询字;
(e3)在所述URL之前增加重定向前缀;
(e4)生成一个新网页,在所述网页中嵌入所述URL以及一段Script程序,所述Script程序用于使收到所述新网页的客户执行以下步骤:根据所述网页中嵌入的所述URL自动发出另一原始查询请求;
(f)将所述新网页作为与所述原始查询请求相关的查询结果返回给所述用户。
为实现上述第二个目的,本发明提供一种为因特网用户提供本国语言查询服务的系统,包括因特网中的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述系统的特征在于还包括一个查询翻译服务器,所述查询翻译服务器包括:
客户接口,用于接收客户发送的查询请求,并且向客户返回查询结果;
请求分配装置,用于从所述客户接口接收所述查询请求,去除所请求的URL的前缀,并且根据所去除的前缀,将所述查询请求分配到不同的部件;
网页获取装置,用于从所述请求分配装置接收前缀为重定向前缀的查询请求,向URL指定的搜索引擎发送查询请求并且获取URL所请求的网页;
网页修改装置,在所获取的网页中,在需要查询字的URL之前加翻译前缀,在其他URL之前加重定向前缀,从而形成新网页,并且将所述新网页送到所述客户接口;
查询翻译装置,用于从所述请求分配装置接收前缀为翻译前缀的查询请求,将所请求的URL中的用户本国语言查询字翻译并替换为搜索引擎的专用语言查询字,并且在URL之前加重定向前缀;
网页生成装置,用于生成一个新网页,在网页中嵌入URL以及一段Script程序,该段程序使收到该网页的客户根据所嵌入的URL自动发出另一查询请求,并且将所述新网页送到所述客户接口。
为实现上述第三个目的,本发明提供一种为数据库用户提供本国语言查询服务的系统,包括多个数据库,每个数据库具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述系统的特征在于还包括一个查询翻译服务器,所述查询翻译服务器包括:
客户接口,用于接收客户发送的查询请求,并且向客户返回查询结果;
查询翻译装置,用于将所述客户接口收到的查询请求中的用户本国语言查询字翻译并替换为数据库的专用语言查询字;
查询结果获取装置,用于向所述查询请求指定的数据库发送已翻译的查询请求并且获取查询结果。
利用本发明的方法和系统,用户只要选择了因特网中的一种搜索引擎,就能够借助于该搜索引擎所提供的内置的复杂查询功能,以其本国语言进行检索,而不必考虑该搜索引擎实际使用的语言。所以为各国的用户使用本国语言在因特网中检索和查询提供了极大的方便。
一些搜索引擎可能向用户提供了内置的复杂查询功能,例如包括组合查询、二次查询、限制查询等等。利用本发明的方法和系统,可以充分保留上述的复杂查询功能。
根据本发明的方法和系统,还能够进行专用于站点的翻译,并能够区别多义词的不同含义,进行多义词的翻译。
上述功能的实现,无需对浏览器等客户软件进行改动,也无需对搜索引擎进行修改。因此,本发明的方法和系统便于使用和推广。
通过结合附图对本发明较佳实施方式的详细描述,本发明的上述特征和优点将会更加明显。其中
图1是现有技术中普通采用的客户/服务器结构;
图2示出可根据本发明的最佳实施方式实现的计算机网络;
图3是本发明最佳实施方式中采用的客户/经纪服务器/服务器结构;
图4是在一个站点执行的本发明的第一种为因特网用户提供本国语言查询服务的方法的流程图;
图5是在一个站点执行的本发明的第二种为因特网用户提供本国语言查询服务的方法的流程图;
图6是本发明的为因特网用户提供本国语言查询服务的系统的示意框图;
图7至图10是利用本发明方法和系统进行中文查询时的浏览器显示举例。
图1是现有技术中普遍采用的客户/服务器结构。客户请求(比如查询请求、新闻请求等)91由客户92发送到服务器88。服务器88可以是在因特网或者其他通信网络上能够访问的远程计算机系统。例如,可以在用户的个人计算机(未示出)中运行客户92,而在服务器88上设置因特网搜索引擎。
服务器88根据客户请求,扫描和搜索原始(比如未压缩的)信息(比如在线新闻或新闻组),将过滤的电子信息作为服务器响应93提供给客户92。
客户92可以在第一计算机中活动,服务器过程可以在第二计算机系统中活动,经过通信媒体相互通信,从而提供分布式功能并允许多个客户利用服务器的信息收集能力。
在万维网的环境下,为了检索信息,通常在客户机中运行与HTML兼容的浏览器。当浏览器的用户通过URL规定一条链路时,客户机对域名服务器发出请求,以便把URL中的主机名变换成服务器所处的特定网络IP地址。域名服务器回送一个或多个IP地址的清单,以应答该请求。利用这些IP地址中的一个,浏览器建立对某服务器的连接。若该服务器可用,其回送根据HTML格式化的文档或其他对象。服务器内运行相应的服务器软件,该软件把信息以HTTP响应的形式提供给客户机。HTTP响应对应于由HTML语言构成的Web页,或者其他服务器产生的数据。Web浏览器已经成为用于访问许多网络及服务器的主要接口。
例如,当用户利用搜索引擎进行信息检索时,首先在他/她的个人计算机上运行某种浏览器软件。然后指定一个搜索引擎的URL。比如,为了使用Yahoo!进行搜索,用户输入Yahoo!站点的URL,即“http://www.yahoo.com”。Yahoo!服务器向浏览器返回主页。该主页是用上述HTML语言编写的,浏览器以HTML标记规定的方式显示主页内容。用户可以用指点装置点出所显示的主页中的超文本或输入查询字,以进行检索或查询。
这里所述的浏览器可以是市场上可获得的任何浏览器。例如,可以是网景公司的Navigator、Communicator、微软公司的IE,从伊利诺伊州Urbana-Champaign市的国家超计算应用中心(NCSA)获得的Mosaic牌浏览器,或是Lynx牌浏览器。任何其他的可提供HTTP所规定的功能的浏览器都可以使用。通常Web浏览器是一种能够对HTML文档进行语法分析并且显示的程序,尽管熟练的技术人员会赞同将来的浏览器能够使用诸如动态HTML及XML的其他标记语言。
典型的服务器包括一台IBM RISC/6000计算机(基于所谓的RISC工作站的精简指令集),运行AIX(先进交互式执行程序版本4.1或更高)操作系统和服务器程序。通常利用拨号计算机网络,服务器从客户机接收请求,以便获得客户所请求的文件或对象,或者执行所请求的任务。在IBM公司的许多出版物中说明了基于RISC的计算机的各种型号,如《RS/6000、7013和7016 POWERstation和POWERserver硬件技术参考手册》(定购号SA23-2644-00)。在IBM公司1985年11月出版《AIX操作系统技术参考手册》第一版以及其他出版物中说明了AIX操作系统。尽管以上所述是实际可用的,但是也可以采用任何其他适宜的硬件/操作系统/服务器组合。比如,采用微软公司的Windows95/98/NT操作系统的服务器结构等。
图2示出现有技术的计算机网络80。计算机网络80代表因特网,可以描述为根据这里所述的客户/服务器体系的公知计算机网络。当然,本领域内熟练的技术人员应认识到因特网不仅仅是根据本发明最佳实施方式采用的分布式计算机网络。也可以采用其他分布式计算机网络来实现计算机网络80,比如本领域内公知的所谓“内联网”。
理论上,因特网是包括服务器88的一个大网络,这些服务器可由客户机,一般是个人计算机的用户,通过某些专用因特网接入提供商84(比如Internet America)或者在线服务提供商(比如AmericaOn-Line、Prodigy、Compuserve等等)来访问。每个客户机上可以运行浏览器(一个客户)以经过接入提供商访问服务器88。每个服务器88操作所谓的“Web站点”。在本发明中,Web站点可以是一个提供目录服务的站点,也可以是一个提供搜索引擎的站点,还可以在其上执行本发明的为因特网用户提供本国语言查询服务的方法,从而与因特网中的多个搜索引擎一起构成为因特网用户提供本国语言查询服务的系统。
由于本发明涉及网络传输,故对网络及其操作原理的理解会是有帮助的。在这里并不过分深入地描述本发明适用的网络的细节。例如,本发明可用于象因特网这样的全球性网络。
在图1所示的客户/服务器结构的基础上,本发明人提出一种基于因特网的客户/经纪服务器/服务器结构,如图3所示。实际上,在客户92与经纪服务器200以及在经纪服务器200与服务器88之间也遵从前述客户/服务器结构。在图3所示的结构中,客户首先向经纪服务器200发送请求91。经纪服务器200对收到的客户请求91进行必要处理,将处理后的请求发送到服务器88。服务器88收到请求后提供相应服务,向经纪服务器200返回响应93。经纪服务器200收到响应93后,对响应做必要处理然后返回给客户92。
执行本发明的方法的站点起到经纪服务器200的作用。客户92可以是现有技术中的各种浏览器,服务器88可以是现有技术中的各种提供搜索引擎的站点。
目前,每个搜索引擎都具有一种专用语言。一个搜索引擎只能接受用其专用语言表述的查询字。例如,Yahoo!只能接受用英语表述的查询字,所以Yahoo!的专用语言是英文。另一个例子是,新浪网(www.sina.com.cn)搜索引擎的专用语言是中文。用户的本国语言可以是与搜索引擎的专用语言相同或不同的任何语言。
图4是在一个站点执行的本发明的第一种为因特网用户提供本国语言查询服务的方法的流程图。该方法中,利用了因特网中的现有的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有各自专用语言查询字的查询请求并且返回与查询字相关的查询结果。
步骤401,在一个站点接收一个因特网用户的原始查询请求,该原始查询请求中含有用户本国语言查询字。步骤402,根据原始查询请求,从多个搜索引擎中选择一个适用的搜索引擎。步骤403,将本国语言查询字翻译为所选择的搜索引擎的专用语言查询字。步骤404,根据原始查询请求和专用语言查询字构造针对于所选择的搜索引擎的新查询请求。步骤405,向所选择的搜索引擎发送新查询请求并且接收返回的查询结果。步骤406,将收到的查询结果作为与原始查询请求相关的查询结果返回给用户。
可以用Java语言编写实现图4所示查询翻译方法的软件,在多种操作系统环境下运行,包括前述AIX、Windows95/98/NT等。由于这样的程序代码符合Sevlet API标准,所以可以移嵌到许多网站中与其他Web服务器一起运行。当然,也可以在图2所示的网络中设置一个新站点,专门执行图4所示的为因特网用户提供本国语言查询服务的方法。这种情况下,可以将这个新设的站点称为查询翻译服务器。
以下说明图4中各步骤的实现方式。
图4中步骤401的实现可以有多种方式。
一种最简单的方式是,使本发明的查询翻译服务器作为一个代理服务器运行。这种方式要求用户对其客户软件的网络配置进行修改,使得该客户软件发出的所有查询请求都发往本发明的查询翻译服务器。这种方式不但对于用户来说是不方便的,并且加重了查询翻译服务器和计算机网络的负担,因为某些不必翻译的文件(比如图象和声音文件)不得不经过查询翻译服务器。
另外一种方式是采用URL变换。在这种方式中,每次在客户发出查询请求时,自动地在所请求的URL之前冠以一个前缀,该前缀例如包括本发明的查询翻译服务器在因特网中的域名和路径名。从而,客户的所有查询请求都自动地转到本发明的查询翻译服务器。
特别是,如果利用后文所述的独特的URL变换方法,则不需对客户软件做任何改变,从而极大地方便了用户。另一处改进在于,为了减轻查询翻译服务器和计算机网络的负担,对不同类别的URL冠以不同的前缀。为了说明这点,首先分析客户发送的查询请求。查询请求一般包括两种。一种查询请求中含有查询字,如果这种查询字使用的语言不同于搜索引擎的专用语言,则需要首先将用户查询请求中的这种不同于专用语言的语言(如用户的本国语言)的查询字翻译为专用语言查询字,然后才能将查询请求发往搜索引擎。另一种查询请求中不含有查询字,这类请求不需要翻译,可以由本发明的查询翻译服务器直接重定向到相应的搜索引擎。因此,对这两种查询请求需要做不同的处理。在本发明中,对两种查询请求的URL冠以不同的前缀,即翻译前缀和重定向前缀,从而在本发明的查询翻译服务器中受到不同的处理。
为了不对客户软件做任何变动,前述冠以前缀的过程是在查询翻译服务器中实现的。简单地说,查询翻译服务器最初获取搜索引擎的主页,在主页中所含的URL之前增加相应的前缀(即查询翻译服务器的URL),然后将如此修改后的主页返回给客户。在用户随后的查询中,对搜索引擎每次返回的网页都进行类似的URL变换。
以上简述了图4中的步骤401的实现方法。
图4中的步骤402和403例如可以利用本发明所提供的多个预定的搜索引擎模板实现。这些搜索引擎模板可以以各种可供查找的方式(如文件或数据库)存储在查询翻译服务器的存储器或磁盘中。多个预定搜索引擎模板中存储了查询翻译服务器所支持的所有因特网搜索引擎的必要信息,以便于在步骤402和403中使用。
例如,可以在模板文件中存储以下搜索引擎模板:
yahoo=\
    url=http://search.yahoo.com/bin/search,\
    parameterName=p,\
    language=English,\
    assemblerClass=Generic,\
    dictionaryContext=
ibm=\
    url=http://WWW.ibm.com:8080/db2search/,\
    parameterName=q;s,\
    language=English,\
    assemblerClass=Generic,\
    dictionaryContext=ibm
该例中,前两个模板分别是Yahoo!和IBM的搜索引擎模板。
如上所示,每个搜索引擎模板中定义了该搜索引擎使用的搜索处理程序的URL、查询命令中需要翻译的参数表、可接受查询字的专用语言、查询字组合规则和适用于专门站点的字典上下文。查询字组合规则用于限定查询字之间的组合或连接关系,例如根据不同的搜索引擎,查询字之间可以用象“+”、“-”、“AND”、“OR”或“NOT”这样的约束符连接。专门站点的字典上下文,用于限定在专门站点内查询时为了翻译查询字所应使用的特定字典。
在此需要说明的是,对模板的利用不是唯一的方式。为了能够获得因特网搜索引擎的以上必要信息,当然可以采用任何其他方式。这些都属于本领域内普通技术人员的常识,不构成对本发明的限制。
假设在步骤401中接收到对于Yahoo!站点的原始查询请求。该查询请求中例如包括以下URL:
http://search.yahoo.com/bin/search?p=游戏&y=66
在步骤402中,首先在模板文件中搜索与该URL匹配的搜索引擎模板。于是找到以下搜索引擎模板:
yahoo=\
    url=http://search.yahoo.com/bin/search,\
    parameterName=p,\
    language=English,\
    assemblerClass=Generic,\
    dictionaryContext=
该模板是Yahoo!的模板。于是知道客户正在利用Yahoo!搜索引擎进行检索。同时知道步骤401中接收到的URL的参数表为“p=游戏”,因为模板指示只有参数“p”需要翻译。搜索引擎的专用语言为英文。搜索引擎中使用的查询字组合规则的函数名为Generic,以函数的形式限定了Yahoo!搜索引擎所规定的查询字组合规则。字典上下文为空格,说明使用通用字典。
在步骤403中,将参数表“p=游戏”中的本国语言(此处为中文)查询字“游戏”翻译成专用语言(此处为英文)查询字,如“recreation”。
另外需要说明的是,如果模板文件中没有匹配的搜索引擎模板,则对该URL应用缺省规则。缺省规则首先判断该URL所指向的搜索引擎的专用语言(相应于模板中的language参数),判断的根据是嵌入该URL的网页(客户正是从该网页发出的请求)所采用的语言,或者在所有查询翻译服务器处理过的URL历史记录中寻找与该URL最类似的一个,并检查它所返回的网页所采用的语言。将判断结果标识为专用语言。然后,判断查询字参数所在的位置(相应于模板中的parameterName参数),判断的根据是查找参数表中用本国语言表述的参数值。判断出查询字参数所在的位置之后,将本国语言查询字参数翻译为专用语言查询字。与模板中的assemblerClass参数和dictionaryContext参数相应的参数则取各自的缺省值。
步骤404根据原始查询请求和专用语言查询字构造针对于所选择的搜索引擎的新查询请求。本例中,新的查询请求中包括以下URL:
http://search.yahoo.com/bin/search?p=recreation&y=66
步骤405可以直接在查询翻译服务器中执行,但这样将损失本发明的部分特性(例如,向用户提供多个译文选项)。另外,一种更好的方式是,事先编写某种Script程序(该程序将在随响应网页到达客户后由客户自动执行),利用步骤404中得到的查询请求以及Script程序组成网页,将该网页作为响应返回给客户。由于Script程序的特点,客户收到响应后,自动执行Script程序。
由于中文“游戏”可以被翻译成多个英文单词,例如“recreation”、“game”或者“play”,所以步骤403和步骤404可以产生多个URL,例如:
http://search.yahoo.com/bin/search?p=recreation&y=66,
http://search.yahoo.com/bin/search?p=game&y=66,以及
http://search.yahoo.com/bin/search?p=play&y=66。将这三个URL中的某一个,比如
http://search.yahoo.com/bin/search?p=recreation&y=66,标识为缺省的URL。
借助于所编写的Script程序,将翻译时产生的多种译文选项以适当的方式向用户显示,同时将其中缺省的已翻译的查询请求再经由查询翻译服务器发往搜索引擎。由服务器将一段Script程序加到网页中返回给客户,客户在收到该网页中自动执行网页中所含的Script程序,是Script语言本身提供的功能,是本领域内普通技术人员的常识,在此不必多述。
相应于步骤401的多种实现方式,步骤406也可以有相应的多种实现方式。如果步骤401是采用代理服务器的方式实现的,则步骤406只简单地将搜索引擎返回的网页返回客户即可。如果步骤401是采用URL变换的方法实现的,则步骤406在对搜索引擎返回的网页进行了前述URL变换之后才将网页返回客户。
图5是在一个站点执行的本发明的第二种为因特网用户提供本国语言查询服务的方法的流程图。该方法中,利用了因特网中的现有的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有各自专用语言查询字的查询请求并且返回与查询字相关的查询结果。
步骤501接收用户的原始查询请求。假设图5所示的查询翻译方法运行在某个入门站点上,该入门站点的URL例如为http://portal_site/,则在步骤501收到的客户请求中,所请求的URL中必然含有http://portatal_site/。
步骤502去除所请求的URL中的前缀。如在下文所举例说明的,这里的前缀可能是
http://portal_site/redirect/(重定向前缀),或者
http://portal_site/translate/(翻译前缀)。
当然,这两种前缀不构成对本发明的限制。在实际应用中,根据不同的功能设计,可以有多种前缀,只要这些前缀符合URL的专用语法。
步骤503从多个搜索引擎中选择一个适用的搜索引擎。
步骤504判断所去除的前缀是否为重定向前缀,http://portal_site/redirect/。如果步骤504的判断结果为否,则处理进行到步骤505;否则处理进行到步骤509。由于在该例中,只包括两种前缀,即重定向前缀和翻译前缀。所以,在进行到步骤505之前所去除的前缀必然是翻译前缀,即http://portal_site/traislate/。
假如在步骤501收到的请求中,所请求的URL是
http://portal_site/translate/http://search.yahoo.com/bin/search?p=游戏&y=66
则在到达步骤505时,去除前缀后的URL成为
http://search.yahoo.com/bin/search?p=游戏&y=66
在步骤505中,以与图4中的步骤402、403类似的方法(例如,利用搜索引擎模板),将上述URL上的本国语言(该例中为中文)查询字“游戏”翻译为专用语言(该例中英文)查询字。然后,在骤506中,用专用语言查询字替换URL的参数中的本国语言查询字。
由于中文“游戏”可以被翻译成多个英文单词,例如“recreation”、“game”或者“play”,所以步骤506中可以产生多个URL,例如:
http://search.yahoo.com/bin/search?p=recreation&y=66,
http://search.yahoo.com/bin/search?p=game&y=66,以及
http://search.yahoo.com/bin/search?p=play&y=66。将这三个URL中的某一个,比如
http://search.yahoo.com/bin/search?p=recreation&y=66,标识为缺省的URL。
为了提供对组合查询命令的支持,在步骤505和506中,可以首先根据搜索引擎模板中的查询字组合规则(assemblerClass)确定查询命令中的约束符,比如“+”、“-”、“AND”、“OR”或“NOT”等等,然后将约束符所分隔的本国语言查询字逐一翻译为替换为专用语言查询字。
为了提供对专门站点搜索的支持,可以首先根据搜索引擎模板中的字典上下文(dictionaryContext)确定一个适用的字典,然后根据这个字典对查询字进行翻译。举例来说,如果用户在IBM站点中查询,则可将查询字“服务器”直接翻译并替换为“RS/6000”、“AS/400”或者“S/390”。如果在HP站点中查询,则可将查询字“服务器”直接翻译并替换为“HP3000”或者“NetServer”等。
在步骤506之后,处理进行到步骤507。在步骤507,在前述URL之前增加重定向前缀。于是,得到以下三个URL:
http://portal_site/redi rect/http://search.yahoo.com/bin/search?p=recreation&y=66,
http://portal-site/redirect/http://search.yahoo.com/bin/search?p=game&y=66,以及
http://portal_site/redirect/http://search.yahoo.com/bin/search?p=play&y=66。
然后,处理进行到步骤508。在步骤508中,生成一个新网页,在该网页中嵌入上述三个URL以及一段Script程序。该程序将由接收到该网页的客户自动执行。通过这段Script程序的执行,以适当方式向用户显示中文查询字“游戏”的多个译文选项。译文选项的显示方式可以有多种。一种较好的方式是,动态生成一个网页并在一个新开的窗口中显示。在所显示的网页中以醒目方式显示多个译文选项。每个译文选项对应一条超链接,即含有该译文的URL。在本例中,中文查询字“游戏”有三个译文选项,即英文译文“recreation”、“game”和“play”。于是,可以在新开的窗口中显示这三个译文选项。用户可以用指点装置点击这三个译文选项中的任一个,然后浏览器即发出相应的另一原始查询请求。前述Script程序的另外一个功能是,使客户根据缺省的URL(该例中为http://pertal_site/redirect/http://search.yahoo.com/bin/search?p=recreation&y=66)发出新的查询请求。
另外,在步骤508嵌入到网页中的Script程序还可以向用户提供修改搜索引擎模板的功能。例如,向用户显示查询翻译服务器所使用的搜索引擎模板的内容,如前文所述的四项内容。用户可以对模板内容进行修改,并重新提交查询请求。
步骤508之后,处理进行到步骤511。在步骤511,将生成的新网页作为响应返回给客户。
如前文所述,如果步骤504的判断结果为“是”,则处理进行到步骤509。在步骤509,经过因特网获取URL所标识的网页。
举例来说,如果步骤511将含有http://portal_site/redirect/http://search.yahoo.com/bin/search?p=recreation&y=66的网页返回给客户,则客户自动执行前文所述的Script程序,发出新的HTTP请求。在经过步骤501、502、503和504处理之后,在步骤509,获取以下URL所标识的网页:
http://search.yahoo.com/bin/search?p=recreation&y=66
具体的过程是这样的:将该请求发往Yahoo!搜索引擎,Yahoo!搜索引擎完成搜索之后以网页形式返回搜索结果。然后,处理进行到步骤510。
在步骤510,对从搜索引擎收到的网页进行分析并变换其中的URL。
作为简短背景,简要介绍一下编写网页时所使用的超文本标记语言(HTML)。HTML语言使用<>符号表示的标记和/或标记组,来控制Web页上的显示信息。因此,所有HTML文件必须以<HTML>标记开始,并且以</HTML>标记结束。其他的标记例如包括:表示链接锚点和超文本引用的<A HREF>和</A>,规定各帧内容的<FRAME>和</FRAME>,将图象装入某帧的<FRAME SRC>,以及与表格有关的<FORMACTION>等。许多标记设计成能够互相嵌套,以提供增强型对象。因此,例如,通过在<A HREF>标记内放置IMG SRC标记,就能够创建可搭接的图象。当然,以上标记只是举例,因为HTML是一种正在进化的语言。
在前述步骤510中,只对网页中的三种URL进行变换。这三种URL是:
(1)<A>或<AREA>标记中的“HREF”参数;
(2)<FRAME>标记中的“SRC”参数;
(3)<FORM>标记中的“ACTION”参数。
在第(1)和第(2)种URL之前,增加重定向前缀:
http://portal_site/redirect/
在第(3)种URL之前,增加翻译前缀:
http://portal_site/translate/
在对网页中的URL进行上述变换之后,形成新网页。然后,处理进行到步骤511。在步骤511,将生成的新网页作为响应返回给客户。
图6是本发明的为因特网用户提供本国语言查询服务的系统的示意图,图中虚框为本发明的查询翻译服务器,它与因特网600中的现有多个搜索引擎造成了本发明的为因特网用户提供本国语言查询服务的系统。如图6所示,本发明的查询翻译服务器包括客户接口601,用于接收客户发送的查询请求并且向客户返回查询结果;请求分配装置602,用于按照查询请求中URL前缀的种类,分别将URL前缀为重定向前缀的查询请求分配给网页获取装置603,将URL前缀为翻译前缀的查询请求分配给查询翻译装置605;网页获取装置603向URL指定的搜索引擎发送查询请求获取URL所请求的网页;网页修改装置604,对网页获取装置603获取的网页中的某些URL进行变换,即在需要查询字的URL之前加翻译前缀,在其他URL之前加重定向前缀,形成新网页;查询翻译装置605,用于将所请求的URL中的本国语言查询字翻译并替换为搜索引擎专用语言查询字,并且在URL之前加重定向前缀;网页生成装置,用于生成一个新网页,在网页中嵌入URL以及一段Script程序,该程序使收到该网页的客户根据所嵌入的URL自动发出另一查询请求。另外,查询翻译装置605在工作中还利用了字典607和搜索引擎模板存储装置608。字典607中存储了大量字典条目,每个字典条目以相互对应的方式存储了原文文字及其译文。搜索引擎模板608如前文参照图4和图5所述。网页生成装置606在工作中利用了一个Script程序生成器609,用于生成前述供客户执行的Script程序。
图7至图10是利用本发明方法和系统进行中文查询时的浏览器显示举例。
图7以举例的方式说明可以利用一个入门站点进入Yahoo!搜索引擎。当然,也可以不通过这样的入门站点,而采用其他的方法在Yahoo!的URL之前加指向本发明的查询翻译服务器的前缀。
图8显示在Yahoo!搜索引擎的主页中键入中文查询字“游戏”。
图9显示用户在图8中键入中文查询字“游戏”之后,借助于本发明的查询翻译器,Yahoo!返回的网页,即查询结果。另外,浏览器借助于Script程序打开另外一个窗口,显示“游戏”的三个英文译文选项。此外,还显示“Modify Current Setting”。用户可以点击这段超文本,对Yahoo!搜索引擎的模板进行修改。
图10是在图9中点击超文本“Modify Current Setting”之后,浏览器的显示。图10中显示了查询翻译服务器当前所用的Yahoo!模板的内容。用户可以进行适当修改。
可以将本发明的方法与网页翻译服务结合起来,提供完整的检索翻译服务。这种应用的举例示于图8和图9。即,用户键入中文查询字,然后得到中文查询结果。另外,本发明还可以与语音识别系统结合起来,提供对语音查询字请求中的语音查询字进行翻译。
另外需要说明的是,尽管以上都是针对因特网搜索引擎对本发明的方法和系统做了说明,但是本发明的构思还可以应用于数据库的检索和查询。根据这种构思,可以构造一种为数据库用户提供本国语言查询服务的系统,包括多个数据库,每个数据库具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述系统的特征在于还包括一个查询翻译服务器,所述查询翻译服务器包括:客户接口,用于接收客户发送的查询请求,并且向客户返回查询结果;查询翻译装置,用于将所述客户接口收到的查询请求中的用户本国语言查询字翻译并替换为数据库的专用语言查询字;查询结果获取装置,用于向所述查询请求指定的数据库发送已翻译的查询请求并且获取查询结果。类似地,在数据库查询命令中的本国语言查询字也可以为语音查询字。
虽然以上结合附图详细描述了本发明的最佳实施方式,但是对于本领域内熟练的技术人员而言,可以做出各种修改和变更,而不背离本发明的范围和实质。因此,本发明的范围仅由权利要求书限定。

Claims (14)

1.一种为因特网用户提供本国语言查询服务的方法,该方法中利用了因特网中的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述方法的特征在于包括以下步骤:
(a)在一个站点接收所述因特网用户的原始查询请求,所述原始查询请求中含有所述用户的本国语言查询字;
(b)从所述多个搜索引擎中选择一个适用的搜索引擎;
(c)将所述本国语言查询字翻译为所选择的搜索引擎的专用语言查询字;
(d)根据所述原始查询请求和所述专用语言查询字构造针对于所选择的搜索引擎的新查询请求;
(e)向所选择的搜索引擎发送所述新查询请求并且接收返回的查询结果;
(f)将所述查询结果作为与所述原始查询请求相关的查询结果返回给所述用户。
2.根据权利要求1的方法,其特征在于所述步骤(b)包括步骤:将所述原始查询请求中的URL指定的搜索引擎作为所选择的搜索引擎。
3.根据权利要求2的方法,其特征在于所述步骤(c)包括步骤:
根据所述原始查询请求中的URL,在一个搜索引擎模板存储装置中检索一个与所述URL匹配的搜索引擎模板;
将所述本国语言查询字翻译为检索到的搜索引擎模板中限定的专用语言查询字。
4.根据权利要求3的方法,其特征在于所述步骤(c)还包括步骤:
如果在所述搜索引擎模板存储装置中没有检索到与所述URL匹配的搜索引擎模板,则根据所述URL,在所述站点的历史记录中,搜索与所述URL对应的专用语言;
利用参数值的语言特征,判断查询字参数所在的位置;
将所述位置处的本国语言查询字翻译为所述专用语言查询字。
5.根据权利要求3或4的方法,其特征在于所述步骤(d)包括步骤:将所述原始查询请求中的本国语言查询字替换为所述专用语言查询字,从而构成所述新查询请求。
6.一种为因特网用户提供本国语言查询服务的方法,该方法中利用了因特网中的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述方法的特征在于包括以下步骤:
(a)在一个站点接收所述因特网用户的原始查询请求,所述原始查询请求中含有用户所请求的URL,所述URL带有一个用于限定所述站点的前缀;
(b)去除所述URL的前缀;
(c)从所述多个搜索引擎中选择一个适用的搜索引擎;
(d)如果所去除的前缀为重定向前缀,则执行以下步骤:
(d1)向所选择的搜索引擎发送含有所述URL的请求并且接收作为响应的网页;
(d2)在所述网页中,在需要输入查询字的URL之前增加翻译前缀,在其他URL之前增加重定向前缀,从而构成一个新网页;
(e)如果所去除的前缀为翻译前缀,则执行以下步骤:
(e1)将所述URL的参数中的用户本国语言查询字翻译为所选择的搜索引擎的专用语言查询字;
(e2)用所述专用语言查询字替换所述URL的参数中的用户本国语言查询字;
(e3)在所述URL之前增加重定向前缀;
(e4)生成一个新网页,在所述网页中嵌入所述URL以及一段Script程序,所述Script程序用于使收到所述新网页的客户执行以下步骤:根据所述网页中嵌入的所述URL自动发出另一原
始查询请求;
(f)将所述新网页作为与所述原始查询请求相关的查询结果返回给所述用户。
7.根据权利要求6的方法,其特征在于所述步骤(c)包括步骤:将所述URL指定的搜索引擎作为所选择的搜索引擎。
8.根据权利要求7的方法,其特征在于所述步骤(e1)包括步骤:
根据所述URL,在一个搜索引擎模板存储装置中检索一个与所述URL匹配的搜索引擎模板;
将所述本国语言查询字翻译为检索到的搜索引擎模板中限定的专用语言查询字。
9.根据权利要求8的方法,其特征在于所述步骤(e1)还包括步骤:
如果在所述搜索引擎模板存储装置中没有检索到与所述URL匹配的搜索引擎模板,则根据所述URL,在所述站点的历史记录中,搜索与所述URL对应的专用语言;
利用参数值的语言特征,判断查询字参数所在的位置;
将所述位置处的本国语言查询字翻译为所述专用语言查询字。
10.根据权利要求6的方法,其特征在于所述步骤(e)为:
(e)如果所去除的前缀为翻译前缀,则执行以下步骤:
(e1)将所述URL的参数中的用户本国语言查询字翻译为所选择的搜索引擎的专用语言的多个查询字;
(e2)分别用所述专用语言的多个查询字中的每一个替换所述URL的参数中的用户本国语言查询字,从而形成多个URL;
(e3)在所述多个URL之前分别增加重定向前缀;
(e4)将所述多个URL中的一个设定为缺省URL;
(e5)生成一个新网页,在所述网页中嵌入所述多个URL以及一段Script程序,所述Script程序用于使收到所述新网页的客户执行以下步骤:以超文本形式显示所述专用语言的多个查询字,并且根据所述网页中嵌入的所述缺省URL自动发出另一
原始查询请求。
11.一种为因特网用户提供本国语言查询服务的系统,包括因特网中的多个搜索引擎,每个搜索引擎具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述系统的特征在于还包括一个查询翻译服务器,所述查询翻译服务器包括:
客户接口,用于接收客户发送的查询请求,并且向客户返回查询结果;
请求分配装置,用于从所述客户接口接收所述查询请求,去除所请求的URL的前缀,并且根据所去除的前缀,将所述查询请求分配到不同的部件;
网页获取装置,用于从所述请求分配装置接收前缀为重定向前缀的查询请求,向URL指定的搜索引擎发送查询请求并且获取URL所请求的网页;
网页修改装置,在所获取的网页中,在需要查询字的URL之前加翻译前缀,在其他URL之前加重定向前缀,从而形成新网页,并且将所述新网页送到所述客户接口;
查询翻译装置,用于从所述请求分配装置接收前缀为翻译前缀的查询请求,将所请求的URL中的用户本国语言查询字翻译并替换为搜索引擎的专用语言查询字,并且在URL之前加重定向前缀;
网页生成装置,用于生成一个新网页,在网页中嵌入URL以及一段Script程序,该段程序使收到该网页的客户根据所嵌入的URL自动发出另一查询请求,并且将所述新网页送到所述客户接口。
12.根据权利要求11的系统,其特征在于所述本国语言查询字为语音查询字。
13.一种为数据库用户提供本国语言查询服务的系统,包括多个数据库,每个数据库具有各自的专用语言,用于接收含有所述专用语言查询字的查询请求并且返回与所述查询字相关的查询结果,所述系统的特征在于还包括一个查询翻译服务器,所述查询翻译服务器包括:
客户接口,用于接收客户发送的查询请求,并且向客户返回查询结果;
查询翻译装置,用于将所述客户接口收到的查询请求中的用户本国语言查询字翻译并替换为数据库的专用语言查询字;
查询结果获取装置,用于向所述查询请求指定的数据库发送已翻译的查询请求并且获取查询结果。
14.根据权利要求13的系统,其特征在于所述本国语言查询字为语音查询字。
CNB991105400A 1999-07-28 1999-07-28 提供本国语言查询服务的方法和系统 Expired - Fee Related CN1176432C (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CNB991105400A CN1176432C (zh) 1999-07-28 1999-07-28 提供本国语言查询服务的方法和系统
TW088114553A TW429354B (en) 1999-07-28 1999-08-25 A query translation server for Internet search engines that support complex queries
EP00305822A EP1072984A3 (en) 1999-07-28 2000-07-10 Method and system for providing native language query service
KR10-2000-0040799A KR100413309B1 (ko) 1999-07-28 2000-07-15 모국어 조회 서비스를 제공하기 위한 방법 및 시스템
JP2000225285A JP3548098B2 (ja) 1999-07-28 2000-07-26 ネイティブ言語照会サービスを提供する方法およびシステム
US09/627,372 US7058626B1 (en) 1999-07-28 2000-07-28 Method and system for providing native language query service

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB991105400A CN1176432C (zh) 1999-07-28 1999-07-28 提供本国语言查询服务的方法和系统

Publications (2)

Publication Number Publication Date
CN1282928A true CN1282928A (zh) 2001-02-07
CN1176432C CN1176432C (zh) 2004-11-17

Family

ID=5274586

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991105400A Expired - Fee Related CN1176432C (zh) 1999-07-28 1999-07-28 提供本国语言查询服务的方法和系统

Country Status (6)

Country Link
US (1) US7058626B1 (zh)
EP (1) EP1072984A3 (zh)
JP (1) JP3548098B2 (zh)
KR (1) KR100413309B1 (zh)
CN (1) CN1176432C (zh)
TW (1) TW429354B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103339623A (zh) * 2010-09-08 2013-10-02 纽昂斯通讯公司 涉及因特网搜索的方法和设备
CN104850545A (zh) * 2015-04-29 2015-08-19 均康(上海)信息科技有限公司 一种进行网络资源翻译的在线协作系统及方法
CN105159893A (zh) * 2015-08-31 2015-12-16 小米科技有限责任公司 字符串保存方法及装置
CN103927375B (zh) * 2002-09-30 2017-06-23 改进搜索有限责任公司 跨语言搜索结果的闪烁注释标注加亮
CN108280092A (zh) * 2017-01-06 2018-07-13 广州泰尔智信科技有限公司 应用信息获取方法及装置
CN108536688A (zh) * 2018-04-23 2018-09-14 苏州大学 发现全网多语言网站并获得平行语料的方法

Families Citing this family (165)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
JP3621643B2 (ja) * 2000-05-30 2005-02-16 株式会社 ネットピア.コム 実名を利用した地域情報提供システム及びその方法
US20050044148A1 (en) * 2000-06-29 2005-02-24 Microsoft Corporation Method and system for accessing multiple types of electronic content
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US20050144240A1 (en) * 2000-09-13 2005-06-30 Janko Mrsic-Flogel Data communications
US8806326B1 (en) * 2000-09-25 2014-08-12 Nokia Inc. User preference based content linking
US7451136B2 (en) * 2000-10-11 2008-11-11 Microsoft Corporation System and method for searching multiple disparate search engines
JP2002189721A (ja) * 2000-10-11 2002-07-05 Mieko Tsuyusaki Webページ検索システム及び翻訳システム
GB0025299D0 (en) * 2000-10-13 2000-11-29 Ibm Request tracking for analysis of website navigation
WO2002035369A1 (fr) * 2000-10-13 2002-05-02 Kabushiki Kaisha Toshiba Systeme de relais de donnees, procede de relais de donnees, programme de relais de donnees, procede de traitement d'informations, et programme de traitement d'informations
US7181508B1 (en) * 2000-11-09 2007-02-20 Oki Data Americas, Inc. System and method for communicating, monitoring and configuring a device operatively connected to a network
US20030115040A1 (en) * 2001-02-09 2003-06-19 Yue Xing International (multiple language/non-english) domain name and email user account ID services system
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US7512666B2 (en) * 2001-04-18 2009-03-31 Yahoo! Inc. Global network of web card systems and method thereof
GB2378774A (en) * 2001-05-01 2003-02-19 One Stop To Ltd Searching procedures
JP2002351892A (ja) * 2001-05-30 2002-12-06 A & D:Kk 商標検索システム及び商標出願支援システム
US20020188435A1 (en) * 2001-06-07 2002-12-12 Microsoft Corporation Interface for submitting richly-formatted documents for remote processing
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
KR100456621B1 (ko) * 2001-12-24 2004-11-10 한국전자통신연구원 데이터베이스 등록소 검색을 이용한 관계-필터 질의어처리장치 및 방법
US7260570B2 (en) * 2002-02-01 2007-08-21 International Business Machines Corporation Retrieving matching documents by queries in any national language
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7853719B1 (en) * 2002-02-11 2010-12-14 Microsoft Corporation Systems and methods for providing runtime universal resource locator (URL) analysis and correction
DE60212330T2 (de) * 2002-04-12 2007-06-21 Targit A/S Verfahren zur Verarbeitung von mehrsprachigen Abfragen
JP2004118740A (ja) * 2002-09-27 2004-04-15 Toshiba Corp 質問応答システム、質問応答方法、質問応答プログラム
KR100456027B1 (ko) * 2002-12-10 2004-11-08 한국전자통신연구원 지-에프큐엘을 이용한 이비엑스엠엘 필터질의 변환 장치및 방법
EP1583011A4 (en) * 2002-12-19 2006-09-20 Nozzle Network Co Ltd NOZZLE INFORMATION SEARCH SYSTEM AND NOZZLE CATALOG DATABASE
US7627817B2 (en) 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US20050021502A1 (en) * 2003-05-23 2005-01-27 Benjamin Chen Data federation methods and system
US7854009B2 (en) 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US8028073B2 (en) * 2003-06-25 2011-09-27 Oracle International Corporation Mobile meeting and collaboration
US9094805B2 (en) * 2003-06-25 2015-07-28 Oracle International Corporation Mobile messaging concierge
US7206780B2 (en) 2003-06-27 2007-04-17 Sbc Knowledge Ventures, L.P. Relevance value for each category of a particular search result in the ranked list is estimated based on its rank and actual relevance values
WO2005020104A1 (en) 2003-08-18 2005-03-03 Sap Aktiengesellschaft User-requested search or modification of indices for search engines
US8014997B2 (en) 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
DE10348920A1 (de) * 2003-10-21 2005-05-25 Bayer Materialscience Ag Computersystem und Verfahren zur mehrsprachigen assoziativen Suche
SG153628A1 (en) * 2004-01-14 2009-07-29 Agency Science Tech & Res Method and system for data retrieval from heterogeneous data sources
US7287042B1 (en) * 2004-03-03 2007-10-23 A9.Com, Inc. Search engine system supporting inclusion of unformatted search string after domain name portion of URL
US20060179153A1 (en) * 2004-03-22 2006-08-10 Nam-Yul Lee Streaming based contents distribution network system and methods for splitting, merging and retrieving files
US8392453B2 (en) 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US7409402B1 (en) 2005-09-20 2008-08-05 Yahoo! Inc. Systems and methods for presenting advertising content based on publisher-selected labels
US7856441B1 (en) 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
US7958115B2 (en) * 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US20070106657A1 (en) * 2005-11-10 2007-05-10 Brzeski Vadim V Word sense disambiguation
US7421441B1 (en) 2005-09-20 2008-09-02 Yahoo! Inc. Systems and methods for presenting information based on publisher-selected labels
US7599838B2 (en) * 2004-09-01 2009-10-06 Sap Aktiengesellschaft Speech animation with behavioral contexts for application scenarios
US8694532B2 (en) * 2004-09-17 2014-04-08 First American Data Co., Llc Method and system for query transformation for managing information from multiple datasets
US20060146838A1 (en) * 2004-12-30 2006-07-06 Motorola, Inc. System and method for automatic and direct routing of information in a network
US8751240B2 (en) * 2005-05-13 2014-06-10 At&T Intellectual Property Ii, L.P. Apparatus and method for forming search engine queries based on spoken utterances
US7836027B2 (en) * 2005-06-22 2010-11-16 Statware, Inc. Method and apparatus for communicating list orders
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070050188A1 (en) * 2005-08-26 2007-03-01 Avaya Technology Corp. Tone contour transformation of speech
US7895193B2 (en) * 2005-09-30 2011-02-22 Microsoft Corporation Arbitration of specialized content using search results
US20070106653A1 (en) * 2005-10-12 2007-05-10 Yu Sun Search engine
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US8209696B2 (en) * 2006-02-13 2012-06-26 Teradata Us, Inc. Method and system for load balancing a distributed database
US8813021B1 (en) 2006-02-16 2014-08-19 Cypress Semiconductor Corporation Global resource conflict management for an embedded application design
US9507778B2 (en) 2006-05-19 2016-11-29 Yahoo! Inc. Summarization of media object collections
US20070271231A1 (en) * 2006-05-22 2007-11-22 Jimmy Jong-Yuan Lin Search method on the Internet
US8403756B2 (en) * 2006-07-28 2013-03-26 Yahoo! Inc. Fantasy sports alert generator
US8568236B2 (en) * 2006-07-28 2013-10-29 Yahoo! Inc. Fantasy sports agent
CN100416570C (zh) * 2006-09-22 2008-09-03 浙江大学 一种基于问答库的中文自然语言问答方法
US7979425B2 (en) 2006-10-25 2011-07-12 Google Inc. Server-side match
US20080102911A1 (en) * 2006-10-27 2008-05-01 Yahoo! Inc. Integration of personalized fantasy data with general sports content
US8594702B2 (en) 2006-11-06 2013-11-26 Yahoo! Inc. Context server for associating information based on context
US7742922B2 (en) * 2006-11-09 2010-06-22 Goller Michael D Speech interface for search engines
US8402356B2 (en) 2006-11-22 2013-03-19 Yahoo! Inc. Methods, systems and apparatus for delivery of media
US9110903B2 (en) 2006-11-22 2015-08-18 Yahoo! Inc. Method, system and apparatus for using user profile electronic device data in media delivery
US20080153589A1 (en) * 2006-12-22 2008-06-26 Yahoo! Inc. Rotisserie fantasy league visualization tools
US8671354B2 (en) * 2006-12-22 2014-03-11 Yahoo! Inc. Player streaks and game data visualization
US8769099B2 (en) 2006-12-28 2014-07-01 Yahoo! Inc. Methods and systems for pre-caching information on a mobile computing device
US8359188B2 (en) * 2006-12-28 2013-01-22 Verizon Patent And Licensing Inc. Network-based systems and methods for providing access to remote language services assets
KR20080074617A (ko) * 2007-02-09 2008-08-13 (주)넷피아닷컴 키워드별 검색 서비스 제공시스템 및 제공방법
US7720856B2 (en) * 2007-04-09 2010-05-18 Sap Ag Cross-language searching
WO2008151466A1 (en) * 2007-06-14 2008-12-18 Google Inc. Dictionary word and phrase determination
US9015279B2 (en) * 2007-06-15 2015-04-21 Bryte Computer Technologies Methods, systems, and computer program products for tokenized domain name resolution
US20090083243A1 (en) * 2007-09-21 2009-03-26 Google Inc. Cross-language search
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
US9754022B2 (en) 2007-10-30 2017-09-05 At&T Intellectual Property I, L.P. System and method for language sensitive contextual searching
US8069142B2 (en) * 2007-12-06 2011-11-29 Yahoo! Inc. System and method for synchronizing data on a network
US8307029B2 (en) 2007-12-10 2012-11-06 Yahoo! Inc. System and method for conditional delivery of messages
US8671154B2 (en) 2007-12-10 2014-03-11 Yahoo! Inc. System and method for contextual addressing of communications on a network
US8166168B2 (en) 2007-12-17 2012-04-24 Yahoo! Inc. System and method for disambiguating non-unique identifiers using information obtained from disparate communication channels
US9706345B2 (en) 2008-01-04 2017-07-11 Excalibur Ip, Llc Interest mapping system
US9626685B2 (en) 2008-01-04 2017-04-18 Excalibur Ip, Llc Systems and methods of mapping attention
US8762285B2 (en) 2008-01-06 2014-06-24 Yahoo! Inc. System and method for message clustering
US20090182618A1 (en) 2008-01-16 2009-07-16 Yahoo! Inc. System and Method for Word-of-Mouth Advertising
US8560390B2 (en) 2008-03-03 2013-10-15 Yahoo! Inc. Method and apparatus for social network marketing with brand referral
US8554623B2 (en) * 2008-03-03 2013-10-08 Yahoo! Inc. Method and apparatus for social network marketing with consumer referral
US8538811B2 (en) 2008-03-03 2013-09-17 Yahoo! Inc. Method and apparatus for social network marketing with advocate referral
WO2009118010A1 (en) * 2008-03-28 2009-10-01 Kobenhavns Universitet A search method and a method of providing an electronic database
US8589486B2 (en) 2008-03-28 2013-11-19 Yahoo! Inc. System and method for addressing communications
US8745133B2 (en) * 2008-03-28 2014-06-03 Yahoo! Inc. System and method for optimizing the storage of data
US8271506B2 (en) 2008-03-31 2012-09-18 Yahoo! Inc. System and method for modeling relationships between entities
US8051080B2 (en) * 2008-04-16 2011-11-01 Yahoo! Inc. Contextual ranking of keywords using click data
KR100978581B1 (ko) * 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
US20090287474A1 (en) * 2008-05-16 2009-11-19 Yahoo! Inc. Web embedded language input arrangement
US20090327224A1 (en) * 2008-06-26 2009-12-31 Microsoft Corporation Automatic Classification of Search Engine Quality
US8452855B2 (en) * 2008-06-27 2013-05-28 Yahoo! Inc. System and method for presentation of media related to a context
US8813107B2 (en) 2008-06-27 2014-08-19 Yahoo! Inc. System and method for location based media delivery
US8706406B2 (en) 2008-06-27 2014-04-22 Yahoo! Inc. System and method for determination and display of personalized distance
US10230803B2 (en) 2008-07-30 2019-03-12 Excalibur Ip, Llc System and method for improved mapping and routing
US8583668B2 (en) 2008-07-30 2013-11-12 Yahoo! Inc. System and method for context enhanced mapping
US8386506B2 (en) 2008-08-21 2013-02-26 Yahoo! Inc. System and method for context enhanced messaging
JP5137200B2 (ja) * 2008-08-26 2013-02-06 日本電信電話株式会社 ハイパーテキスト転送プロトコルネットワークおよびデータ転送方法
US8281027B2 (en) 2008-09-19 2012-10-02 Yahoo! Inc. System and method for distributing media related to a location
US20100082427A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and Method for Context Enhanced Ad Creation
US9600484B2 (en) 2008-09-30 2017-03-21 Excalibur Ip, Llc System and method for reporting and analysis of media consumption data
US8108778B2 (en) 2008-09-30 2012-01-31 Yahoo! Inc. System and method for context enhanced mapping within a user interface
US8060492B2 (en) * 2008-11-18 2011-11-15 Yahoo! Inc. System and method for generation of URL based context queries
US8032508B2 (en) 2008-11-18 2011-10-04 Yahoo! Inc. System and method for URL based query for retrieving data related to a context
US8024317B2 (en) 2008-11-18 2011-09-20 Yahoo! Inc. System and method for deriving income from URL based context queries
US9805123B2 (en) * 2008-11-18 2017-10-31 Excalibur Ip, Llc System and method for data privacy in URL based context queries
US9224172B2 (en) 2008-12-02 2015-12-29 Yahoo! Inc. Customizable content for distribution in social networks
US8055675B2 (en) 2008-12-05 2011-11-08 Yahoo! Inc. System and method for context based query augmentation
US8166016B2 (en) 2008-12-19 2012-04-24 Yahoo! Inc. System and method for automated service recommendations
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US20100185509A1 (en) * 2009-01-21 2010-07-22 Yahoo! Inc. Interest-based ranking system for targeted marketing
US8666730B2 (en) 2009-03-13 2014-03-04 Invention Machine Corporation Question-answering system and method based on semantic labeling of text documents and user questions
US20100241689A1 (en) * 2009-03-19 2010-09-23 Yahoo! Inc. Method and apparatus for associating advertising with computer enabled maps
US8150967B2 (en) 2009-03-24 2012-04-03 Yahoo! Inc. System and method for verified presence tracking
US8108421B2 (en) * 2009-03-30 2012-01-31 Microsoft Corporation Query throttling during query translation
US9171078B2 (en) * 2009-04-29 2015-10-27 Microsoft Technology Licensing, Llc Automatic recommendation of vertical search engines
US20100280913A1 (en) * 2009-05-01 2010-11-04 Yahoo! Inc. Gift credit matching engine
US10671698B2 (en) 2009-05-26 2020-06-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US9405745B2 (en) * 2009-06-01 2016-08-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US10223701B2 (en) 2009-08-06 2019-03-05 Excalibur Ip, Llc System and method for verified monetization of commercial campaigns
US9904436B2 (en) 2009-08-11 2018-02-27 Pearl.com LLC Method and apparatus for creating a personalized question feed platform
US20140114986A1 (en) * 2009-08-11 2014-04-24 Pearl.com LLC Method and apparatus for implicit topic extraction used in an online consultation system
US9646079B2 (en) 2012-05-04 2017-05-09 Pearl.com LLC Method and apparatus for identifiying similar questions in a consultation system
US8914342B2 (en) 2009-08-12 2014-12-16 Yahoo! Inc. Personal data platform
US8364611B2 (en) 2009-08-13 2013-01-29 Yahoo! Inc. System and method for precaching information on a mobile device
US20110119268A1 (en) * 2009-11-13 2011-05-19 Rajaram Shyam Sundar Method and system for segmenting query urls
US8650172B2 (en) * 2010-03-01 2014-02-11 Microsoft Corporation Searchable web site discovery and recommendation
US8972397B2 (en) * 2010-03-11 2015-03-03 Microsoft Corporation Auto-detection of historical search context
EP2593884A2 (en) 2010-07-13 2013-05-22 Motionpoint Corporation Dynamic language translation of web site content
US8977624B2 (en) 2010-08-30 2015-03-10 Microsoft Technology Licensing, Llc Enhancing search-result relevance ranking using uniform resource locators for queries containing non-encoding characters
US20120059658A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Methods and apparatus for performing an internet search
US8239366B2 (en) * 2010-09-08 2012-08-07 Nuance Communications, Inc. Method and apparatus for processing spoken search queries
US8341142B2 (en) 2010-09-08 2012-12-25 Nuance Communications, Inc. Methods and apparatus for searching the Internet
US9779168B2 (en) 2010-10-04 2017-10-03 Excalibur Ip, Llc Contextual quick-picks
US20120095997A1 (en) * 2010-10-18 2012-04-19 Microsoft Corporation Providing contextual hints associated with a user session
US9164988B2 (en) * 2011-01-14 2015-10-20 Lionbridge Technologies, Inc. Methods and systems for the dynamic creation of a translated website
US20120289156A1 (en) * 2011-05-09 2012-11-15 Wesley Boudville Multiple uses of an e-book reader
US9489457B2 (en) 2011-07-14 2016-11-08 Nuance Communications, Inc. Methods and apparatus for initiating an action
US8812474B2 (en) 2011-07-14 2014-08-19 Nuance Communications, Inc. Methods and apparatus for identifying and providing information sought by a user
US8635201B2 (en) 2011-07-14 2014-01-21 Nuance Communications, Inc. Methods and apparatus for employing a user's location in providing information to the user
US9292603B2 (en) 2011-09-30 2016-03-22 Nuance Communications, Inc. Receipt and processing of user-specified queries
US9342615B2 (en) * 2011-12-07 2016-05-17 Google Inc. Reducing redirects
US9501580B2 (en) 2012-05-04 2016-11-22 Pearl.com LLC Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website
US9275038B2 (en) 2012-05-04 2016-03-01 Pearl.com LLC Method and apparatus for identifying customer service and duplicate questions in an online consultation system
CN102982176B (zh) * 2012-12-17 2016-10-05 北京奇虎科技有限公司 用于浏览器的搜索方法和装置
CN105940399B (zh) * 2014-03-28 2019-04-26 松下知识产权经营株式会社 声音检索装置、声音检索方法以及显示装置
US9875446B2 (en) * 2014-04-03 2018-01-23 Amadeus S.A.S. Travel product information sharing
CN104182483B (zh) * 2014-08-07 2017-11-10 蔡剑 基于社会网络的服务索引库的建立方法及服务搜索方法
US10171548B2 (en) * 2014-08-26 2019-01-01 Mavenir Systems, Inc. Method and system for efficient enrichment of upper layer protocol content in transmission control program (TCP) based sessions
KR20170122505A (ko) * 2016-04-27 2017-11-06 삼성전자주식회사 부가 정보를 제공하는 단말 장치 및 제공 방법
RU2652451C2 (ru) * 2016-09-08 2018-04-26 Акционерное общество "Лаборатория Касперского" Способы обнаружения аномальных элементов веб-страниц
RU2638710C1 (ru) 2016-10-10 2017-12-15 Акционерное общество "Лаборатория Касперского" Способы обнаружения вредоносных элементов веб-страниц
US10691764B2 (en) * 2017-10-23 2020-06-23 International Business Machines Corporation Search engine optimization techniques
JP7346891B2 (ja) * 2019-04-18 2023-09-20 株式会社リコー ウェブページ多言語化装置、方法、プログラム、およびシステム
KR20240039397A (ko) * 2022-09-19 2024-03-26 쿠팡 주식회사 테스트를 수행하기 위한 방법 및 장치

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2101613B1 (es) * 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
US5819264A (en) * 1995-04-03 1998-10-06 Dtl Data Technologies Ltd. Associative search method with navigation for heterogeneous databases including an integration mechanism configured to combine schema-free data models such as a hyperbase
WO1997008604A2 (en) * 1995-08-16 1997-03-06 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US5802526A (en) * 1995-11-15 1998-09-01 Microsoft Corporation System and method for graphically displaying and navigating through an interactive voice response menu
US6233544B1 (en) * 1996-06-14 2001-05-15 At&T Corp Method and apparatus for language translation
US6061738A (en) * 1997-06-27 2000-05-09 D&I Systems, Inc. Method and system for accessing information on a network using message aliasing functions having shadow callback functions
US5842206A (en) * 1996-08-20 1998-11-24 Iconovex Corporation Computerized method and system for qualified searching of electronically stored documents
US6167393A (en) * 1996-09-20 2000-12-26 Novell, Inc. Heterogeneous record search apparatus and method
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
JPH10187752A (ja) * 1996-12-24 1998-07-21 Kokusai Denshin Denwa Co Ltd <Kdd> 言語間情報検索支援システム
JP3627446B2 (ja) * 1997-06-04 2005-03-09 富士ゼロックス株式会社 検索式作成装置及び検索式作成方法
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
KR980004126A (ko) * 1997-12-16 1998-03-30 양승택 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법
US6505212B2 (en) * 1998-02-04 2003-01-07 Interwoven Inc System and method for website development
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
US6289357B1 (en) * 1998-04-24 2001-09-11 Platinum Technology Ip, Inc. Method of automatically synchronizing mirrored database objects
US6178427B1 (en) * 1998-05-07 2001-01-23 Platinum Technology Ip, Inc. Method of mirroring log datasets using both log file data and live log data including gaps between the two data logs
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6434614B1 (en) * 1998-05-29 2002-08-13 Nielsen Media Research, Inc. Tracking of internet advertisements using banner tags
US6088796A (en) * 1998-08-06 2000-07-11 Cianfrocca; Francis Secure middleware and server control system for querying through a network firewall
US6738827B1 (en) * 1998-09-29 2004-05-18 Eli Abir Method and system for alternate internet resource identifiers and addresses
US6349276B1 (en) * 1998-10-29 2002-02-19 International Business Machines Corporation Multilingual information retrieval with a transfer corpus
US6466901B1 (en) * 1998-11-30 2002-10-15 Apple Computer, Inc. Multi-language document search and retrieval system
US6381598B1 (en) * 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval
US6167369A (en) * 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
US6314469B1 (en) * 1999-02-26 2001-11-06 I-Dns.Net International Pte Ltd Multi-language domain name service
US6202062B1 (en) * 1999-02-26 2001-03-13 Ac Properties B.V. System, method and article of manufacture for creating a filtered information summary based on multiple profiles of each single user
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6598039B1 (en) * 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
US20010021934A1 (en) * 2000-03-08 2001-09-13 Takeshi Yokoi Processing device for searching information in one language using search query in another language, and recording medium and method thereof
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927375B (zh) * 2002-09-30 2017-06-23 改进搜索有限责任公司 跨语言搜索结果的闪烁注释标注加亮
CN103339623A (zh) * 2010-09-08 2013-10-02 纽昂斯通讯公司 涉及因特网搜索的方法和设备
CN104850545A (zh) * 2015-04-29 2015-08-19 均康(上海)信息科技有限公司 一种进行网络资源翻译的在线协作系统及方法
CN105159893A (zh) * 2015-08-31 2015-12-16 小米科技有限责任公司 字符串保存方法及装置
CN108280092A (zh) * 2017-01-06 2018-07-13 广州泰尔智信科技有限公司 应用信息获取方法及装置
CN108536688A (zh) * 2018-04-23 2018-09-14 苏州大学 发现全网多语言网站并获得平行语料的方法

Also Published As

Publication number Publication date
EP1072984A2 (en) 2001-01-31
CN1176432C (zh) 2004-11-17
KR20010085185A (ko) 2001-09-07
TW429354B (en) 2001-04-11
KR100413309B1 (ko) 2003-12-31
JP3548098B2 (ja) 2004-07-28
EP1072984A3 (en) 2005-10-19
US7058626B1 (en) 2006-06-06
JP2001092854A (ja) 2001-04-06

Similar Documents

Publication Publication Date Title
CN1176432C (zh) 提供本国语言查询服务的方法和系统
CN1108682C (zh) 在无状态网络协议情况下保留状态
CN1200378C (zh) 预取信息的方法,系统和服务器
CN1242337C (zh) 用于访问在一个网络上的信息的方法和系统
JP4543119B2 (ja) ドキュメントの作成を援助する方法およびシステム
CN1108578C (zh) 为离线客户请求提供响应的方法及装置
CN1114878C (zh) 代理主计算机和用于在一个浏览器和一个代理计算机之间访问和检索信息的方法
US6336116B1 (en) Search and index hosting system
CN1601526A (zh) 用于在计算机网络内搜索的方法和设备
CN1327195A (zh) 用于访问在一个网络上的信息的方法和系统
US20150074141A1 (en) Macro programming for resources
CN1493043A (zh) 翻译信息段
CN1622086A (zh) 在计算机网络中搜索
CN1799051A (zh) 使用页面存储文件浏览内容的方法
CN1328668A (zh) 用于指定网络上的位置的系统和处理
CN1606300A (zh) 数据处理系统中分配图像的方法与系统
CN1320874A (zh) 网络环境下的程序挖掘方法及其程序挖掘系统
JP2010257453A (ja) サーチクエリデータを用いて文書にタグ付けするシステム
CN1353840A (zh) 网页访问系统以及使用实名的方法
Ardö et al. A regional distributed WWW search and indexing service—the DESIRE way
JP2013222463A (ja) リファレンスウェブクロールの支援によるウェブコーパスの構築
CN1592280A (zh) 用于网页概括的网关
WO2001015004A2 (en) Service bureau architecture
CN1612524A (zh) 信息处理方法和信息处理装置
CN1922606A (zh) 用于面向用户的互联网导航的动态关键字处理系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041117

Termination date: 20110728