CN102201097A - 图群集 - Google Patents
图群集 Download PDFInfo
- Publication number
- CN102201097A CN102201097A CN2011100815278A CN201110081527A CN102201097A CN 102201097 A CN102201097 A CN 102201097A CN 2011100815278 A CN2011100815278 A CN 2011100815278A CN 201110081527 A CN201110081527 A CN 201110081527A CN 102201097 A CN102201097 A CN 102201097A
- Authority
- CN
- China
- Prior art keywords
- cluster
- entity
- participation
- summit
- objective function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
Abstract
各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而在计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。
Description
技术领域
本发明涉及图,尤其涉及图的群集。
背景技术
图(G)通常是包括一组顶点(V)和用于表示顶点之间关系的一组边(E)的结构。例如,参与图可用于基于共同条件、性质、参数、特征、活动、连接等使实体彼此相关。这种图可用于分析在多种场景中的对应数据集。这种场景的一个实例是在对于与来自服务提供者的资源相关的广告空间的在线广告拍卖的背景中。在广告拍卖的背景中,拍卖参与图是包括顶点和边的结构,顶点表示在拍卖中竞争的广告客户,当由两个顶点表示的广告客户通过一同参与拍卖而相关时边连接这两个顶点。拍卖参与图包含具有多个应用程序的大量信息,应用程序包括广告客户栏栅(flighting)、对广告客户的关键字建议、微市场分析等等。
通常,这种类型图的分析包括在图中找出有意义的子集或集群。对于示例性拍卖参与图,这可对应于对图进行群集以识别广告客户图中彼此具有相对较少交互的子市场。具体而言,群集可包括识别集群以优化某些目标函数。然而,随着图变得更大(更多顶点)且更密集(顶点之间的更多边),由于群集所涉及的计算量,对图进行群集变得相当困难。因此,用于对图进行直接群集的传统算法可能不能成功地对在某些场景中出现的较大较密集的图执行群集。
发明内容
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。
各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。
附图说明
图1示出其中可用图群集的一个或多个实施例的示例操作环境。
图2是描述根据一个或多个实施例的示例过程的流程图。
图3是描述根据一个或多个实施例的另一示例过程的流程图。
图4是描绘根据一个或多个实施例的示例参与图和对应二分图的示图。
图5是描绘根据一个或多个实施例的示例辅助图的构造的示图。
图6是可用于实现各种实施例的系统的框图。
具体实施方式
概览
各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。
在以下讨论中,题为“操作环境”的章节仅描述其中可采用各实施例的一个环境。接着,题为“图群集过程”的章节描述了根据一个或多个实施例的用于图群集的示例技术。接着,题为“图群集实施细节”的章节描述了根据一个或多个实施例的用于图群集的示例算法和实施。最后,提供了题为“示例系统”的章节并且该章节描述可用于实现一个或多个实施例的示例系统。
操作环境
图1在100处概括地示出根据一个或多个实施例的操作环境。环境100包括具有一个或多个处理器104、一个或多个计算机可读介质106和存储在计算机可读介质上并可由一个或多个处理器104执行的一个或多个应用程序108的服务提供者102。计算机可读介质106可包括,作为示例而非限制,通常与计算设备相关联的所有形式的易失性和非易失性存储器和/或存储介质。这种介质可包括ROM、RAM、闪存、硬盘、光盘、可移动介质等。计算机可读介质106也被描绘成存储也可由处理器104执行的操作系统110、服务管理器模块112、资源114(如内容、服务和数据)、以及群集工具116。尽管分开示出,但是群集工具116也可被实现为服务管理器模块112的组件。
服务提供者102可被实施为任何合适的计算设备或诸如以下设备的组合,例如但不限于:服务器、服务器场、设备的对等网络、台式计算机等。计算设备的一个具体示例在以下关于图6示出并描述。服务提供者102可通信上通过网络118耦合到各种其他实体(如设备、服务器、存储位置、客户机等)。具体来说,服务提供者102被示为通过网络118连接到提供广告122的广告客户120以及客户机124。广告客户120和客户机124可通过网络118与服务提供者102交互来获得对各种资源114的访问。虽然网络118被示为因特网,但是该网络可以采用各种各样的配置。例如,网络118可以包括广域网(WAN)、局域网(LAN)、无线网络、公共电话网和内联网等等。此外,虽然示出了单个网络118,但是网络118可被配置为包括多个网络。
服务管理器模块112表示可由服务提供者102操作来管理各种资源114的功能,可使各种资源114可通过网络118被获得。服务管理器模块112可管理对资源114的访问、资源114的性能、用户接口或数据的配置来提供资源114等等。例如,客户机124可形成资源请求126来传送到服务提供者102以获得相应的资源114。响应于接收到这样的请求,服务提供者102可经通过网络118传送的供由一个或多个客户机124输出的网页128和/或其他用户界面来提供各种资源114。
资源114可包括内容和/或服务的任何合适的组合,通常由一个或多个服务提供者使这些内容和/或服务通过网络可被获得。内容可包括文本、视频、广告、音频、多媒体流、动画、图像等的各种组合。服务的某些示例包括但不限于:搜索服务、发送和接收电子邮件的电子邮件服务、在客户机之间提供即时消息的即时消息通信服务、以及便于共享共同兴趣和活动的用户组之间的连接和交互的社交网络服务。服务还可包括配置成使得广告客户120投放广告122以连同资源114一起呈现给客户机104的广告服务。
例如,至少一些网页128可被配置成包括由广告客户120提供的广告122。通过广告服务使用选择和投递广告的任何合适的技术可选择广告122来包含在网页中。在一个示例中,可对网页128中保留的用于来自广告客户120的广告122的空间进行拍卖。
群集工具116被配置成实现此处描述的图群集技术的各方面。群集工具116可被配置成使用可通过服务提供者102收集、存储和/或访问的各种图数据130。虽然图1的示例图数据130被示为存储在服务提供者102的计算机可读介质106上,但是可以构想图数据130可以通过任何合适的设备被编译并被存储在任何合适的本地或网络存储位置上和/或从任何合适的本地或网络存储位置获得。图数据130可表示可用于构造图的各种数据集,接着图可以是群集工具116执行的分析对象。具体而言,拍卖群集工具116表示至少以下功能:使用图数据获得合适的图,将各种群集算法应用于图和/或以其它方式分析图,以及基于对图的分析来确认集群。注意,群集可包括对某些目标函数的优化。因此,也可实施群集工具116以使目标函数被定义。这里描述的群集算法然后可用于测试目标函数。对可通过群集工具116实施的目标函数和图群集技术的进一步讨论可参考以下附图得到。
已经考虑了示例操作环境,现在考虑对根据一个或多个实施例的示例图群集技术的讨论。
图群集过程
下面的讨论描述了可利用上述和下述的环境、系统和/或设备来实现的图群集技术。这些过程中每一过程的各方面可用硬件、固件、软件、或其组合来实现。这些过程被示为指定由一个或多个设备执行的操作的一组框,并且其不必限于所示由各框执行操作的顺序。在以下讨论的各部分中,可对图1的示例环境100做出参考。
图2是描述根据一个或多个实施例的示例过程200的流程图。在至少某些实施例中,过程200可由诸如图1的服务提供者102的适当配置的计算设备或具有图群集工具116的其它计算设备来执行。
步骤202获得表示实体之间的关系的参与图。这能发生的一种方式是通过群集工具116使用图数据130来构造图的操作。另外或作为替换,群集工具可被配置成从任何合适的源接收先前构造的图作为输入。然后,群集工具116使用各种算法对获得的图执行图群集技术。
注意,这里所用的图(G)是指包括一组顶点(V)和用于表示顶点之间关系的一组边(E)的结构。例如,参与图可用于基于共同条件、性质、参数、特征、活动、连接等使实体彼此相关。在用于与来自服务提供者102的资源114相关的广告空间的在线广告拍卖的背景中,拍卖参与图是包含顶点(A)和边(E)的结构,顶点表示在拍卖中竞争的广告客户,当两个顶点表示的广告客户通过一同参与拍卖而相关时边连接这两个顶点。
步骤204基于参与图构造辅助图。注意,参与图(如拍卖参与图)有时过于密集而不允许高效的分析。因此,为了进行更高效的分析,可实施群集工具116以构造对应于参与图的辅助图,辅助图易于操作且包括较少的计算以便分析。一般而言,辅助图被构造成包含较少的边,因此它没有对应的参与图密集。可构造的辅助图的一个实例是二分图,将参考以下附图作更详细的描述。然而,简而言之,二分图引入表示参与图中关系的顶点并将实体连接到关系顶点,而不是彼此连接。这样,可减少用于表示数据集的边的数目。
在至少一些实施例中,将另外的改变应用于二分图,以进一步优化图群集技术。以下在题为“图群集实施实例”的章节中描述了示例改变。
步骤206通过对为辅助图定义的目标函数求解来确定集群。例如,给定在步骤204中构造的辅助图,可在辅助图中通过对目标函数求解来确定集群。可实施群集工具116来使用被构造以优化群集的各种合适的目标函数。通常,可使用的合适的目标函数(1)测量被移除以形成集群的边的数目,(2)惩罚较大的集群。集群大小惩罚防止算法返回整个数据集作为群集的结果。这种类型的合适的目标函数产生的集群具有相对较多的集群内的边(紧密关系),具有相对较少的向外通向其它集群的边(与其它集群关系不密切),并具有合理的大小。具有这些特性的集群是理想的,因为这种集群表示经常交互和/或共享许多共同特性的实体的组合。在广告拍卖的背景中,集群可对应于隔离的子市场,它们被认为是各种市场分析的良好候选。关于合适目标函数的进一步细节可参考以下附图找到。
步骤208使用为辅助图确定的集群来确定对为参与图定义的相关目标函数求解的集群。群集工具116可被配置成基于通过对辅助图进行群集而获得集群来重构参与图中的集群。这可包括从辅助图中识别集群中包含的实体,并形成实体之间的边,以重构对应于参与图一部分的集群。
具体而言,可从为参与图定义的相关目标函数中导出用于对辅助图进行群集的目标函数。因此,如以下将要详细描述的,通过仔细设计用于群集的目标函数,从辅助图中导出的集群可直接用于获得对应于参与图的集群。在一些实施例中,如以上或以下讨论的,改变辅助图以优化群集。这些改变确定用于参与图和辅助图的目标函数之间的关系。
例如,当二分图用作图群集技术的基础时,群集的结果是一组表示连接到关系顶点的实体的顶点。通过根据实体到关系顶点的共享连接将实体彼此互连,可获得参与图的对应集群。这包括二分图和对应参与图之间的简单转换。
图3是描述根据一个或多个实施例的另一示例过程300的流程图。在至少某些实施例中,过程300可由诸如具有群集工具116的图1的服务提供者102之类的适当配置的计算设备来执行。具体而言,图3描述了可用于构造辅助图的示例过程。过程300的各部分是关于在广告客户120之间对广告空间的示例拍卖来描述的,广告空间可用于连同资源114一起向客户机124呈现广告122。在过程300的讨论中,可参考图4所示的示例参与图和对应的二分图。
步骤302获得无向二分图,它使用表示实体的顶点和表示关系的顶点之间的无向边将实体连接到实体的关系。这能发生的一种方式是通过群集工具116从对应的参与图或数据集生成二分图的操作。另外或作为替换,群集工具116能够产生或用其它方式直接从图数据130获得数据集的二分图。
现在考虑图4,它在400处概括地示出示例参与图402和对应的二分图404。参与图包括通过边408彼此连接的多个顶点406。在拍卖参与图的实例中,顶点406表示拍卖参与者(如广告客户102),当拍卖参与者一同参与了拍卖时边408连接对应的顶点。
可构造类似的图来表示各种关系。注意,实体间存在的关系可包括共同条件、性质、参数、特征、活动、连接等。作为实例而非限制,类似于参与图402的图可用于将网页与该网页共享的链接相关,将广告客户与关键词或搜索项相关,将拍卖参与者与位置相关,将网页与广告收入相关,或者用其它方式通过示出数据集的实体间存在的关系来表示数据集。
一般而言,二分图404引入表示参与图中关系的顶点410,并使用边412将实体连接到关系顶点410。继续拍卖参与图的实例,顶点410可表示拍卖。因此,当拍卖参与者参与拍卖时,二分图404中表示拍卖参与者的参与者顶点408通过边412连接到表示拍卖的顶点410。如图4所示,参与图402和对应二分图404之间的来回转换是直截了当的。注意,二分图404中的密度(边的数目)小于参与图402的密度。再一次,这可实现用于对二分图404进行群集的简化计算。
上述的二分图是这里所述的图群集技术的开始点。具体而言,作进一步改变以产生可使用上述或下述类型的目标函数进行有效群集的最佳的图。在以下图3的过程300的继续讨论中概括地描述这些改变的一些实例。关于示例改变的细节可在题为“图群集实施实例”的章节中找到。
现回到图3的讨论,步骤304通过用有向边替换无向图中的无向边创建有向图。换句话说,二分图顶点之间的边各自用在顶点之间相对方向行进的两条边替换。这类似于用两条单向路替换一条双向路。为了群集的目的,这使群集工具116能够区别地处理从实体(如广告客户)到关系(如拍卖)的连接和从关系(如拍卖)到实体(如广告客户)的连接。
步骤306为有向边分配方向权重。具体而言,群集工具116可根据边的方向为步骤306中形成的边分配权重。当应用图群集算法时,权重具有惩罚某些边和/或顶点从群集移除的效果。例如,权重可对应于通过切割对应边来移除顶点以产生集群的成本。因此,应用于有向边的方向权重可用于使在一个方向上的切割比在其它方向上的切割成本更高。在至少一些实施例中,将相对较高的权重分配给从实体到关系的边,并将相对较低的权重分配给从关系到实体的边。其效果是不容易将实体从邻近关系切割。例如,将权重无穷大分配给从广告客户到拍卖的边,并将权重1分配给从拍卖到广告客户的边。当然,可以使用边的权重的各种合适的值,并可以调节以微调图群集。虽然这里的一些实例使用无穷大的边权重,但实际上为简明起见可使用有限值。
步骤308通过用边将表示实体的顶点连接到任意汇点(sink vertex)来从有向图构造辅助二分图。这样,为包括在集群中的每个实体(如广告客户)创建成本。这是因为当群集进行时连接到任意汇点的边将断开。也可使用可调权重对到汇点的边进行加权。分配给到汇点的边的边权重在以下讨论中表示为α。
在步骤308之后,已经构造了可用作图群集技术的输入的辅助图。对于密集的图的一般群集问题被有效地简化为在相对稀疏的辅助图中找出集群的问题。具体而言,通过根据所述方式构造辅助二分图,群集问题被简化为创建最小化将被切割(即移除)以形成集群的边的数目的集群。在至少一些实施例中,这可通过群集工具116将最小割算法应用于用上述方式产生的辅助二分图来进行。
具体而言,步骤310选择实体中的一个作为目标,然后步骤312对该目标使用最小割以获得割的目标侧的顶点。在拍卖参与图的实例中,获得的结果是具有通过边连接到其所参与的拍卖的一组广告客户的集群。这是二分图的一个子集。现在,通过将产生的集群从二分图形式直接转换成参与图形式,可得到拍卖参与图的对应集群。以下章节将解决关于最小割算法的细节。
已经描述了涉及图群集的示例性过程,现在考虑可用此处描述的一个或多个实施例来实施的具体实施实例。
图群集实施实例
现在考虑对可使用上述设备和系统来利用的群集算法和实施的讨论。具体而言,考虑在拍卖参与图中找到集群的问题。更精确地,令A为一组广告客户。定义图G=(A,E),其中一组边是:
E={(a,b):a和b参与拍卖}
虽然以下技术是参考用拍卖参与图来使广告客户和拍卖相关的实例描述的,但是显而易见的是该技术可容易地应用于包含一组顶点(V)和表示顶点之间关系的一组边(E)的其它图(G)。换句话说,这里所述的图群集技术一般可用于具有G=(V,E)形式的图。
不幸的是,图G-(A,E)可能变得过于密集而不能进行高效地群集。为了这点,考虑广告客户a1,...,an参与的拍卖。这种拍卖将条边引入图中。对于一天的广告详细目录和对应拍卖的仅1%的采样,示例广告传递系统的通信量可包含100亿个边。另外,现有群集算法对于图G=(V,E)具有O(|V|2|E|)时间步量级的运行时间。因此,减少边可显著地改善图群集的性能。
为此,以上定义的参与图可用对应的二分图Gb=(A∪Q,Eb)替换,其中Q是一组拍卖,因此如果a参与拍卖q,则(a,q)∈Eb。图Gb被构造包含拍卖和广告客户之间的一条边,因此在假设一小组广告客户参与一个特定拍卖的情况下,图Gb是稀疏的。因此,图Gb的分析比参与图的分析更快且计算负担更少。
如以下将要详细描述的,可以示出在二分图Gb中找出低传导的小集群与在原始图G中找出小的低传导集群相关。严格地说,为二分图Gb导出的集群中的广告客户可直接用于构造参与图G的对应的集群为此,定义二分图Gb的目标函数,当它被求解时,也对原始图G的相关目标函数求解。
现在,假设g(H)相对于映射φ具有以下兼容性性质:
g(H)=g(φ(H)).
说明这的另一方式是g只是H中的广告客户的函数,或者函数g表示为g=g′(H∩A).。这样的函数的示例在以下讨论中提供。
假设存在Gb上的群集算法,它满足以下性质:
扩展eG的定义,可以得出:
这两个最小化问题具有大致相同的解决方案,即将θq最大化。另外,近似因子可示为其中∈是θq的上界,μ是随机变量X的均值。技术上,方差的最小化问题采用将θq最小化的解决方案,但是通过令θq′=1 θq可以得到目标函数的相同值。因此,集群在常数因子内对函数来说是最佳的。
群集二分拍卖参与图
基于上述内容,以下讨论考虑合适的算法,它能高效地产生满足命题A的所有假设的二分拍卖参与图的集群。该算法使得通过群集二分拍卖参与图,能够在参与图中找出广告客户的集群。以下关于用于导出群集算法的三个子算法(算法A、算法B、算法C)来描述算法。
事先考虑以下较简单的问题。给定无向图G=(V,E)和s∈V,找出使目标函数最小化的顶点(包含s)的子集其中a>0是一个常数。该算法称为最大流算法,在Flake,G.W.,R.E.Tarjan,和K.Tsioutsiouliklis的“图群集和最小切割树(Graph Clustering and Minimum Cut Trees)”中有讨论,因特网数学.1,(2003)第4期:285-408。如这里所讨论的,最大流算法可用于找出给定图的最小割。
对于算法A,构造辅助图G=(V∪{t},E∪{(υ,t):υ∈V}),其中t是新任意汇点,边的权重被设置为w(υ,t)=α。现在使用最大流算法,计算G′中的最小s-t割。H被定义为割的s侧的一组顶点。通过定义最小割,这给出集合H,其中s∈H,使得被最小化(因为后者是割的容量)。
在上述算法A的应用中,获得优化目标函数的集群。这里,函数g(H)=α|H|,根据前一章节中的符号。然而,该函数相对于上述映射φ不满足兼容性性质。因此,仅仅将最小割应用于G′是不够的。然而,如下所示,可相对于函数来优化集群。由于函数g(H)=a|H∩A|满足命题A所要求的兼容性性质,该优化朝具有满足该命题的假设的群集算法的目标更进一步。
对于算法B,再次考虑G=(A∪Q,E)形式的二分图。为了获得找出使目标函数最小化的集群H(其中s∈H)的算法,通过构造辅助图G″=(A∪Q∪{t},E∪{(υ,t):υ∈A}并根据w(υ,t)=α设置边权重来进行简化。现在,将算法A应用于G″,以得出使目标函数最小化的集群H。
对于算法C,注意用算法B产生的集群可能不满足以下性质:如果a∈H∩A是集群中的广告客户,那么为了补救这点,可有向地调节G中边的权重。具体而言,每当(a,q)∈E,则令w(a,q)=∞,其中a是广告客户,q是拍卖,如果n个广告客户参与G中的拍卖q,则w(q,a)具有权重该具有新有向边权重的图被称为现在,将算法B应用于产生使最小化的H。这种集群H具有性质这为真,因为如果Γ(a)包含不属于H的拍卖q,那么由于有向加权边,目标函数是无穷大。这与目标函数的最小化性相矛盾(因为通过将Γ(a)加入H,它可以是有限的)。
图5示出根据上述算法形成的扩充图的构造。具体而言,图5示出二分图,其中一组广告客户A位于左侧,一组拍卖Q位于右侧。A和Q之间的边是已经被分配了方向权重的有向边。在图5的实例中,从广告客户到拍卖的边的权重被设为∞,从拍卖到广告客户的边的权重被设置为有限值,例如,如果n个广告客户参与相应的拍卖,则权重表示广告客户的顶点也示为被连接到汇点t,这些边的权重被设置为α。
现存,可说明关于使用图Gb对图G的目标函数求解的第二命题。对于命题 B,令H为输入为Gb=(A∪Q,Eb)时算法C的输出,然后H∩A在广告客户参与图G=(A,E)上最小化目标函数
为建立命题B的证明,群集算法C满足上述命题A的所有假设,因此结论符合。■
注意,为了使以上证明成功,可以使用∞以外的边权重。使w(a,q)>maxq deg(q)=1(由于权重归一化)是足够的。因此,在实践中,当对引入图Gb的有向边有向地加权时,可以使用非无穷大的权重来应用这里所述的图群集技术。
示例系统
图6在600一般地示出可以实现上述各实施例的示例计算设备602。计算设备602可以是例如图1的客户机124、服务提供者102的服务器、广告客户120的服务器,或任何其他合适的计算设备。
计算设备602包括一个或多个处理器或处理单元604、一个或多个存储器和/或存储组件606、用于输入/输出(I/O)设备的一个或多个输入/输出(I/O)接口608、以及允许各组件和设备彼此通信的总线610。总线610代表若干类型的总线结构中的一个或多个,包括存储器总线或存储器控制器、外围总线、加速图形端口以及使用各种总线体系结构中的任一种的处理器或局部总线。总线610可包括有线和/或无线总线。
存储器/存储组件606表示一个或多个计算机存储介质。存储器/存储组件606可包括易失性介质(如随机存取存储器(RAM))和/或非易失性介质(如只读存储器(ROM)、闪存、光盘、磁盘等等)。存储器/存储组件606可包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如闪存驱动器、可移动硬盘驱动器、光盘等等)。
一个或多个输入/输出接口608允许用户向计算设备600输入命令和信息,并且还允许使用各种输入/输出设备向用户和/或其他组件或设备呈现信息。输入设备的示例包括键盘、光标控制设备(例如鼠标)、话筒、扫描仪等。输出设备的示例包括显示设备(例如监视器或投影仪)、扬声器、打印机、网卡等。
各种技术在此可以在软件或程序模块的一般上下文中描述。一般而言,软件包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。这些模块和技术的实现可以存储在某种形式的计算机可读介质上或通过某种形式的计算机可读介质传输。计算机可读介质可包括各种可获得的介质或可由计算设备访问的介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”。
包括图群集工具116、应用程序108、服务管理器模块112、操作系统110的软件或程序模块以及其他程序模块可被实现为存储在计算机可读存储介质上的一个或多个指令。计算设备602可被配置成实现对应于存储在计算机可读存储介质上的软件或模块的特定功能。这些指令可由一个或多个制品(如一个或多个计算设备602和/或处理器604)来执行,以实现用于图群集的技术以及其他技术。这些技术包括但不限于这里所述的示例过程。因此,计算机可读存储介质可被配置成存储指令,当由这里所述的一个或多个设备执行指令时,产生用于图群集的各种技术。
计算机可读存储介质包括以适合于存储如计算机可读指令、数据结构、程序模块或其他数据等信息的方法或技术来实现的易失性和非易失性、可移动和不可移动介质。该计算机可读存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、硬盘、磁带盒、磁带、磁盘存储或其它磁存储设备、或者可适用于存储所需信息并可由计算机访问的另一有形介质或制品。
结论
虽然已经用对结构特征和/或方法步骤专用的语言描述了本发明,但是应当理解,所附权利要求书中定义的本发明不必限于所描述的具体特征或步骤。相反,各具体特征和步骤是作为实现所要求保护的本发明的优选形式来公开的。
Claims (15)
1.一种计算机实现的方法,包括:
获得表示实体之间的关系的参与图(202);
至少通过以下步骤基于所述参与图构造辅助图(204):
形成对应于所述参与图的二分图;
用有向边替换所述二分图中的无向边;
向所述有向边分配方向权重;以及
将表示所述实体的顶点连接到任意汇点;
通过对为所述辅助图定义的目标函数求解来确定集群(206);以及
使用为所述辅助图确定的所述集群来确定对为所述参与图定义的相关目标函数求解的集群(208)。
2.如权利要求1所述的计算机实现的方法,其特征在于,通过对目标函数求解来确定集群包括将最小割算法应用于所构造的辅助图。
3.如权利要求2所述的计算机实现的方法,其特征在于,应用最小割算法的步骤包括选择所述辅助图的实体中的一个作为目标,并对所述目标使用最小割算法以获得具有位于所述割中包括目标的一侧的一组顶点的集群。
4.如权利要求1所述的计算机实现的方法,其特征在于,所述实体包括在线拍卖的参与者,当参与者在同一拍卖中竞争时所述关系使参与者相关。
5.如权利要求1所述的计算机实现的方法,其特征在于,还包括通过转换为参与图定义的相关目标函数,导出为辅助图定义的目标函数。
6.如权利要求2所述的计算机实现的方法,其特征在于,所述辅助图被配置成没有所述参与图密集。
7.如权利要求1所述的计算机实现的方法,其特征在于:
所述参与图被配置成用对应于所述实体之间关系的边来连接表示所述实体的顶点;以及
构造辅助图包括将所述参与图转换成对应于所述参与图的二分图,所述二分图被配置成具有表示所述实体的所述顶点和被引入以表示所述实体之间的关系的额外顶点之间的边。
10.如权利要求1所述的计算机实现的方法,其特征在于,构造所述辅助图包括引入所述有向边,并有向地加权所述有向边,使得从实体到关系的边与从关系到实体的边相比具有相对较高的权重。
11.如权利要求1所述的计算机实现的方法,其特征在于,所述目标函数被配置成测量被移除以形成集群的边的数目并惩罚大集群。
12.一个或多个存储指令的计算机可读存储介质(106),当由一个或多个服务器设备执行时,使得所述一个或多个服务器设备实现群集工具(116),所述群集工具被配置成:
获得无向二分图,它使用表示实体的顶点和表示关系的顶点之间的无向边将实体连接到该实体的关系(302);
通过用有向边替换所述无向图中的所述无向边来创建有向图(304);
为所述有向边分配方向权重(306);
通过将表示实体的所述顶点连接到任意汇点来从所述有向图构造辅助二分图(308);
选择所述实体中的一个作为目标(310);
对所述目标使用最小割算法,以获得具有位于所述割包括目标的一侧的一组顶点的集群。
14.如权利要求12所述的一个或多个计算机可读存储介质,其特征在于,分配方向权重包括将相对较高的权重分配给从实体到关系的边,并将相对较低的权重分配给从关系到实体的边。
15.如权利要求12所述的一个或多个计算机可读存储介质,其特征在于,所述群集工具还被配置成使用在所述割的目标侧获得的一组顶点来确定所述辅助图的集群,其中所获得的集群对为辅助二分图定义的目标函数和为参与图定义的相关目标函数两者求解,所述参与图被配置成用对应于所述实体之间关系的边来连接表示所述实体的顶点。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/748,014 | 2010-03-26 | ||
US12/748,014 US8922559B2 (en) | 2010-03-26 | 2010-03-26 | Graph clustering |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102201097A true CN102201097A (zh) | 2011-09-28 |
CN102201097B CN102201097B (zh) | 2017-05-03 |
Family
ID=44655854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110081527.8A Active CN102201097B (zh) | 2010-03-26 | 2011-03-25 | 图群集 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8922559B2 (zh) |
CN (1) | CN102201097B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239126A (zh) * | 2013-06-19 | 2014-12-24 | 华为技术有限公司 | 一种有向图的最小割获取方法及设备 |
CN113595827A (zh) * | 2021-07-29 | 2021-11-02 | 北京百度网讯科技有限公司 | 云网络监控方法和装置、电子设备、计算机介质 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102005030073A1 (de) * | 2005-06-27 | 2006-12-28 | Airbus Deutschland Gmbh | Fehlertolerantes Datenübertragungssystem in einem Passagierflugzeug |
US20110238490A1 (en) * | 2010-03-25 | 2011-09-29 | Microsoft Corporation | Auction flighting |
US9292545B2 (en) * | 2011-02-22 | 2016-03-22 | Thomson Reuters Global Resources | Entity fingerprints |
US9009318B2 (en) | 2011-11-03 | 2015-04-14 | Microsoft Corporation | Offline resource allocation algorithms |
US9092266B2 (en) * | 2011-12-13 | 2015-07-28 | Microsoft Technology Licensing, Llc | Scalable scheduling for distributed data processing |
JP5825122B2 (ja) * | 2012-01-31 | 2015-12-02 | 富士通株式会社 | 生成プログラム、生成方法、および生成システム |
US8799192B2 (en) * | 2012-02-28 | 2014-08-05 | Hewlett-Packard Development Company, L.P. | Deriving a nested chain of densest subgraphs from a graph |
US9313533B2 (en) * | 2012-09-19 | 2016-04-12 | Hulu, LLC | Ad inventory management system |
US9652875B2 (en) | 2012-10-29 | 2017-05-16 | Yahoo! Inc. | Systems and methods for generating a dense graph |
US10198834B2 (en) * | 2013-04-29 | 2019-02-05 | Microsoft Technology Licensing, Llc | Graph partitioning for massive scale graphs |
US9183387B1 (en) * | 2013-06-05 | 2015-11-10 | Google Inc. | Systems and methods for detecting online attacks |
US9798829B1 (en) * | 2013-10-22 | 2017-10-24 | Google Inc. | Data graph interface |
US9471391B1 (en) | 2013-11-20 | 2016-10-18 | Google Inc. | Aggregating resource requests |
US9596321B2 (en) * | 2015-06-24 | 2017-03-14 | Cisco Technology, Inc. | Server grouping system |
WO2017068228A1 (en) * | 2015-10-19 | 2017-04-27 | Nokia Technologies Oy | Method and apparatus for optimization |
US10409560B1 (en) * | 2015-11-18 | 2019-09-10 | Amazon Technologies, Inc. | Acceleration techniques for graph analysis programs |
CN106326345B (zh) * | 2016-08-08 | 2019-11-01 | 浙江工业大学 | 一种基于用户行为的社交网络中朋友关系挖掘方法 |
US10459929B2 (en) | 2017-03-16 | 2019-10-29 | Raytheon Company | Quantifying robustness of a system architecture by analyzing a property graph data model representing the system architecture |
US10430463B2 (en) | 2017-03-16 | 2019-10-01 | Raytheon Company | Systems and methods for generating a weighted property graph data model representing a system architecture |
US10496704B2 (en) * | 2017-03-16 | 2019-12-03 | Raytheon Company | Quantifying consistency of a system architecture by comparing analyses of property graph data models representing different versions of the system architecture |
US10430462B2 (en) | 2017-03-16 | 2019-10-01 | Raytheon Company | Systems and methods for generating a property graph data model representing a system architecture |
US10642867B2 (en) * | 2017-09-15 | 2020-05-05 | Adobe Inc. | Clustering based on a directed graph |
US10706103B2 (en) | 2018-01-30 | 2020-07-07 | Microsoft Technology Licensing, Llc | System and method for hierarchical distributed processing of large bipartite graphs |
CN108768718B (zh) * | 2018-05-23 | 2021-07-20 | 湖南女子学院 | 基于mRNA/miRNA节点的二分网络模块识别方法、系统及存储介质 |
US11847669B2 (en) | 2020-01-30 | 2023-12-19 | Walmart Apollo, Llc | Systems and methods for keyword categorization |
US11636417B2 (en) * | 2020-12-17 | 2023-04-25 | International Business Machines Corporation | Cognitive analysis for enterprise decision meta model |
US11307915B1 (en) * | 2021-04-29 | 2022-04-19 | International Business Machines Corporation | Grouping anomalous components of a distributed application |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040267686A1 (en) * | 2003-06-24 | 2004-12-30 | Jennifer Chayes | News group clustering based on cross-post graph |
CN1717659A (zh) * | 2002-11-27 | 2006-01-04 | 甲骨文国际公司 | 具有互联的集群系统及方法 |
US20070214115A1 (en) * | 2006-03-13 | 2007-09-13 | Microsoft Corporation | Event detection based on evolution of click-through data |
CN101256510A (zh) * | 2008-04-11 | 2008-09-03 | 中兴通讯股份有限公司 | 一种集群系统及实现其集中管理的方法 |
US20080256034A1 (en) * | 2007-04-10 | 2008-10-16 | Chi-Chao Chang | System and method for understanding relationships between keywords and advertisements |
Family Cites Families (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6714975B1 (en) * | 1997-03-31 | 2004-03-30 | International Business Machines Corporation | Method for targeted advertising on the web based on accumulated self-learning data, clustering users and semantic node graph techniques |
US6044361A (en) | 1998-03-24 | 2000-03-28 | International Business Machines Corporation | Fast inventory matching algorithm for the process industry |
US6665653B1 (en) | 1999-07-03 | 2003-12-16 | Microsoft Corporation | Noise reduction for a cluster-based approach for targeted item delivery with inventory management |
US20040010592A1 (en) | 2000-01-14 | 2004-01-15 | Carver Andrew Richard | Resource allocation |
US20030236745A1 (en) | 2000-03-03 | 2003-12-25 | Hartsell Neal D | Systems and methods for billing in information management environments |
US20020049608A1 (en) | 2000-03-03 | 2002-04-25 | Hartsell Neal D. | Systems and methods for providing differentiated business services in information management environments |
US6990459B2 (en) * | 2000-08-22 | 2006-01-24 | Deere & Company | System and method for developing a farm management plan for production agriculture |
US7546249B2 (en) | 2001-02-06 | 2009-06-09 | Yahoo! Inc. | System and method for managing advertising inventory to maximize advertising revenue |
US7512940B2 (en) * | 2001-03-29 | 2009-03-31 | Microsoft Corporation | Methods and apparatus for downloading and/or distributing information and/or software resources based on expected utility |
US7123588B2 (en) * | 2001-06-04 | 2006-10-17 | Lucent Technologies Inc. | Decision support mechanisms for bandwidth commerce in communication networks |
US7398232B2 (en) | 2001-11-14 | 2008-07-08 | Sap Aktiengesellschaft | Inventory early warning agent in a supply chain management system |
US7039931B2 (en) | 2002-05-30 | 2006-05-02 | Nielsen Media Research, Inc. | Multi-market broadcast tracking, management and reporting method and system |
US7613454B2 (en) | 2002-07-08 | 2009-11-03 | Huawei Technologies Co., Ltd. | Network and method of realizing local roaming for subscribers |
US20040044571A1 (en) | 2002-08-27 | 2004-03-04 | Bronnimann Eric Robert | Method and system for providing advertising listing variance in distribution feeds over the internet to maximize revenue to the advertising distributor |
US7622779B2 (en) * | 2002-09-10 | 2009-11-24 | The Regents Of The University Of California | Interconnection architecture and method of assessing interconnection architecture |
US8224689B1 (en) | 2003-01-10 | 2012-07-17 | Google Inc. | Estimating inventory, user behavior, and/or cost and presentation attributes for an advertisement for use with an advertising system |
US7454270B2 (en) * | 2003-05-13 | 2008-11-18 | Siemens Power Transmission & Distribution, Inc. | Dynamic economic dispatch for the management of a power distribution system |
US7581008B2 (en) * | 2003-11-12 | 2009-08-25 | Hewlett-Packard Development Company, L.P. | System and method for allocating server resources |
US20050144065A1 (en) | 2003-12-19 | 2005-06-30 | Palo Alto Research Center Incorporated | Keyword advertisement management with coordinated bidding among advertisers |
US7941427B2 (en) | 2004-04-14 | 2011-05-10 | International Business Machines Corporation | Dynamically managing computer resources based on valuations of work items being processed |
US20060080171A1 (en) | 2004-10-08 | 2006-04-13 | Jardins G T D | Managing advertising inventory |
US8081549B2 (en) * | 2005-03-14 | 2011-12-20 | Ricoh Company, Ltd. | Information recording and reproducing apparatus and a method of controlling an information recording and reproducing apparatus |
US20060253327A1 (en) | 2005-05-06 | 2006-11-09 | Morris James T | Optimized advertising fulfillment |
US20070016918A1 (en) | 2005-05-20 | 2007-01-18 | Alcorn Allan E | Detecting and tracking advertisements |
US8706546B2 (en) | 2005-07-18 | 2014-04-22 | Google Inc. | Selecting and/or scoring content-relevant advertisements |
US7840438B2 (en) * | 2005-07-29 | 2010-11-23 | Yahoo! Inc. | System and method for discounting of historical click through data for multiple versions of an advertisement |
CA2622290C (en) | 2005-09-13 | 2017-07-04 | Ozb2B Pty Ltd | Multiple option auction method and system |
WO2007041159A2 (en) | 2005-09-29 | 2007-04-12 | Mmi Advertising, Llc | On-line process for bidding on advertising spots |
US20070118432A1 (en) | 2005-11-21 | 2007-05-24 | Vijay Vazirani | Systems and methods for optimizing revenue in search engine auctions |
JP2007164536A (ja) | 2005-12-14 | 2007-06-28 | Toshiba Corp | 半導体集積回路の設計支援システム、半導体集積回路の設計方法、半導体集積回路の設計支援プログラム及び半導体集積回路の製造方法 |
US7627878B2 (en) | 2005-12-23 | 2009-12-01 | Eloda Inc. | Method and System for automated auditing of advertising |
US20070198350A1 (en) * | 2006-01-31 | 2007-08-23 | O'kelley Charles Brian | Global constraints in open exchange platforms |
US7752233B2 (en) * | 2006-03-29 | 2010-07-06 | Massachusetts Institute Of Technology | Techniques for clustering a set of objects |
US20070256095A1 (en) * | 2006-04-27 | 2007-11-01 | Collins Robert J | System and method for the normalization of advertising metrics |
US20070255690A1 (en) | 2006-04-28 | 2007-11-01 | Chi-Chao Chang | System and method for forecasting the performance of advertisements |
US7689695B2 (en) | 2006-06-28 | 2010-03-30 | International Business Machines Corporation | System and method for distributed utility optimization in a messaging infrastructure |
US20080004990A1 (en) | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Virtual spot market for advertisements |
US7738984B2 (en) * | 2006-09-12 | 2010-06-15 | International Business Machines Corporation | System for and method of interpolation for supply chain planning |
US20080080396A1 (en) | 2006-09-28 | 2008-04-03 | Microsoft Corporation | Marketplace for cloud services resources |
US8082549B2 (en) * | 2006-11-08 | 2011-12-20 | Board Of Regents, The University Of Texas System | System, method and apparatus for allocating resources by constraint selection |
US20080256056A1 (en) | 2007-04-10 | 2008-10-16 | Yahoo! Inc. | System for building a data structure representing a network of users and advertisers |
US7904461B2 (en) * | 2007-05-01 | 2011-03-08 | Google Inc. | Advertiser and user association |
US20090144168A1 (en) | 2007-07-13 | 2009-06-04 | Grouf Nicholas A | Methods and systems for searching across disparate databases |
US20090037267A1 (en) | 2007-08-01 | 2009-02-05 | Google Inc. | Customized Distribution of Advertising Impressions |
US8001004B2 (en) | 2007-08-18 | 2011-08-16 | Traffiq, Inc. | System and method for brokering the sale of internet advertisement inventory |
US20090070177A1 (en) | 2007-09-10 | 2009-03-12 | Deepak Agarwal | System and Method for Optimally Allocating Overlapping Inventory |
US8234139B2 (en) * | 2007-10-15 | 2012-07-31 | Oracle International Corporation | Process manufacturing with least cost formulation |
US7788210B2 (en) * | 2007-10-19 | 2010-08-31 | Yahoo! Inc. | Locating dense and isolated sub-graphs through constructing auxiliary weighted graph |
KR100993417B1 (ko) * | 2007-12-12 | 2010-11-09 | 아주대학교산학협력단 | 중첩코딩을 이용하여 연속적인 전송이 가능한 릴레이네트워크 및 엔티티 |
WO2009120873A2 (en) | 2008-03-26 | 2009-10-01 | Google Inc. | Frequency-aware spot selection for content campaigns |
US9727878B2 (en) | 2008-04-03 | 2017-08-08 | Iheartmedia Management Services, Inc. | Maximizing advertising performance |
US20090313120A1 (en) | 2008-06-13 | 2009-12-17 | Google Inc. | Goal-Based Front End Buying of Radio Advertisements |
US20100042496A1 (en) | 2008-08-13 | 2010-02-18 | Disney Enterprises, Inc. | Advertising inventory management system and method |
US8639392B2 (en) | 2008-09-29 | 2014-01-28 | Battelle Memorial Institute | Electric power grid control using a market-based resource allocation system |
US8311886B2 (en) | 2008-09-30 | 2012-11-13 | Yahoo! Inc. | System for display advertising optimization with uncertain supply |
US20100082412A1 (en) | 2008-09-30 | 2010-04-01 | Yahoo! Inc. | System and method for optimizing an advertisement plan for allocating advertisements to a contract in a network-based environment |
US20100082393A1 (en) | 2008-09-30 | 2010-04-01 | Yahoo! Inc. | Display advertising contract pricing |
US8239538B2 (en) | 2008-11-21 | 2012-08-07 | Samsung Electronics Co., Ltd. | Execution allocation cost assessment for computing systems and environments including elastic computing systems and environments |
US8209742B2 (en) * | 2009-01-07 | 2012-06-26 | Hewlett-Packard Development Company, L.P. | Computer-implemented method for obtaining a minimum biclique cover in a bipartite dataset |
US8155990B2 (en) | 2009-01-26 | 2012-04-10 | Microsoft Corporation | Linear-program formulation for optimizing inventory allocation |
US8620752B2 (en) | 2009-05-22 | 2013-12-31 | Google Inc. | Advertisement allocation |
US8700752B2 (en) * | 2009-11-03 | 2014-04-15 | International Business Machines Corporation | Optimized efficient LPAR capacity consolidation |
US20110126197A1 (en) | 2009-11-25 | 2011-05-26 | Novell, Inc. | System and method for controlling cloud and virtualized data centers in an intelligent workload management system |
US8316194B2 (en) * | 2009-12-15 | 2012-11-20 | Intel Corporation | Mechanisms to accelerate transactions using buffered stores |
US8896604B2 (en) * | 2010-01-29 | 2014-11-25 | Yahoo! Inc. | Producing optimization graphs in online advertising systems |
US20110208559A1 (en) * | 2010-02-24 | 2011-08-25 | Marcus Fontoura | Automatic Management of Networked Publisher-Subscriber Relationships |
US20110231215A1 (en) | 2010-03-16 | 2011-09-22 | Santos Cipriano A | Optimization of a resource matching model by mapping a model to a bipartite graph |
US20110238490A1 (en) | 2010-03-25 | 2011-09-29 | Microsoft Corporation | Auction flighting |
US20110246312A1 (en) | 2010-03-31 | 2011-10-06 | Microsoft Corporation | Advertisement inventory matching |
US20110251889A1 (en) | 2010-04-09 | 2011-10-13 | Microsoft Corporation | Inventory clustering |
US20110258045A1 (en) | 2010-04-16 | 2011-10-20 | Microsoft Corporation | Inventory management |
US8352611B2 (en) | 2010-06-29 | 2013-01-08 | International Business Machines Corporation | Allocating computer resources in a cloud environment |
US20130013357A1 (en) | 2011-07-05 | 2013-01-10 | International Business Machines Corporation | Uniformly Managing Resources and Business Operations |
US9009318B2 (en) | 2011-11-03 | 2015-04-14 | Microsoft Corporation | Offline resource allocation algorithms |
US20130117062A1 (en) | 2011-11-03 | 2013-05-09 | Microsoft Corporation | Online resource allocation algorithms |
-
2010
- 2010-03-26 US US12/748,014 patent/US8922559B2/en active Active
-
2011
- 2011-03-25 CN CN201110081527.8A patent/CN102201097B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1717659A (zh) * | 2002-11-27 | 2006-01-04 | 甲骨文国际公司 | 具有互联的集群系统及方法 |
US20040267686A1 (en) * | 2003-06-24 | 2004-12-30 | Jennifer Chayes | News group clustering based on cross-post graph |
US20070214115A1 (en) * | 2006-03-13 | 2007-09-13 | Microsoft Corporation | Event detection based on evolution of click-through data |
US20080256034A1 (en) * | 2007-04-10 | 2008-10-16 | Chi-Chao Chang | System and method for understanding relationships between keywords and advertisements |
CN101256510A (zh) * | 2008-04-11 | 2008-09-03 | 中兴通讯股份有限公司 | 一种集群系统及实现其集中管理的方法 |
Non-Patent Citations (1)
Title |
---|
JOHN JOSEPH CARRASCO 等: "Clustering of bipartite advertiser-keyword graph", 《3TH IEEE INTERNATIONAL CONFERENCE ON DATA MINING》, 22 November 2003 (2003-11-22) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239126A (zh) * | 2013-06-19 | 2014-12-24 | 华为技术有限公司 | 一种有向图的最小割获取方法及设备 |
CN104239126B (zh) * | 2013-06-19 | 2018-03-13 | 华为技术有限公司 | 一种有向图的最小割获取方法及设备 |
CN113595827A (zh) * | 2021-07-29 | 2021-11-02 | 北京百度网讯科技有限公司 | 云网络监控方法和装置、电子设备、计算机介质 |
CN113595827B (zh) * | 2021-07-29 | 2023-02-21 | 北京百度网讯科技有限公司 | 云网络监控方法和装置、电子设备、计算机介质 |
Also Published As
Publication number | Publication date |
---|---|
US8922559B2 (en) | 2014-12-30 |
CN102201097B (zh) | 2017-05-03 |
US20110234594A1 (en) | 2011-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102201097A (zh) | 图群集 | |
Yun et al. | Accurate, scalable cohort variant calls using DeepVariant and GLnexus | |
Barkas et al. | Joint analysis of heterogeneous single-cell RNA-seq dataset collections | |
Cadena et al. | Issues and perspectives in species delimitation using phenotypic data: Atlantean evolution in Darwin’s finches | |
Mostafavi et al. | Fast integration of heterogeneous data sources for predicting gene function with limited annotation | |
Aberer et al. | ExaBayes: massively parallel Bayesian tree inference for the whole-genome era | |
Hashemifar et al. | Hubalign: an accurate and efficient method for global alignment of protein–protein interaction networks | |
Minh et al. | Ultrafast approximation for phylogenetic bootstrap | |
Satas et al. | Tumor phylogeny inference using tree-constrained importance sampling | |
Ciccolella et al. | Inferring cancer progression from single-cell sequencing while allowing mutation losses | |
WO2021174944A1 (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
Hilker et al. | UniMoG—a unifying framework for genomic distance calculation and sorting based on DCJ | |
Grotkjær et al. | Robust multi-scale clustering of large DNA microarray datasets with the consensus algorithm | |
US11257110B2 (en) | Augmenting missing values in historical or market data for deals | |
Sakas et al. | The effects of logistics websites’ technical factors on the optimization of digital marketing strategies and corporate brand name | |
Ciortan et al. | GNN-based embedding for clustering scRNA-seq data | |
US20170017749A1 (en) | System and method for identifying cancer driver genes | |
Haag et al. | From easy to hopeless—predicting the difficulty of phylogenetic analyses | |
Huang et al. | TreeScaper: visualizing and extracting phylogenetic signal from sets of trees | |
CN102214344A (zh) | 清单群集 | |
Eickmeyer et al. | On the optimality of the neighbor-joining algorithm | |
Dibaeinia et al. | FASTRAL: improving scalability of phylogenomic analysis | |
Yip et al. | Training set expansion: an approach to improving the reconstruction of biological networks from limited and uneven reliable interactions | |
Yan et al. | bmVAE: a variational autoencoder method for clustering single-cell mutation data | |
Yang et al. | A robust method for inferring network structures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150728 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20150728 Address after: Washington State Applicant after: Micro soft technique license Co., Ltd Address before: Washington State Applicant before: Microsoft Corp. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |