CN104160712A - 计算媒体节目之间的相似度 - Google Patents

计算媒体节目之间的相似度 Download PDF

Info

Publication number
CN104160712A
CN104160712A CN201280062329.XA CN201280062329A CN104160712A CN 104160712 A CN104160712 A CN 104160712A CN 201280062329 A CN201280062329 A CN 201280062329A CN 104160712 A CN104160712 A CN 104160712A
Authority
CN
China
Prior art keywords
token
fields
metadata
media program
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280062329.XA
Other languages
English (en)
Other versions
CN104160712B (zh
Inventor
G·格罗瓦蒂
M·布拉佐佐斯基
M·维埃尔古斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN104160712A publication Critical patent/CN104160712A/zh
Application granted granted Critical
Publication of CN104160712B publication Critical patent/CN104160712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors

Abstract

本发明提供关联或比较媒体节目的系统和方法。方法包括:使用至少一个处理电路,获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;使用至少一个处理电路,从所述多个第一字段中的一个提取多个第一令牌,以及从所述多个第二字段中的一个提取多个第二令牌;向所述第一令牌和所述第二令牌中的每一个指定权重因数;在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及,基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。

Description

计算媒体节目之间的相似度
对相关申请的交叉引用
本申请要求2012年5月9日提交的美国专利申请No.13/467,339的优先权,后者要求2011年10月30日提交的美国临时专利申请No.61/553,221的优先权。美国专利申请No.13/467,339和美国临时专利申请No.61/553,221两者的全部内容都被包括作为参考。
背景技术
本说明书一般涉及媒体节目,具体来说,涉及确定电视节目之间的关系。
因特网提供了对各种源,诸如视频文件、音频文件、图片、业务和联系人信息、产品信息、地图以及新闻文章的访问。访问这些源会产生诸如广告机会之类的商业机会。虽然文本数据在因特网的早期是流行的,但是,随着带宽的增大,诸如视频和音频文件之类的媒体节目变得越来越流行。
发明内容
一方面,提供关联媒体节目的计算机实现的方法。该方法可以包括:(A)使用至少一个处理电路,获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;(B)使用至少一个处理电路,从所述多个第一字段中的每一个提取多个第一令牌,以及从所述多个第二字段中的每一个提取多个第二令牌;(C)向所述第一令牌和所述第二令牌中的每一个指定权重因数;(D)在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及(E)基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。
在一种实现中,(D)包括:(F)基于所述第一令牌和它们相应的权重因数,构建表示所述多个第一字段中的一个的第一矢量,以及基于所述第二令牌和它们相应的权重因数,构建表示所述多个第二字段中的一个的第二矢量;(G)计算表明所述多个第一字段中的所述一个和所述多个第二字段中的所述一个之间的相似度的所述第一矢量和所述第二矢量的点积;以及,(H)对于所述多个第一字段和多个第二字段中的全部执行(F)和(G),其中,基于将从(H)中获取的多个点积相加,计算所述相似度分数。
在一种实现中,多个第一字段中的一个和多个第二字段中的一个分别表示第一媒体节目和第二媒体节目的演员表,并且其中,多个第一令牌和多个第二令牌分别表示第一媒体节目和第二媒体节目中的多个演员。该方法还可以包括基于相似度分数,向用户提供媒体节目的建议。
在一种实现中,该方法包括计算每一个字段内的所述第一令牌和所述第二令牌中的每一个的第一出现频率;以及计算跨不同字段的所述第一令牌和所述第二令牌中的每一个的第二出现频率,其中,可以基于所计算的第一频率和第二频率,指定每一个令牌的所述权重因数。
在一种实现中,该方法包括调整所述权重因数中的至少一个以对选定的令牌给出权重。
在一种实现中,该方法包括使用权重矩阵,互相关所述第一元数据和所述第二元数据之间的不同字段。
在一种实现中,该方法包括计算所述第一媒体节目和多个媒体节目中的每一个之间的相似度分数。在一种实现中,该方法包括基于相似度分数,排序多个媒体节目。
在一种实现中,该方法包括基于所述第一媒体节目从用户那里接收评价;以及,基于排序预测对所述多个媒体节目的所述用户的评价。
在一种实现中,在基本上一致的数据库内获取第一元数据和第二元数据。
在另一种实现中,从多个异构数据库中获取第一元数据和第二元数据。
在另一方面,提供在其上存储指令的非瞬时的计算机可读介质。这些指令当被执行时,可以导致至少一个处理器执行多个操作,包括:(A)获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;(B)从所述多个第一字段中的一个提取多个第一令牌,以及从所述多个第二字段中的一个提取多个第二令牌;(C)向所述第一令牌和所述第二令牌中的每一个指定权重因数;(D)在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及(E)基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。
在一种实现中,(D)包括:(F)基于所述第一令牌和它们相应的权重因数,构建表示所述多个第一字段中的一个的第一矢量,以及基于所述第二令牌和它们相应的权重因数,构建表示所述多个第二字段中的一个的第二矢量;(G)计算表明所述多个第一字段中的所述一个和所述多个第二字段中的所述一个之间的相似度的所述第一矢量和所述第二矢量的点积;以及,(H)对于所述多个第一字段和多个第二字段中的全部执行(F)和(G),其中,基于将从(H)中获取的多个点积相加,计算所述相似度分数。
在一种实现中,所述多个第一字段和所述多个第二字段分别表示所述第一媒体节目和所述第二媒体节目的演员表、描述、字幕或标题中的至少一项。
在一种实现中,指令包括计算每一个字段内的所述第一令牌和所述第二令牌中的每一个的第一出现频率;以及计算跨不同字段的所述第一令牌和所述第二令牌中的每一个的第二出现频率,其中,基于所计算的第一频率和第二频率,指定每一个令牌的所述权重因数。
在一种实现中,指令包括调整所述权重因数中的至少一个以对选定的令牌给出权重。
在一种实现中,指令包括使用权重矩阵,互相关所述第一元数据和所述第二元数据之间的不同字段。
在另一方面,提供包括至少一个处理电路的系统。所述至少一个处理电路可以被配置成:(A)获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;(B)从所述多个第一字段中的一个提取多个第一令牌,以及从所述多个第二字段中的一个提取多个第二令牌;(C)向所述第一令牌和所述第二令牌中的每一个指定权重因数;(D)在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及(E)基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。
在一种实现中,所述至少一个处理电路进一步被配置成:(F)基于所述第一令牌和它们相应的权重因数,构建表示所述多个第一字段中的一个的第一矢量,以及基于所述第二令牌和它们相应的权重因数,构建表示所述多个第二字段中的一个的第二矢量;(G)计算表明所述多个第一字段中的所述一个和所述多个第二字段中的所述一个之间的相似度的所述第一矢量和所述第二矢量的点积;以及,(H)对于所述多个第一字段和多个第二字段中的全部执行(F)和(G),其中,基于将从(H)中获取的多个点积相加,计算所述相似度分数。
在一种实现中,所述至少一个处理电路被配置成通过智能TV模块来接收用户对媒体节目的请求。
在一种实现中,所述至少一个处理电路被配置成导致多个类似的节目,基于它们分别计算出的相似度分数在所述智能TV模块上显示。
应该理解,前述的概念以及下面比较详细地讨论的其它概念(假如这样的概念不相互不一致)的所有组合都是此处所公开的发明的主题的一部分。具体而言,出现在本发明的末尾处的所要求保护的主题的所有组合也是此处所公开的发明的主题的一部分。还应该理解,还可以出现在任何引用包括的公开中的此处明确使用的术语应该符合此处所公开的特定概念的含义。
通过下面的结合各个附图对本发明进行的详细描述,可以更全面地理解本发明的前述的的和其他方面、实施例、特征。
附图说明
本领域技术人员将可以理解,此处所描述的附图只用于说明的目的。可以理解,在某些情况下,本发明的各方面可以放大地示出,以促进对本发明的理解。在附图中,相同附图标记一般是指相同特征,功能上类似的和/或在结构上类似的元件。附图不一定按比例,着重点放在显示本发明的原理。附图不打算以任何方式对本发明的范围作出限制。
图1是示出了智能TV接口的示例的框图。
图2是示出了比较媒体节目之间的相似度的方法的示例的流程图。
图3是示出了使用矢量呈现来计算不同媒体节目的字段之间的关联的示例方法的图示。
图4是示出了用于互相关不同的字段的权重因数的矩阵的示例的图示。
图5是示出了向用户建议节目的示例方法的流程图。
图6是示出了预测节目的受欢迎度的示例方法的流程图。
图7是示出了可用于执行各种操作中的至少某些的系统的框图。
具体实施方式
下面是用于关联媒体节目的发明的方法和系统的各种概念以及实施例的比较详细的描述。应该理解,上面介绍的并且在下面比较详细地讨论的各种概念可以以多种方式中的任何一种来实现,所公开的概念不仅限于任何特定的实现方式。特定实现和应用的示例主要用于说明性目的。
概览
此处所公开的实现可用于通过因特网关联媒体节目。诸如视频和音频节目之类的这样的媒体节目可以显示在因特网电视机(TV)或web TV上,或利用智能TV系统来显示。
因特网TV或web TV通常使用个人计算机或移动设备来通过因特网流式播放或下载媒体节目。在智能TV系统中,智能TV模块(或连接的TV模块、混合型TV模块等等)可以将常规电视机与因特网集成,并且可以给用户带来更集成的体验。用户可以选择希望的内容在智能TV上观看,通过因特网玩游戏,浏览网页,等等,可能不一定识别内容是如在常规TV中那样来自于广播,还是来自于因特网。
智能TV可以包括被配置成将因特网连接与比较传统的电视节目源(例如,通过有线电视、卫星、无线电或其他信号接收到的)集成的处理电路。智能TV模块可以在物理上包括到电视机中,或可以包括单独的设备,诸如机顶盒、蓝光或其他数字媒体播放器、游戏控制台、宾馆TV系统及其他附带设备。
智能TV模块可以被配置成允许观众在web上、在本地有线电视频道上、在卫星电视频道上或在本地存储器设备上,搜索和查找视频、电影、照片及其他内容。机顶盒(STB)或机顶盒单元(STU)可以包括信息电器设备,该信息电器设备可以包含调谐器并连接到电视机和外部信号源,将信号转换为之后将显示在电视屏幕或其他显示设备上的内容。
如图1中的示例所示,智能TV模块可以被配置成提供主屏幕100或顶层屏幕,包括多个不同的应用的图标,诸如web浏览器以及多个流式媒体服务(例如,Netflix、Vudu、Hulu、等等),连接的有线或卫星媒体源,其他web“频道”等等。智能TV模块还可以进一步被配置成向用户提供电子节目指南。智能TV模块的附带应用可以在移动计算设备上操作,以向用户提供关于可用节目的其它信息,允许用户控制智能TV模块等等。可以包括诸如键盘之类的输入设备,以使用户如在常规个人计算机中那样输入比较长的命令。
文本数据之间的关联在因特网中有大量的应用,诸如在基于关键字的搜索中,以及上下文以及定向广告中。诸如音频和视频节目之类的媒体节目更难以被关联或量化。此处所公开的实现允许计算诸如TV节目、电影、连续剧、演出、音乐之类的媒体节目,及其他数据(包括非文本数据)之间的相似度。
关于媒体节目的元数据
在一种实现中,基于比较关于两个节目的可用元数据,计算两个节目之间的相似度。示例元数据可以包括演员表、职员、节目运行时、类别、风格,字幕或小标题、摘要、评价等等。在某些示例中,元数据可以从诸如因特网电影数据库(IMDb)或电影评论网站、论坛媒体服务(TMS)之类的web源或其他可用的源中获取。
元数据也可以有各种形式可用,并可以组织成各种字段。例如,来自特定源的关于电影的元数据可以包括诸如节目标题、描述、故事情节、演员表、职员、风格等等之类的字段。在另一个示例中,元数据可以从web源中获取,包括诸如标题、主要内容、演员表、类别、琐事、与同一个web源内的其他文章的内部链接,以及到其他web源的外部链接之类的字段。
在一种实现中,关于不同的节目的元数据可以通过同一个web源内的内部链接获取,由此提供相对一致的数据源。在另一种实现中,外部链接可以被包括在数据关联中,但是,数据质量和格式可能更异构,因为数据来自于多个web源/站点,没有基本上统一的标准。在再一个实现中,可以通过搜索引擎提供数据挖掘,并在万维网(WWW)中进行数据挖掘。
示例方法
在一种实现中,可以提供比较两个节目的方法200,如图2的流程图所示。方法200可以包括下列操作。
在操作402中,可以在服务器处接收关于第一媒体节目的第一元数据和关于第二媒体节目的第二元数据,供使用处理电路进行分析。在一个示例中,第一和第二节目可以是两个电影,第一元数据和第二元数据可以相应地是关于这两部电影的两个文章/评论。每一个元数据都被组织成多个字段,诸如主要内容或主要描述、演员表、制作、故事情节、音轨描述、分发、接收、票房表现、奖励等等。
接下来,在操作404中,可以从每一个节目的元数据中的每一个字段中提取多个令牌。令牌可能是最常使用的术语。每一个字段的文本都可以识别为单个字,和/或包括两个或更多字的短语。例如,两个相邻的字“New”和“York”可以被解析为短语“New York”,并被识别为令牌。
在一个示例中,在“演员表”字段中,每一个著名的演员都可以当做令牌。在一个示例中,对于包括人的姓名的字段,姓和名可以合并成单个令牌。对于描述,字可以合并成短语,如果这些字多次(优选地大于预定数量的情况)在文本中一起出现。
在一种实现中,为加快如下面所描述的计算操作,对于一组正在被分析的节目,可以全局性地将关键字转换为诸如唯一数字之类的唯一标识符。
对于每一个字段,可以采用算法来从文本中提取令牌。不同的算法可以用于不同字段,诸如主要内容、标题、演员表,以及琐事,用于令牌化。可以给每一个令牌提供数值相关性因素,表明在计算节目相似度时的其相关性的级别。
元数据源的主要内容(例如,电影的描述,诸如那些从TMS或其他来源中获取的)常常包含大量的文本数据,并可以被分成句子、句子段(sentence terminal)和/或簇。
段可以是出现在文本中的字,和/或连接在一起的字(如果它们形成流行的短语)。在一种实现中,可以包括所有段作为令牌。它们的数值相关性值,可以给出为,例如1。
簇可以是在主题上连接到文本的字的组。例如,可以使用字簇来确定电影描述的内容。一般而言,字簇可以是表达相同或类似思想的字的组。根据一种实现,字簇可以是同义词的组。这样的簇可以被用来标识相同主题的电影,但是,使用不同的术语。在某些情况下,字簇可以包括具有相关,但是不同含义的字。在某些实现中,文本描述的特征可以是不同的字簇的组。对于每一个簇,也可以给出描述其与媒体节目的联系程度的数值。在一个示例中,可以包括带有高于某一阈值的数值的那些簇作为令牌。
节目标题可能没有用于分组成为句子或短语的足够的文本。如此,可以将来自标题的文本数据分割为单个字(例如,通过空格),可以作为令牌包括每一个字,并给出其相关性数值1,因为标题一般而言对媒体节目是重要的。
在一种实现中,演员表上的每一项目(诸如从TMS演员表数据中获取的)都可以变为令牌。演员表可以根据重要性来组织。如此,在一个示例中,女主演的相关性分数可以设置为1。列表中的其他演员可以被给出比前一演员较低的分数,例如,低一个固定因素。
令牌化可以使用一个或多个处理电路部分通过数学模型自动地执行。数学模型可以包括基于字簇的概率性主题模型。
在第一示例中,概率性主题模型可以应用于TMS“描述”数据或来自其他来源的其他电影描述。概率性主题模型可以包含大量(例如,1200万)已知检索词和大量(例如,1百万)概念,以及它们之间的概率性关系。可以将来自TMS“描述”的文本输入到通用主题模型中以便令牌化。
在一种实现中,令牌化节目的下列元数据字段:标题、描述、演员表、风格,以及导演。可以给每一令牌指定一个数值权重因数,诸如在0和之间,以表明其与节目的相关性。数值权重因数可以用于下面所描述的计算中。
元数据中的另一字段可以被定义为由源所提供的类别。在一种实现中,每一个类别都通过某些预定的用于解析的规则。可以将某些类别改变为较宽的类别,并且可以调整它们的权重因数。某些类别可以是不可修改的,并给出权重因数1。
可以给字段内的每一令牌指定一个权重。权重可以取决于其相关性以及令牌出现在其中的节目的总数。在某些情况下,令牌可以在一个字段内出现多次。根据一种实现,根据子线性函数,将其权重因数综合。例如,综合的权重因数可以是比单个相关性分数的总和小得多。在一种实现中,令牌不是跨不同字段地综合。
在操作206中,可以作为异常值,删除意义不大的令牌。这些异常值可以包括在一个字段中过度频繁地出现或在元数据中全局性地出现的那些令牌。
尽管存在异常值,但是,一般而言,令牌出现的数量或频率可以表明它们对节目的相关性的贡献。在一种实现中,在示例操作208中,采用修改过的TF-IDF(词频–逆文档频率)方法来计算令牌的权重因数。TF可以表示每一个字段内令牌的出现频率,而IDF可以表示跨不同字段(诸如在整个文档中)令牌的出现频率。
具体而言,对于每一个令牌,计算词频(TF)。对于不同字段类型可以采用不同的计算方法。在一个示例中,可以作为TF=1+log(x)来计算TF,其中,x是令牌在元数据的特定字段出现的次数。
也可以跨字段和/或文档来计算IDF(逆文档频率)。对于每一个字段-令牌对,此频率可以是全局性的。在一种实现中,还可以对于每一种字段类型(例如,标题、演员表等等)分别地设置计算IDF的方法。在一个示例中,IDF=1–log(count)/log(max_count+1),其中,count是令牌在其中出现的文档/字段的数量,max_count是这些数量的最大值。
在一种实现中,令牌的权重因数基于计算出的TF和IDF,诸如TF和IDF相乘。
在一种实现中,每一个字段都被视为矢量,其第i分量可以是令牌i的权重(在全局索引中)。此矢量可以被规范化为具有长度1。两个字段之间的相似度可以通过两个矢量之间的关联,诸如两个规范化的矢量的点积(或标量积,内积)来表示。
值得注意的是,多维空间中的矢量和它们之间的点积只是多个分量的字段(令牌)之间的关系或关联的数学表示的一种类型。也可以使用其他数学工具和公式来计算这样的关系。一般而言,可以执行多个第一字段和多个第二字段之间的第一和第二令牌的互相关,而第一媒体节目和第二媒体节目之间的相似度可以基于互相关。
具体而言,在每一个令牌的权重因数为已知的令牌化过程之后,如图3所示,可以为每一个节目构建多个字段矢量。每一个字段矢量都可以表示字段,是基于从字段中提取的令牌以及它们的权重因数构建的。
例如,可以为第一电影的“演员表”字段构建字段矢量A。在此示例中,演员表矢量A可以在三个令牌轴上具有分量,诸如表示第一演员的姓名的令牌1,表示第二演员的姓名的令牌2,以及表示第三演员的令牌3。在某些实现中,矢量可以具有多一些或少一些的分量。可以为第二电影的“演员表”字段构建字段矢量B,其中,令牌1',2',以及3'表示第二电影的演员表中的三个演员。
令牌1和令牌1'的校准表示,第一演员在两个电影中是共同的。不同的演员通过正交轴来表示。虽然图3中的说明性示例中的字段矢量A和B的坐标系是对齐的,但是,所属领域的技术人员可理解,在许多其他情况下,在多维矢量空间中,坐标系彼此完全正交,表示在正在比较的两个节目没有共同的演员。
矢量可以使用两个令牌列表的规范化因子来规范化。在一种实现中,每一个矢量可以在其长度规范化,诸如通过使用矢量的范数来除矢量。
在某些实现中,通过乘以多个选择的分量中的一个的幂,从而例如,利用更多令牌来增强那些矢量,促进较短的文本和/或促进某些令牌,来修改规范化因子。
一般而言,矢量可以被规范化为范围0~1。在一个示例中,诸如在TF-IDF计算中,可以向选择的令牌给出0~1(诸如1/3)的指数幂。所属领域的技术人员将认识到,在该过程中可以使用其他规范化。
接下来,在操作210中,可以计算两个矢量A和B的点积。图3中的字段矢量A和B的对齐的轴表明,点积将具有高值,表明两个电影之间的高度的相似度(至少就演员表而言)。在某些其他示例中,在两部电影中没有共同的演员,演员表矢量的所有分量都是正交的,点积将是0,表示在两部电影之间没有相似度(至少就演员表而言)。
接下来,在操作214中,可以将来自所有字段对的点积相加,以计算相似度分数。
在一种实现中,可以在计算中包括多个设置。这样的设置可以包括,例如,表示来自各种字段类型的令牌的比较(包括相同类型之间的比较)在多大程度上影响最后的分数的权重(实数)的矩阵,以及用于每一种字段类型的适当的TF和IDF函数。
两个节目之间的相似度可以基于各个字段对的相似度。在一种实现中,提供定义所有字段对的分数乘数(它们中的许多可以等于0)的矩阵。例如,可以直接将节目X的“描述”字段与节目Y的“描述”字段进行比较,对应的矩阵分量可以具有值1。另外,还可以部分地将“描述”与诸如“标题”以及“故事情节”等之类的其他字段进行比较,对应的矩阵分量是非零。非零的跨字段的矩阵分量表明,在计算相似度分数时某种程度的字段混合可能是有用的。
然而,某些字段混合对比较计算没有用。描述一般不能与“风格”相比,如此,对应的矩阵分量可以只是0。
在图3中示出了示例矩阵[M],其中,通过测试各种组合,导出矩阵分量的数值,以优化统计采样过程中的结果或凭经验给出。在所示出的示例中,[M]可以是对称矩阵。
如此,在一种实现中,以类似于图3中所示出的矩阵的形式,使用适当的跨字段权重,利用总计,来计算两个媒体节目之间的最后的相似度分数。可以根据这样的为每一对字段类型预先定义的权重矩阵来混合令牌。如此,不同字段之间的相似度可以被考虑到计算中。在数学上,最后的相似度分数可以表达为:S=vA[M]vB
在某些实现中,对计算TF和IDF应用调整/规范化。可以将TF-IDF方法应用于节目相关的元数据,使用预先定义的权重矩阵(诸如[M]),对于不同类型的文本(例如,描述、演员表、职员、故事情节等等),适当地调整令牌提取和混合结果。
在一种实现中,对于具有正的相似度分数,例如,共同地具有至少一个令牌的每一对字段,给出奖励分数。
示例应用
作为图1中所示出的智能TV平台的一部分,此处所公开的实现可以用于,例如,确定相关的节目。
图5是示出了向用户建议节目的示例方法500的流程图。在操作502中,当用户请求媒体节目或在智能TV平台上进行媒体节目的搜索时,服务器接收请求。基于节目的元数据的多个字段,诸如演员表和描述,可以基于相应的元数据,发现类似的节目。在一种实现中,可以通过在操作504中计算节目的与数据库中的所有节目的相似度分数,发现与节目相关的所有节目。在操作506中,可以返回带有最高分的节目,并根据相似度分数排序。在操作508中,相关的节目可以与请求的节目一起,根据它们的排序,按顺序显示。例如,在用户在智能TV模块上首先选择一部电影之后,更多类似的电影标题将基于它们的相似度分数而出现。与,例如,某些供应商(例如,Amazon,Netflix)所使用的协作过滤技术相比,根据此处所公开的实现所建议的电影可以更准确地反映用户的兴趣。
图6是示出了预测节目的受欢迎度的示例方法600的流程图。在操作602中,服务器可以接收由用户给出的对节目的星级的评价(例如,由用户基于用户喜欢或不喜欢该节目的程度给出的星的数量或其他排序,诸如一到五颗星)。用户可以退出数据收集,或者可以可任选地提供另外的数据,诸如可以对向用户建议节目有用的人口统计数据。与评价相关联的用户ID或其他用户数据是匿名的,而不与用户名相联系。在操作604中,服务器可以使用上文所描述的计算方法,来预测用户的对用户没有看到的所有类似的节目的评价。在操作606中,可以对用户的样本执行预测的评价的统计。在操作608中,系统也可以基于类似的电影的受欢迎度,向媒体节目供应商提供关于哪些节目,诸如新的版本,将可能受欢迎的分析。
对于电视连续剧,可以在电视连续剧级别即,不是在放映季、或片断级别操作,构建粗粒度的模型。方法和系统也可以适用于细粒度的模型,诸如比较同一部电视连续剧的放映季、或片断之间的相似度/差异。
示例系统
图7是示出了可用于执行上文所描述的各种操作中的至少某些的系统的框图。处理器710可以是服务器处理器,并可以包括一个或多个微处理器或处理电路。总线740可以包括系统总线。存储设备720可以包括系统存储器,如只读存储器(ROM)和/或随机存取存储器(RAM)。存储设备720还可以包括任何合适的类型的存储器,包括,例如,用于从硬盘中读取和向硬盘中写入的硬盘驱动器,用于从(例如,可移动)磁盘读取和向其中写入的磁盘驱动器,以及从诸如光盘或其他(磁性)光学介质之类的可移动(磁性)光盘读取和向其中写入的光盘驱动器,或任何其他类型的存储介质。
用户可以通过输入设备732、诸如键盘和指示设备(例如,鼠标),向诸如智能TV模块、个人计算机,或移动设备之类的用户终端输入命令和信息。也可以(或者)包括诸如麦克风、接触输入接口、游戏杆、游戏手柄、碟形卫星天线、扫描仪等等其他的输入设备。这些及其他输入设备可以通过耦合到网络(例如,因特网)的合适的接口730或系统总线740连接到处理器710。
输出设备734可以包括监视器或其他类型的显示设备,它们可以通过适当的接口连接到网络740。除了监视器之外(或代替),用户终端还可以包括其他(外围)输出设备(未示出),诸如,例如,扬声器和打印机。在某些情况下,输出设备734可包括用于提供可视输出、触觉输出、或音频输出中的一项或多项的组件。
尽管此处描述并示出了各种发明的实施例,但是,所属领域的技术人员将轻松地预想用于执行功能和/或获取结果和/或此处所描述的优点中的一项或多项的各种其他装置和/或结构,这样的变化和/或修改中的每一个都被认为在此处所描述的发明的实施例的范围内。更一般而言,所属领域的技术人员将轻松地理解,此处所描述的所有参数、尺寸、材料,以及配置都只是示例性的,实际参数、尺寸、材料,和/或配置将取决于发明的原理所适用的特定的应用。所属领域的技术人员将使用常规的实验认识到,或能够弄清与此处所描述的具体发明的实施例的等效的实施例。因此,可以理解,前述的各实施例只是作为示例来呈现的,在所附权利要求书以及等效内容的范围内,发明的实施例可以以不同于具体地描述并要求保护的方式来实施。本发明的各实施例涉及此处所描述的每一个单个特征、系统、制品、材料、工具包,和/或方法。另外,两个或更多这样的特征、系统、制品、材料、工具箱,和/或方法的任何组合,如果这样的特征、系统、制品、材料、工具箱,和/或方法不相互不一致,包括在本发明的范围内。
可以用多种方式中的任一种来实现本发明的上述实施例。例如,可使用硬件、软件或其组合来实现一些实施例。当一个实施例的任何方面至少部分地以软件来实现时,软件代码可以在任何合适的处理器或处理器集合上执行,无论是在单一设备或计算机中提供还是在多个设备/计算机中分布。
权利要求不应该仅限于所描述的顺序或元素,除非这样陈述的。应该理解,在不偏离所附权利要求书的精神和范围的情况下,可以由本领域的技术人员作出形式和细节的各种更改。要求保护所有在下列权利要求书以及等效内容的精神和范围内的实施例。

Claims (20)

1.一种关联媒体节目的计算机实现的方法,所述方法包括:
(A)使用至少一个处理电路,获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;
(B)使用至少一个处理电路,从所述多个第一字段中的每一个提取多个第一令牌,以及从所述多个第二字段中的每一个提取多个第二令牌;
(C)向所述第一令牌和所述第二令牌中的每一个指定权重因数;
(D)在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及
(E)基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。
2.如权利要求1所述的计算机实现的方法,其中(D)包括:
(F)基于所述第一令牌和它们相应的权重因数,构建表示所述多个第一字段中的一个的第一矢量,以及基于所述第二令牌和它们相应的权重因数,构建表示所述多个第二字段中的一个的第二矢量;
(G)计算表明所述多个第一字段中的所述一个和所述多个第二字段中的所述一个之间的相似度的所述第一矢量和所述第二矢量的点积;以及
(H)对于所述多个第一字段和多个第二字段中的全部执行(F)和(G),
其中,基于将从(H)中获取的多个点积相加,计算所述相似度分数。
3.如权利要求1所述的计算机实现的方法,其中所述多个第一字段中的一个和所述多个第二字段中的一个分别表示所述第一媒体节目和所述第二媒体节目的演员表,并且其中所述多个第一令牌和所述多个第二令牌分别表示所述第一媒体节目和所述第二媒体节目中的多个演员,所述方法还包括基于所述相似度分数,向用户提供媒体节目的建议。
4.如权利要求1所述的计算机实现的方法,还包括:
计算每一个字段内的所述第一令牌和所述第二令牌中的每一个的第一出现频率;以及
计算跨不同字段的所述第一令牌和所述第二令牌中的每一个的第二出现频率,
其中,基于所计算的第一频率和第二频率,指定每一个令牌的所述权重因数。
5.如权利要求1所述的计算机实现的方法,还包括调整所述权重因数中的至少一个以对选定的令牌给出权重。
6.如权利要求1所述的计算机实现的方法,其中(D)包括使用权重矩阵,互相关所述第一元数据和所述第二元数据之间的不同字段。
7.如权利要求1所述的计算机实现的方法,还包括:
计算所述第一媒体节目和多个媒体节目中的每一个之间的相似度分数;以及
基于所述相似度分数,排序所述多个媒体节目。
8.如权利要求7所述的计算机实现的方法,还包括:
从用户那里接收关于所述第一媒体节目的评价;以及
基于所述排序,预测对所述多个媒体节目的所述用户的评价。
9.如权利要求1所述的计算机实现的方法,其中从基本上一致的数据库中获取所述第一元数据和所述第二元数据。
10.如权利要求1所述的计算机实现的方法,其中从多个异构数据库中获取所述第一元数据和所述第二元数据。
11.一种在其上存储指令的非瞬时的计算机可读介质,其中所述指令当被执行时,导致至少一个处理器执行多个操作,包括:
(A)获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;
(B)从所述多个第一字段中的每一个提取多个第一令牌,以及从所述多个第二字段中的每一个提取多个第二令牌;
(C)向所述第一令牌和所述第二令牌中的每一个指定权重因数;
(D)在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及
(E)基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。
12.如权利要求11所述的非瞬时的计算机可读介质,其中(D)包括:
(F)基于所述第一令牌和它们相应的权重因数,构建表示所述多个第一字段中的一个的第一矢量,以及基于所述第二令牌和它们相应的权重因数,构建表示所述多个第二字段中的一个的第二矢量;
(G)计算表明所述多个第一字段中的所述一个和所述多个第二字段中的所述一个之间的相似度的所述第一矢量和所述第二矢量的点积;以及
(H)对于所述多个第一字段和多个第二字段中的全部执行(F)和(G),
其中,基于将从(H)中获取的多个点积相加,计算所述相似度分数。
13.如权利要求12所述的非瞬时的计算机可读介质,其中所述多个第一字段和所述多个第二字段分别表示所述第一媒体节目和所述第二媒体节目的演员表、描述、字幕或标题中的至少一项。
14.如权利要求11所述的非瞬时的计算机可读介质,所述指令还包括:
计算每一个字段内的所述第一令牌和所述第二令牌中的每一个的第一出现频率;以及
计算跨不同字段的所述第一令牌和所述第二令牌中的每一个的第二出现频率,
其中,基于所计算的第一频率和第二频率,指定每一个令牌的所述权重因数。
15.如权利要求11所述的非瞬时的计算机可读介质,所述指令还包括调整所述权重因数中的至少一个以给予选定令牌权重。
16.如权利要求11所述的非瞬时的计算机可读介质,其中(D)包括使用权重矩阵,互相关所述第一元数据和所述第二元数据之间的不同字段。
17.一种包括至少一个处理电路的系统,所述处理电路被配置成执行下列操作:
(A)获取第一媒体节目的第一元数据和第二媒体节目的第二元数据,其中所述第一元数据被组织成多个第一字段,而所述第二元数据被组织成多个第二字段;
(B)从所述多个第一字段中的每一个提取多个第一令牌,以及从所述多个第二字段中的每一个提取多个第二令牌;
(C)向所述第一令牌和所述第二令牌中的每一个指定权重因数;
(D)在所述多个第一字段和所述多个第二字段之间互相关所述第一令牌和所述第二令牌;以及
(E)基于所述互相关,计算所述第一媒体节目和所述第二媒体节目之间的相似度分数。
18.如权利要求17所述的系统,其中所述至少一个处理电路进一步被配置成:
(F)基于所述第一令牌和它们相应的权重因数,构建表示所述多个第一字段中的一个的第一矢量,以及基于所述第二令牌和它们相应的权重因数,构建表示所述多个第二字段中的一个的第二矢量;
(G)计算表明所述多个第一字段中的所述一个和所述多个第二字段中的所述一个之间的相似度的所述第一矢量和所述第二矢量的点积;以及
(H)对于所述多个第一字段和多个第二字段中的全部执行(F)和(G),
其中,基于将从(H)中获取的多个点积相加,计算所述相似度分数。
19.如权利要求17所述的系统,其中所述至少一个处理电路进一步被配置成通过智能TV模块来接收用户对媒体节目的请求。
20.如权利要求19所述的系统,其中所述至少一个处理电路进一步被配置成导致多个类似的节目基于它们的各自计算出的相似度分数在所述智能TV模块上显示。
CN201280062329.XA 2011-10-30 2012-09-13 关联媒体节目的计算机实现的方法、处理电路系统和计算机可读介质 Active CN104160712B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161553221P 2011-10-30 2011-10-30
US61/553,221 2011-10-30
US13/467,339 US8869208B2 (en) 2011-10-30 2012-05-09 Computing similarity between media programs
US13/467,339 2012-05-09
PCT/US2012/055222 WO2013066503A1 (en) 2011-10-30 2012-09-13 Computing similarity between media programs

Publications (2)

Publication Number Publication Date
CN104160712A true CN104160712A (zh) 2014-11-19
CN104160712B CN104160712B (zh) 2017-09-08

Family

ID=48173862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280062329.XA Active CN104160712B (zh) 2011-10-30 2012-09-13 关联媒体节目的计算机实现的方法、处理电路系统和计算机可读介质

Country Status (5)

Country Link
US (2) US8869208B2 (zh)
EP (1) EP2772065A4 (zh)
KR (1) KR102008000B1 (zh)
CN (1) CN104160712B (zh)
WO (1) WO2013066503A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809256A (zh) * 2015-05-22 2015-07-29 数据堂(北京)科技股份有限公司 一种数据去重方法及系统
CN106471498A (zh) * 2014-12-22 2017-03-01 乐威指南公司 用于使用元数据和使用数据分析的过滤技术的系统和方法
CN106471819A (zh) * 2015-04-23 2017-03-01 乐威指南公司 用于提高媒体资产推荐模型中的精确性的系统和方法
CN109495789A (zh) * 2017-09-13 2019-03-19 华为技术有限公司 媒体文件播放方法、设备及通信系统

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9203445B2 (en) * 2007-08-31 2015-12-01 Iheartmedia Management Services, Inc. Mitigating media station interruptions
US20130268526A1 (en) * 2012-04-06 2013-10-10 Mark E. Johns Discovery engine
US9058303B2 (en) * 2012-11-30 2015-06-16 Xerox Corporation Convex collective matrix factorization
CN104035934B (zh) * 2013-03-06 2019-01-15 腾讯科技(深圳)有限公司 一种多媒体信息推荐的方法及装置
US9342580B2 (en) * 2013-03-15 2016-05-17 FEM, Inc. Character based media analytics
US9402101B2 (en) * 2013-03-15 2016-07-26 Panasonic Intellectual Property Corporation Of America Content presentation method, content presentation device, and program
US8572097B1 (en) * 2013-03-15 2013-10-29 FEM, Inc. Media content discovery and character organization techniques
US9538249B2 (en) * 2013-05-09 2017-01-03 Viasat Inc. Close fulfillment of content requests
CN104731828B (zh) * 2013-12-24 2017-12-05 华为技术有限公司 一种跨领域文档相似度计算方法及装置
US20150317314A1 (en) * 2014-04-30 2015-11-05 Linkedln Corporation Content search vertical
US9386338B2 (en) * 2014-07-29 2016-07-05 Verizon Patent And Licensing Inc. Automatic channel selection and control
US20160314404A1 (en) * 2015-04-23 2016-10-27 Rovi Guides, Inc. Systems and methods for improving accuracy in media asset recommendations based on data from multiple data spaces
US10575057B2 (en) 2015-04-23 2020-02-25 Rovi Guides, Inc. Systems and methods for improving accuracy in media asset recommendation models
KR101632073B1 (ko) * 2015-06-04 2016-06-20 장원중 통계 분석 기반의 데이터 프로파일링을 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
US10362362B2 (en) * 2015-07-08 2019-07-23 Verizon Patent And Licensing Inc. Multi-dimensional hierarchical content navigation
US9699514B2 (en) 2015-12-02 2017-07-04 Echostar Technologies L.L.C. Apparatus, systems and methods for media mosaic management
US10306290B2 (en) * 2016-08-22 2019-05-28 Embrionix Design Inc. Standardized hot-pluggable transceiving unit with bandwidth optimization functionalities
US9940390B1 (en) * 2016-09-27 2018-04-10 Microsoft Technology Licensing, Llc Control system using scoped search and conversational interface
CN106599047B (zh) * 2016-11-10 2020-08-18 咪咕动漫有限公司 一种信息的推送方法及装置
US9900632B1 (en) 2016-12-30 2018-02-20 Echostar Technologies L.L.C. Viewing suggestions based on closed-captioned content from multiple tuners
US11151203B2 (en) * 2017-02-28 2021-10-19 Apple Inc. Interest embedding vectors
CN107133292A (zh) * 2017-04-25 2017-09-05 深圳市茁壮网络股份有限公司 对象推荐方法及系统
CN108681601B (zh) * 2018-05-21 2020-12-11 北京奇艺世纪科技有限公司 一种视频分享的方法、装置及电子设备
WO2023197204A1 (en) * 2022-04-13 2023-10-19 Comcast Cable Communications, Llc Managing transmission resources

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101292238A (zh) * 2005-10-21 2008-10-22 微软公司 语义主题的自动化丰富呈现
US20090070325A1 (en) * 2007-09-12 2009-03-12 Raefer Christopher Gabriel Identifying Information Related to a Particular Entity from Electronic Sources
CN102265276A (zh) * 2008-12-23 2011-11-30 阿克塞尔斯普林格数字电视指导有限责任公司 基于上下文的推荐系统

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286294B2 (en) * 1992-12-09 2016-03-15 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator content suggestion engine
JP2729356B2 (ja) * 1994-09-01 1998-03-18 日本アイ・ビー・エム株式会社 情報検索システム及び方法
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5749081A (en) 1995-04-06 1998-05-05 Firefly Network, Inc. System and method for recommending items to a user
US6041311A (en) 1995-06-30 2000-03-21 Microsoft Corporation Method and apparatus for item recommendation using automated collaborative filtering
WO1998040832A2 (en) 1997-03-14 1998-09-17 Firefly Network, Inc. Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
ES2567261T3 (es) 1998-07-17 2016-04-21 Rovi Guides, Inc. Sistema de televisión con búsqueda asistida de programas por el usuario
US7260823B2 (en) * 2001-01-11 2007-08-21 Prime Research Alliance E., Inc. Profiling and identification of television viewers
US7403910B1 (en) * 2000-04-28 2008-07-22 Netflix, Inc. Approach for estimating user ratings of items
US20020151327A1 (en) * 2000-12-22 2002-10-17 David Levitt Program selector and guide system and method
US6907459B2 (en) * 2001-03-30 2005-06-14 Xerox Corporation Systems and methods for predicting usage of a web site using proximal cues
US20030130993A1 (en) * 2001-08-08 2003-07-10 Quiver, Inc. Document categorization engine
US7383258B2 (en) * 2002-10-03 2008-06-03 Google, Inc. Method and apparatus for characterizing documents based on clusters of related words
US20050222989A1 (en) * 2003-09-30 2005-10-06 Taher Haveliwala Results based personalization of advertisements in a search engine
WO2005124599A2 (en) 2004-06-12 2005-12-29 Getty Images, Inc. Content search in complex language, such as japanese
US20070150279A1 (en) 2005-12-27 2007-06-28 Oracle International Corporation Word matching with context sensitive character to sound correlating
US8141114B2 (en) 2006-02-28 2012-03-20 Microsoft Corporation Content ratings and recommendations
CA2538438A1 (en) 2006-03-01 2007-09-01 Legalview Assets, Limited Systems and methods for media programming
US8166029B2 (en) * 2006-09-07 2012-04-24 Yahoo! Inc. System and method for identifying media content items and related media content items
WO2008097810A2 (en) * 2007-02-02 2008-08-14 Veoh Networks, Inc. Indicator-based recommendation system
US20080270344A1 (en) 2007-04-30 2008-10-30 Yurick Steven J Rich media content search engine
US7836053B2 (en) 2007-12-28 2010-11-16 Group Logic, Inc. Apparatus and methods of identifying potentially similar content for data reduction
WO2010085773A1 (en) * 2009-01-24 2010-07-29 Kontera Technologies, Inc. Hybrid contextual advertising and related content analysis and display techniques
US20100333140A1 (en) * 2009-06-29 2010-12-30 Mieko Onodera Display processing apparatus, display processing method, and computer program product
US8656286B2 (en) * 2010-11-05 2014-02-18 Palo Alto Research Center Incorporated System and method for providing mixed-initiative curation of information within a shared repository

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101292238A (zh) * 2005-10-21 2008-10-22 微软公司 语义主题的自动化丰富呈现
US20090070325A1 (en) * 2007-09-12 2009-03-12 Raefer Christopher Gabriel Identifying Information Related to a Particular Entity from Electronic Sources
CN102265276A (zh) * 2008-12-23 2011-11-30 阿克塞尔斯普林格数字电视指导有限责任公司 基于上下文的推荐系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106471498A (zh) * 2014-12-22 2017-03-01 乐威指南公司 用于使用元数据和使用数据分析的过滤技术的系统和方法
CN106471819A (zh) * 2015-04-23 2017-03-01 乐威指南公司 用于提高媒体资产推荐模型中的精确性的系统和方法
CN106471819B (zh) * 2015-04-23 2020-10-20 乐威指南公司 用于提高媒体资产推荐模型中的精确性的系统和方法
CN104809256A (zh) * 2015-05-22 2015-07-29 数据堂(北京)科技股份有限公司 一种数据去重方法及系统
CN109495789A (zh) * 2017-09-13 2019-03-19 华为技术有限公司 媒体文件播放方法、设备及通信系统
CN109495789B (zh) * 2017-09-13 2022-02-25 华为技术有限公司 媒体文件播放方法、设备及通信系统

Also Published As

Publication number Publication date
WO2013066503A1 (en) 2013-05-10
CN104160712B (zh) 2017-09-08
KR20140088205A (ko) 2014-07-09
EP2772065A1 (en) 2014-09-03
KR102008000B1 (ko) 2019-08-06
EP2772065A4 (en) 2016-05-11
US8869208B2 (en) 2014-10-21
US20130111526A1 (en) 2013-05-02
US20150052564A1 (en) 2015-02-19
US9654834B2 (en) 2017-05-16

Similar Documents

Publication Publication Date Title
CN104160712A (zh) 计算媒体节目之间的相似度
US11151145B2 (en) Tag selection and recommendation to a user of a content hosting service
US11210289B2 (en) Methods, systems, and media for interpreting queries
US9947025B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
JP2021535458A (ja) 機械学習抽出物とセマンティックグラフとを使用して構造化データを作成し、検索、推奨および発見を促進するための方法およびシステム
CN102265276B (zh) 基于上下文的推荐系统
CN110704674A (zh) 一种视频播放完整度预测方法及装置
US8239288B2 (en) Method, medium, and system for providing a recommendation of a media item
Jin et al. MySpace video recommendation with map-reduce on qizmt
US20220107978A1 (en) Method for recommending video content
CN109325146A (zh) 一种视频推荐方法、装置、存储介质和服务器
CN110929166A (zh) 一种内容推荐的方法、电子设备和存储介质
Bergamaschi et al. Comparing topic models for a movie recommendation system
US20190082236A1 (en) Determining Representative Content to be Used in Representing a Video
KR20180000166A (ko) 관심사 및 콘텐츠를 제공하는 방법 및 시스템
US20120239382A1 (en) Recommendation method and recommender computer system using dynamic language model
JP7395377B2 (ja) コンテンツ検索方法、装置、機器、および記憶媒体
US9576077B2 (en) Generating and displaying media content search results on a computing device
CN110147488B (zh) 页面内容的处理方法、处理装置、计算设备及存储介质
KR102588238B1 (ko) 컨텐츠 제작 어플리케이션 및 상기 컨텐츠 제작 어플리케이션 구동 방법
US8666915B2 (en) Method and device for information retrieval
Arvind et al. Decoding OTT: Uncovering Global Insights for Film Industry Advancement and Cultural Exchange
Baba-Hamed et al. Improvement quality of the recommendation system using the intrinsic context

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP03 Change of name, title or address