星空(StarSkySports)体育·官方网站-星空领跑体育未来

一种音视频类型的推荐方法、装置、设备及存储介质与流程-星空体育股份有限公司
公司动态

一种音视频类型的推荐方法、装置、设备及存储介质与流程

作者:小编 发布时间:2025-05-08 点击:

  星空体育网址星空体育网址

一种音视频类型的推荐方法、装置、设备及存储介质与流程(图1)

  本公开涉及人工智能技术领域,尤其涉及一种音视频类型的推荐方法、装置、设备及存储介质。

  目前,用户在使用音视频类软件播放音视频文件时,需要用户自行通过关键字搜索等方式找到喜欢的音视频文件,例如,通过搜索歌曲名称的方式找到喜欢的音乐。随着软件智能化的发展,音视频类软件可以基于用户的播放历史信息为用户推荐音视频文件。

  但是,在不同的场景下,用户对于音视频类型的播放需求不同,例如,在安静的夜晚,用户倾向于选择轻柔助眠类的音乐,而在健身过程中,用户倾向于选择节奏感较强类的音乐。如果仅基于用户的播放历史信息为用户推荐音视频文件,则可能导致推荐的音视频文件并不能满足用户当前的播放需求。例如,用户平时播放轻柔类音乐较多,而在健身过程中仅基于播放历史信息为其推荐轻柔类音乐,显然不能满足用户当前的播放需求。

  为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种音视频类型的推荐方法、装置、设备及存储介质,能够较好地满足用户当前对音视频类型的播放需求,提升了用户对音视频类软件的使用体验。

  本公开提供了一种音视频类型的推荐方法,所述方法包括:响应于用户的音视频文件播放请求,获取播放场景特征;其中,所述播放场景特征包括当前时间信息和\或当前地点信息;将所述播放场景特征输入至所述用户的音视频类型推荐模型中,经过所述音视频类型推荐模型的处理后,输出为所述用户推荐的音视频类型;其中,所述音视频类型推荐模型为基于所述用户的历史音视频播放行为中的所述播放场景特征与所述音视频类型之间的对应关系进行训练得到的机器学习模型。

  进一步,所述将所述播放场景特征输入至所述用户的音视频类型推荐模型中,经过所述音视频类型推荐模型的处理后,输出为所述用户推荐的音视频类型之前,还包括:收集用户对音视频文件的播放习惯;其中,所述播放习惯包括针对所述音视频文件的播放时间信息和\或播放地点信息,以及所述音视频文件的类型;通过机器学习的方式,基于所述播放习惯,生成所述用户的音视频类型推荐模型。

  进一步,所述播放习惯还包括针对所述音视频文件的热度信息;所述热度信息包括搜索次数、播放时长和\或播放次数。

  进一步,所述通过机器学习的方式,基于所述播放习惯,生成所述用户的音视频类型推荐模型,包括:对收集到的所述用户对音视频文件的播放习惯中的信息进行聚类处理,得到所述用户的音视频类型推荐模型。

  进一步,所述通过机器学习的方式,基于所述播放习惯,生成所述用户的音视频类型推荐模型,包括:将收集到的所述用户对音视频文件的播放习惯中的所述音视频文件的类型作为目标,对所述播放习惯中的信息进行分类处理,得到所述用户的音视频类型推荐模型。

  进一步,所述将所述播放场景特征输入至所述用户的音视频类型推荐模型中,经过所述音视频类型推荐模型的处理后,输出为所述用户推荐的音视频类型之后,还包括:为所述用户播放所述为所述用户推荐的音视频类型对应的音视频文件。

  本公开提供了一种音视频类型的推荐装置,所述装置包括:获取模块,用于响应于用户的音视频文件播放请求,获取播放场景特征;其中,所述播放场景特征包括当前时间信息和\或当前地点信息;推荐模块,用于将所述播放场景特征输入至所述用户的音视频类型推荐模型中,经过所述音视频类型推荐模型的处理后,输出为所述用户推荐的音视频类型;其中,所述音视频类型推荐模型为基于所述用户的历史音视频播放行为中的所述播放场景特征与所述音视频类型之间的对应关系进行训练得到的机器学习模型。

  进一步,所述装置还包括:收集模块,用于收集用户对音视频文件的播放习惯;其中,所述播放习惯包括针对所述音视频文件的播放时间信息和\或播放地点信息,以及所述音视频文件的类型;生成模块,用于通过机器学习的方式,基于所述播放习惯,生成所述用户的音视频类型推荐模型。

  本公开提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现上述音视频类型的推荐方法。

  本公开提供了一种设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述音视频类型的推荐方法。

  本公开实施例提供了一种音视频类型的推荐方法、装置、设备及存储介质,首先响应于用户的音视频文件播放请求,获取播放场景特征;该播放场景特征包括当前时间信息和\或当前地点信息;将播放场景特征输入至用户的音视频类型推荐模型中,经过音视频类型推荐模型的处理后,输出为用户推荐的音视频类型;其中,音视频类型推荐模型为基于用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系进行训练得到的机器学习模型。本实施例提供的上述音视频类型的推荐方式,由于音视频类型推荐模型为基于用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系而训练得到的,能够较好地体现用户在何种播放场景特征下对应何种音视频类型的播放习惯,从而,通过音视频类型推荐模型对播放场景特征进行处理后输出的音视频类型,能够较好地满足用户当前的播放需求,提升了用户对音视频类软件的使用体验。

  此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

  为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

  为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。

  在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。

  考虑到目前用于在使用音视频类软件播放音视频文件时,为用户推荐音视频文件往往并不适用于用户当前的场景,也即无法满足用户当前的播放需求,用户体验较差;基于此,本公开实施例提供了一种音视频类型的推荐方法、装置、设备及存储介质,该技术可以应用于手机、平板电脑、可穿戴设备、耳机和计算机等可播放音视频或可安装音视频类软件的设备上,为便于理解,以下对本公开实施例进行详细介绍。

  在本实施例中,用户针对音视频类软件发出音视频文件播放请求,该请求诸如启动应用软件app的请求、在app内的搜索请求、在app界面对音视频的滑动请求等;通过对用户的上述音视频文件播放请求做出响应,可以至少获取播放场景特征;其中,播放场景特征包括当前时间信息和\或当前地点信息。当然,除了播放场景特征,在实际应用中还可以获取其他特征,比如用户搜索关键词的特征。

  步骤s104,将播放场景特征输入至用户的音视频类型推荐模型中,经过音视频类型推荐模型的处理后,输出为用户推荐的音视频类型。

  其中,音视频类型推荐模型为基于用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系进行训练得到的机器学习模型,能够较好地体现用户平时在何种播放场景特征下对应何种音视频类型的播放习惯,经由音视频类型推荐模型对播放场景特征进行处理后,输出的音视频类型通常可以较好地满足当前场景下的用户需求。在具体应用中,音视频类型推荐模型可以为机器学习模型,诸如cnn网络(convolutionalneuralnetworks,卷积神经网络)、线性分类器等。

  当然,在音视频类型推荐模型输出为用户推荐的音视频类型之后,还可以进一步包括:为用户播放为用户推荐的音视频类型对应的音视频文件。

  本公开实施例提供的音视频类型的推荐方法,通过音视频类型推荐模型对播放场景特征进行处理,以输出为用户推荐的音视频类型。由于音视频类型推荐模型为基于用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系进行训练得到的机器学习模型,能够较好地体现用户在何种播放场景特征下对应何种音视频类型的播放习惯,从而,通过音视频类型推荐模型对播放场景特征进行处理后输出的音视频类型,能够较好地满足用户当前的播放需求,提升了用户对音视频类软件的使用体验。

  为了使音视频类型推荐模型可以直接应用于音视频推荐,可以预先基于机器学习生成该模型,以使学习后生成的音视频类型推荐模型能够得到预期的音视频类型推荐效果。参照图2,本实施例给出了一种音视频类型推荐模型生成方法,该方法可以在上述步骤s104之前执行,参照如下步骤s202和步骤s204:

  在本实施例中,可以通过如下方式收集播放习惯,即每当用户播放音视频文件时,均执行如下收集操作:

  (1)记录播放时间信息。在实际场景中,用户在不同时间通常会播放不同类型的音视频文件。比如:在下班时间(17:00-18:30)会选择播放相声类型、新闻广播类型的音频文件,在晚饭时间(19:00-20:30)会选择播放电视剧类型的视频文件。基于此,可以将播放时间信息作为音视频类型的影响因素,将其收集为一项播放习惯的信息。

  (2)通过定位获取播放地点信息。在实际场景中,播放地点也是音视频类型的一项重要影响因素;比如,用户在健身房通常选择摇滚等类型的音频文件,在车站候车时可能选择综艺类型的视频文件。基于此,可以通过定位将播放地点信息收集为一项播放习惯的信息。

  (3)记录音视频文件的类型。在一种可能的实现方式中,可以设置预设时间(比如3分钟),先判断用户播放的音视频文件是否达到该预设时间,如果达到,记录该视频文件的类型。可以理解,当视频文件达到预设时间时,表示用户对其感兴趣,那么,该视频文件的类型可能属于用户喜欢的类型,从而将音视频文件的类型收集为一项播放习惯的信息。

  (4)记录用户针对音视频文件的热度信息。具体的,可以记录用户对音视频文件的搜索次数、各音视频文件的播放时长、播放次数等信息,热度信息能够体现用户对不同音视频类型的喜好程度。

  基于以上收集操作,本实施例中的播放习惯包括但不限于以下中的至少一项:针对音视频文件的播放时间信息和\或播放地点信息,以及音视频文件的类型;以及,针对音视频文件的热度信息;热度信息包括搜索次数、播放时长和\或播放次数。

  步骤s204,通过机器学习的方式,基于播放习惯,生成用户的音视频类型推荐模型。

  在实际应用中,将上述多种播放习惯的信息作为样本数据输入至待训练的音视频类型推荐模型,由于播放习惯是在用户播放音视频文件时采集的,播放习惯属于用户的历史音视频播放行为;从而,基于采集到的播放习惯,音视频类型推荐模型能够学习用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系。

  在一可选实施方式中,机器学习可以为对样本数据的无监督学习,在此情况下,生成用户的音视频类型推荐模型的步骤可以包括:对收集到的用户对音视频文件的播放习惯中的信息进行聚类处理,得到用户的音视频类型推荐模型。

  在具体实现时,将播放时间信息、播放地点信息、音视频文件的类型、热度信息等播放习惯中的信息作为样本数据,根据预设的聚类算法(诸如关联规则算法)对样本数据之间的相似度进行计算,并将相似度达到预设阈值的样本数据聚为一类,以得到多个信息集合;可以理解的是,同一信息集合内的播放习惯的信息相似度较高,不同信息集合之间的播放习惯的信息相似度较低。利用聚类后的信息集合,在播放习惯的信息中提取出播放场景特征与音视频类型之间的对应关系。音视频类型推荐模型通过学习上述对应关系,向用户推荐满足用户需求的音视频类型。

  在又一可选实施方式中,机器学习可以为对样本数据的有监督学习,在此情况下,生成用户的音视频类型推荐模型的步骤可以包括:将收集到的用户对音视频文件的播放习惯中的音视频文件的类型作为目标,对播放习惯中的信息进行分类处理,得到用户的音视频类型推荐模型。

  在具体实现时,将播放习惯中每条样本数据的标签,具体的,将播放习惯中的音视频文件的类型作为对应的样本数据的标签。对样本数据的有监督学习,也可以理解为,将具有标签的样本数据输入至待训练的音视频类型推荐模型,基于有标签的样本数据进行训练,得到经过训练的音视频类型推荐模型,以使得音视频类型推荐模型在实际生产应用中,向用户推荐的音视频类型能够满足用户需求。

  相比于无监督学习的过程,在上述有监督学习的过程中,用于学习的数据为具有标签的样本数据,因而学习效果更好,经模型推荐的音视频类型准确性更高。

  基于完成机器学习后的音视频类型推荐模型,可以在实际使用过程中,先通过响应用户的音视频文件播放请求获取以下至少一项特征的信息:播放时间信息、播放地点信息、用户的行为操作;然后通过音视频类型推荐模型对上述特征的信息进行处理,确定与上述特征相似度较高的分类结果或聚类结果,由此输出为用户推荐的音视频类型。

  综上,上述公开实施例提供的音视频类型的推荐方法,通过音视频类型推荐模型为用户推荐合适类型的音乐、视频等音视频文件;例如,当用户在某一时间和地点启动音视频类软件时,音视频类型推荐模型可以根据当前的时间、地点对应的播放场景特征,查找与该播放场景特征相类似的历史播放场景特征,并获取该查找到的历史播放场景特征对应的音视频类型;然后向用户推荐相同音视频类型的音视频文件。该方式不需要用户手动搜索,且有效避免了用户不满意当前的短视频推荐的情况。进而,上述实施例提供的音视频类型的推荐方法,能够较好地满足用户当前的播放需求,提升了用户对音视频类软件的使用体验;此外,还能够增加对音视频类软件的用户黏度,增加用户打开音视频类软件的次数,消费时间变长。

  本公开提供了一种音视频类型的推荐装置,用于实现上述实施例中的音视频类型的推荐方法。参照图3,该装置包括:

  获取模块302,用于响应于用户的音视频文件播放请求,获取播放场景特征;其中,播放场景特征包括当前时间信息和\或当前地点信息;

  推荐模块304,用于将播放场景特征输入至用户的音视频类型推荐模型中,经过音视频类型推荐模型的处理后,输出为用户推荐的音视频类型;其中,音视频类型推荐模型为基于用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系进行训练得到的机器学习模型。

  本实施例提供的音视频类型的推荐装置,通过音视频类型推荐模型对播放场景特征进行处理,以输出为用户推荐的音视频类型。由于音视频类型推荐模型为基于用户的历史音视频播放行为中的播放场景特征与音视频类型之间的对应关系进行训练得到的机器学习模型,能够较好地体现用户在何种播放场景特征下对应何种音视频类型的播放习惯,从而,通过音视频类型推荐模型对播放场景特征进行处理后输出的音视频类型,能够较好地满足用户当前的播放需求,提升了用户对音视频类软件的使用体验。

  在一种实施例中,装置还包括:收集模块(图中未示出),用于收集用户对音视频文件的播放习惯;其中,播放习惯包括针对音视频文件的播放时间信息和\或播放地点信息,以及音视频文件的类型;生成模块(图中未示出),用于通过机器学习的方式,基于播放习惯,生成用户的音视频类型推荐模型。

  在一种实施例中,播放习惯还包括针对音视频文件的热度信息;热度信息包括搜索次数、播放时长和\或播放次数。

  在一种实施例中,生成模块具体用于:对收集到的用户对音视频文件的播放习惯中的信息进行聚类处理,得到用户的音视频类型推荐模型。

  在一种实施例中,生成模块具体用于:将收集到的用户对音视频文件的播放习惯中的音视频文件的类型作为目标,对播放习惯中的信息进行分类处理,得到用户的音视频类型推荐模型。

  在一种实施例中,装置还包括播放模块(图中未示出),用于为用户播放为用户推荐的音视频类型对应的音视频文件。

  本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例一相同,为简要描述,本实施例部分未提及之处,可参考前述方法实施例一中相应内容。

  基于前述实施例,本实施例给出了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端设备上运行时,使得终端设备实现上述音视频类型的推荐方法。

  另外,本公开实施例还提供了一种音视频类型的推荐设备,参见图4所示,可以包括:

  处理器401、存储器402、输入装置403和输出装置404。音视频类型的推荐设备中的处理器401的数量可以一个或多个,图4中以一个处理器为例。在本发明的一些实施例中,处理器401、存储器402、输入装置403和输出装置404可通过总线或其它方式连接,其中,图4中以通过总线可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行音视频类型的推荐设备的各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置403可用于接收输入的数字或字符信息,以及产生与音视频类型的推荐设备的用户设置以及功能控制有关的信号输入。

  具体在本实施例中,处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现上述音视频类型的推荐设备的各种功能。

  需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

  以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

推荐资讯
推荐产品