大家一定收集了很多大佬们分享的资源,但是对于上千上万的大合集,每个上传者分类的方式都不一样,收集的资源量如果太多,每次观赏的时候就要选好久。
另外,一些影片网站上的进度条上的标签对于定位想看的内容有很大的帮助
为了每次欣赏作品的时候都能最快速度定位到想看的内容,我正在构思一个解决方案:首先创建一个色色标签集(sample:[handjob,hugebreasts,footjob,threesome,doggystyle.....]),用于管理资料中的角色外貌、主要玩法、体位等等
A:对于每一个影片,使用FFMPEG间隔x帧取缩略图,保存下来;
然后使用CLIP,tagger等模型反推提示词,将置信度高的提示词和色色标签集进行匹配,如果包含则保存下来;
处理完所有缩略图后,保存反推模型输出的所有出现过的色色标签集,作为影片的关键词;
将缩略图的标签集中连续出现的标签作为进度条标签写入视频文件中,连续出现的标签变化的时间点作为标签节点;
以上算一个影片处理完成。
B:对于漫画要简单一些,同样使用反推模型生成色色标签集,直接保存出现过的标签集
由于我没有接触过影片封装和流媒体服务器,所以有一些问题:
将进度条标签封装进影片是否需要重新编解码?标签是否存在多种格式?常见的流媒体服务器(jellyfin、plex)是否支持这些标签?这些流媒体服务器中的搜索功能一般是针对影片标题吗?能否通过写入元数据的方法来让服务器检索到需要的影片?
对于漫画,我也一个疑问:有些用户是使用mango等漫画管理服务器管理资料,漫画都是压缩文件。如果要逐个解压再处理可能对硬盘的负载很大,是否存在什么开发库,可以将压缩文件解压后缓存在内存中直接操作?
最后对于这个项目,我也有一个问题:
有没有大佬知道全网是否存在类似或相同的项目?如果存在高可用性的同类项目高我就不做了至少我用"'hentai auto sorting','porn auto sorting'"等关键字搜索,没有找到
希望有大佬交流讨论一下,研究一下思路