淘歌吧开发出歌名去重功能,全面检索歌名重复率
不同歌源比如阳光、钱柜以及其他代理那里拿来的歌曲汇总之后经常会有重复的现象,人工排查非常痛苦而且易错,之前的重复率检测,主要靠人工和文件本身的MD5值校验,非常慢准确。为此,我们研发了歌名去重检测的技术。{:4_196:}此项技术将用于2017年以后的歌库更新中,将会大大降低歌曲重复上传的概率。
以下是技术展示:
1.将混有重复歌名和近似歌名的两组歌曲名字分别输入测试框:
2.经检测后就会把相似率大于一定指标的疑似重名歌曲排查出来,包括歌曲所在第几行。
什么时候把软件发一下 zjct8 发表于 2017-5-18 14:50
什么时候把软件发一下
软件为我们团队使用,用于歌库发布时排重,不对外公布。 楼主这种会技术的就是好,平时也整理整理歌库,无奈很多想法都需要技来来支持才能实现。
页:
[1]