谁有法医秦明百度云资源 我买 单里面必须要有资源

百度云是如何识别出 A 片的?
百度云里面大部分的XX影片都不能看了(不要问我是怎么知道的)百度云是如何识别出这类电影的。
132 个回答
这个只看重召回率(宁可错杀一万不要放过一个)的话,图像识别的技术已经可以做到不错了。根据每一帧里面的图像抽取特征,然后跑个分类器就好了。Porn这种模式单一,重点突出,机位固定,然后人体各个部位pattern又那么明显,相信只要有足够的训练数据,并不是一个特别难的机器学习问题。当然你硬要拍两个奥特曼高达穿着盔甲干啥啥,估计不太好识别= = 但是人观众也是为了简单的刺激,你硬搞这么深奥的想必市场不怎么样吧?误杀一般都是加菲猫之类的....毕竟全身都是黄的。具体百度网盘是怎么做的,我猜是机器学习+MD5识别。如果我来干这个的话,先按照经典的方法做一个模型出来,特征就是视频图像识别的特征+文件名文本特征+文件格式,大小等特征。模型拿个常见分类器就行了。估计音频特征也可以,porn的音频特点也很明确(日语 or 英语那些词太明显了),一抓一个准。继续丧心病狂的话就加视频特征。连续多帧里面人数量的变化啦(人数量相对固定,大都是一到两个,三四个也有,再多就不是那么常见了);人物移动的pattern啦(很少大范围的移动,而更多是小范围的往复运动);发生的场景啦(大都是室内小空间,并连续很多分钟都是一个场景啦,偶尔有一些外景)。不过我觉得完全不需要这么复杂就可以做到很高的准确率了......有模型之后,每隔一天或者几天,具体根据模型效率和机器的负载来决定,在网盘的图片和视频数据上跑一遍,把不该有的东西干掉,然后记录下MD5码。 这些MD5码就是黑名单了,往后每次用户新上传的时候就用这个MD5码做一次判断,不该有的就不让你传了。就是一次哈希查找,效率很快,根据百度网盘本身极速上传功能推断,百度已经有了很成熟的MD5操作的模块了。这两个加起来就既满足了效果(靠机器学习模型每隔一段时间的精确判断),也满足了效率(MD5实时校验)。所以呢,你们不要以为改了MD5码就可以逃得过去了,过一段时间人家重跑自动识别算法时还是会被干掉的...这种内容我党管的那么严,搞不好部门领导就要被喊去喝茶的,不可能不好好做的...---------------------------------------闲扯的分割线--------------------------------色情内容识别是一个很认真的研究领域好咩。不过...干这个确实需要大量的训练数据。当年中科院计算所有一个组在做这方面的国家项目,黄色+反动内容识别。人家都是带着条子和公款去国外采购影片和轮子的东东回来做训练数据的......我不懂事的时候有个女朋友花钱太厉害,逼的没办法去一家前著名论坛网站打零工做过类似项目,不过是自动识别黄色/反动的文本...... 他们有积累了很久的人工识别的数据。招了不少人做类似鉴黄师的工作,三班倒每班连干八小时,拿一个简单的搜索引擎对用户发布的内容不停地用各种关键词搜,看到不该看的就删帖+搜集起来。然后这些人工识别的数据拿来给我们训练自动识别模型。当时为了提高识别效果我被迫看了好多训练数据。。。。。。我只能说......太刺激了....太暴力了....太有想象力了......我原先只知道有黄色的,有反动的,没想到还有黄色+反动的........你能想象拿四人帮做主角的XX小说么........看起来真是一种复杂的感受....类似比利时啤酒,无数种强烈风味的混合,造成了独特的饮用体验...总之,这对于纯洁的我实在是太下流了....一张白纸的我就这么被污染了...再也回不去了......喂,你们不要误会,我那个工作是做模型自动识别来着,不是人工看好么。。。而且也只是那半年工作很小的一部分。。。大部分时间还是在给他们做站内搜索和开发公司自己的基础C++库来着。人工谁要干啊,估计时薪只有十块钱,还要看那么多好恶心的东西...黄瓜茄子一看就会想呕怎么办......
没错,就是根据md5值,因为我改掉md5值之后还没有一部被温馨提示。改完md5值后上传的视频不会温馨提示,具体方法看这个链接。直接把要修改的文件拖到下载的批处理文件上就行。评论里有好多问各种问题的,其实我也是外行。如果已经温馨提示了,那应该就没救了。我用软件打开看过,除了那8秒温馨提示,其他部分的二进制数据基本都是0了,也就是说真的没东西了(刚开始和谐的时候,温馨提示的文件里内容还在,现在真没了)。这个问题我觉得没法解决了,要是有办法大神可以教我。修改md5值之后上传肯定不能秒传,目前我还没发现被和谐,以后不好说,但是应该不会太严重。评论还有说转格式的、压缩文件,应该都是可以的,因为md5也变了;单纯改后缀应该不行。貌似说了多余的话,被建议修改了。所以求分享的你们别闹了,我这么纯洁,根本听不懂你们在说啥。。
百度云怎么识别不知道,但是曾经听前Google XLab某Scientist讲段子说过youtube怎么识别黄色视频的。Youtube每天上传的视频量估计比百度云一个月都多,他们有一个专门的大团队来鉴黄。当年他们也和各位其他答主一样,认为高大上计算机视觉是可以解决这个问题的,于是乎他们花了大量的时间和金钱使用了各种高大上的算法在视频里面检测裸体,什么颜色啦,动作啦,人脸,器官识别啦。几个月过去了,然而并没有什么卵用。两大问题,一是速度太慢。二是准确度还是太低。后来有个神哥们临危受命加入这个组,万万没想到,这个问题被他解决了。后来这哥们在google research混的风生水起。你知道他是怎么解决的吗?只检测音频中的叫床声。
我来提一套可能的半自动方案,当然现实中是怎么运作的我就不清楚了。--------------------------------------------------步骤1:数学筛选--------------------------------------------------------首先把百度云上的视频采样分析。例如每个片子截取100张图片,然后自动分析图片内容。值得注意的是,自动分析黄片内容不是不可能的,例如:使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是黄片。使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是黄片。我听说黄片中的人物一般都不穿衣服,所以整部片子中皮肤面积会占屏幕比重比较大,特征明显。不过我是好孩子所以也不清楚到底是不是真的。然后用一些算法进行评分处理。。例如:通过皮肤的位置和分布分析是不是黄片儿:这些数学算法能把图片特征量化,通过这些量化的数据进一步分析做到黄片的筛选。--------------------------------------------------步骤2:玄学筛选--------------------------------------------------------光通过数据分析不可能做到完美筛选全部黄片,但是本着宁可错杀一千不能放过一部的原则,我们可以通过实践(改变通过的变量)肯定找到一个能筛选出所有黄片的算法。这个算法可能误杀大量正(绅)常(士)视频,但是也能排除绝大多数非黄片。剩下来的糟粕可以进一步用机器学习来筛选。。例如某同学的硕士毕业论文:当然,也可以跳过第一步直接上第二部,如果计算能力和精确度都不是问题的话。--------------------------------------------------步骤3:人工筛选--------------------------------------------------------最后剩下的交给他审核一下。。。------------------------------------------------步骤4:举报机制--------------------------------------------------------人人都是小小鉴黄师比如这类AV。。。就需要各位小鉴黄师们的努力了。
Md5是必杀技,但是对于百度这家广告公司来说,行为统计分析才是拿手好戏,下载量时间分布,在线播放快进频率,文件命名规则,跳转到网盘之前的搜索行为,再对接网友举报,av数据库,离线下载来源分析,根本就不需要人工审核,可疑概率小于一定值的百度直接放过。(乱猜的)
快进次数和每次播放时长吧
在知乎回答不多,这个问题恰好涉及到最近处理大批网盘资源的问题,顺便讲讲。作为男人,没看过几个AV,确实枉赴尘世一趟(被强帖了标签的哥们,请无视吧。。)看过AV,难免就有要收藏的欲望,藏在硬盘?保密性、快捷性当然无话可说,随点随开,安全无忧,但毕竟真正用电脑点开看av的概率并不非常高,而手机内存又存不了几部av,那么相对来说网盘就恰好解决了这个问题,只要有wifi随时随地戴着耳机倾情观赏磨练。较早的时候,百度云是不管你放什么资源的,即便是你分享av在外面的链接,也是不会删你的。后来随着国家政策影响,严打一步步深入,百度开始利用自身技术发尽威风。不得不说,百度云视频识别技术的确很牛。刚开始改个名,就能免和谐,后来流行什么种子洗白器,稍狠一点的时候在线观看是8秒和谐视频,下载下来还能看,其实那时候是百度云的一个暗示,被和谐的下一步,警惕性高的网友可能会将网盘下下来。果不然,后来下载下来的视频也成了8秒和谐,这就代表网盘存储的av,已经彻底歇菜,表明百度云将服务器里的所有av视频源文件都给替换了,找回是不可能的,除非。。。除非李彦宏也是av热爱者,悄悄的备份了这些海量av。。。。咳,还是不要异想天开了。--言归真正--那么这时候怎么办呢? av还是要看的,网盘还是要传的,如何避免和谐?改md5?非长久之道,后续应该还是可以和谐。 我的应对之策是,将新的av用快速视频截取工具,批量截掉视频头尾的10秒钟(这些内容应该不会影响主要观感。。),如此方法,是防止百度云开发出类似音频文件的音频指纹技术出来,将av源文件的“指纹”跟改到md5的视频比对,进而和谐,这个技术开发出来理论上应该不难。 截掉视频的头尾片段,可以规避掉这个和谐手段。为了长治久安,避免全军覆没的惨剧重演,只有下这狠招了。其次方法,打包压缩加密av,密码可以设置成一样数字加大小字母加特殊符号的,这是最保险的方法,百度云就算再牛逼的服务器,要破解这个文件,cpu全跑,也得8年以上。。。还有略简单的保险手段,用万能文件分割器,将av作为普通文件分割成两个,再这两个文件上传到网盘里,由于无法识别出新的文件格式,在服务器里就像一堆垃圾它们不会动你的,也打不开(要合并分割的文件也用文件分割器合并)。后面两个方法最保险但是也是最繁琐的,当然缺陷也很大,就是不能在线观看。 个人认为第一个方法是最好的。================================================以上是从思路上进行探讨,讨论视频云识别技术和为了改进该技术提出的对抗策略,而非讨论如何防止涉黄内容被查,纯技术讨论,纯技术。。。纯技。。。纯。。。大家看av还是要瞧瞧的看,一个人看,不要传播。最后的告诫:小撸怡情,大撸伤身,强撸灰飞烟灭,各位,悠着点~---------------------------------------------------------------更新:以第一种解决方案在今年5月上传的视频,到目前为止依然正常,可点播可下载----------------------更新:时隔一年,截止,第一种方法依然可以在线播放。
这个东西其实不用机器学习都能做到100%····直接MD5加文件名识别然后派几个人工审查,这个没什么技术含量,招几个人每天看片子,规定一天必须看1W片以上即可。这些工人工资一个月4K-5K即可。招个4-5个,一个月估计就15k-20K的开销。比招那些会机器学习的便宜多了
忘记在哪里看到的了。据说是根据来源的地址又或者是md5这类的文件指纹来比对的。
索尼锁区,武媚娘等事件告诉我们,一定有些人看过之后就举报
已有帐号?
无法登录?
社交帐号登录}

我要回帖

更多关于 法医秦明百度云资源 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信