FFM模型豪沃克工具包64位支持64位吗

外国人聊天的时候喜欢用ffm提问,请问这是啥意思呀~_百度知道一台模型机有7条指令,其使用频度分别为35%,25%,20%,10%,5%,3%,2%。该模型机有8位和16位两种指令字_百度知道开源中国 - 找到您想要的开源项目,分享和交流
当前访客身份:游客 [
转眼就到9月,源创会日程已过大半,刚结束杭州站,就要到@红薯 的根据地珠海,各位 OSCer 怎么能错过呢...
微软推出TypeScript编程语言已有差不多4年时间,不过该公司正准备发布第二个大版本。TypeScript 2.0的开...
最新人才入驻
最新作品与服务
56回/6152阅
By cloudwiseAPM
6回/1266阅
7回/1751阅
By sidney9111
7回/1969阅
By zouqilin
By GestureWei
By jj_soft...
By HeartArea
By 您的好友
By 您的好友
By tegger_net
By gdutqiang...
By GestureWei
By zabcd117
By zabcd117
By IdleMan
By IdleMan
热门招聘城市:
线下招聘沙龙
推荐招聘企业
最新招聘信息
10K-18K/上海
10-19K/深圳
10-18K/深圳
15-30K/北京
15-25K/北京
13-26K/北京
15-25K/上海
8-12K/武汉
16评/1064阅
By runner00
By 落下维幕
10评/673阅
By LonnyDong
13评/1535阅
By Kimi教授
13评/2338阅
By 网名还没想好
11评/1312阅
By 开源春哥
40评/3947阅
By 王静0716
28评/3973阅
By 原版什锦八宝饭
15评/2197阅
本周推荐 FreeCodeCamp
是热度非常高的开源项目,致力于帮助人们利用零散时间学习编程。它的使命是Learn to code and help nonprofits(学习编程,去帮助那些非盈利组织)。
最新推荐博客文章
团队协作开发平台,周报,便签,任务管理,应有尽有,轻松管理轻量级团队。
开源中国社区团队基于开源项目 GitLab 开发的在线代码托管平台。
开源中国基于Sonar打造的代码质量管理系统,与 Git@OSC 紧密结合。
开源中国社区团队跟 MoPaaS 合作,为开发者提供更可靠的代码托管和演示服务。
提供在线CSS/JS 调试,在线API文档,Less CSS编译器等在线工具。
在线编辑测试JS/HTML/CSS的工具,实时预览、保存、分享、Fork。
系统千差万别,开源软件来源不明?一键部署,上云从未如此简单。
扫一扫,关注OSChina微信公共账号
+ 友情链接ML in coding(15)
美团团队的不少文章都不错
/deep-understanding-of-ffm-principles-and-practices.html
自己实现了一把,用python,速度慢于台大的libffm,但效果更好。
几个注意点:
1)label与loss function之间的关系。。。
2)梯度计算时的 中间数据 预计算
3)AdaGrad自适应学习速率。。。
4)使用SGD优化
5)Field-aware Factorization Machine,每个参数都不再独立了,更少的数据能够训练出更好的模型。。。
假设样本的&nn&个特征属于&ff&个field,那么FFM的二次项有&nfnf个隐向量。而在FM模型中,每一维特征的隐向量只有一个。FM可以看作FFM的特例,是把所有特征都归属到一个field时的FFM模型。根据FFM的field敏感特性,可以导出其模型方程。
y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,fj,vj,fi?xixj(4)(4)y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,fj,vj,fi?xixj
其中,fjfj&是第&jj&个特征所属的field。如果隐向量的长度为&kk,那么FFM的二次参数有&nfknfk&个,远多于FM模型的nknk&个。此外,由于隐向量与field相关,FFM二次项并不能够化简,其预测复杂度是&O(kn2)O(kn2)。
下面,由于“第一”是ffm默认处理的,所以“第二”、“第三”就需要自己在把数据转换成libffm的数据格式时,处理完毕。。。(真的只有在用的时候,才会注意到各种细节。。。)
在训练FFM的过程中,有许多小细节值得特别关注。
第一,样本归一化。FFM默认是进行样本数据的归一化,即&pa.normpa.norm&为真;若此参数设置为假,很容易造成数据inf溢出,进而引起梯度计算的nan错误。因此,样本层面的数据是推荐进行归一化的。
第二,特征归一化。CTR/CVR模型采用了多种类型的源特征,包括数值型和categorical类型等。但是,categorical类编码后的特征取值只有0或1,较大的数值型特征会造成样本归一化后categorical类生成特征的值非常小,没有区分性。例如,一条用户-商品记录,用户为“男”性,商品的销量是5000个(假设其它特征的值为零),那么归一化后特征“sex=male”(性别为男)的值略小于0.0002,而“volume”(销量)的值近似为1。特征“sex=male”在这个样本中的作用几乎可以忽略不计,这是相当不合理的。因此,将源数值型特征的值归一化到&[0,1][0,1]&是非常必要的。
第三,省略零值特征。从FFM模型的表达式(4)可以看出,零值特征对模型完全没有贡献。包含零值特征的一次项和组合项均为零,对于训练模型参数或者目标值预估是没有作用的。因此,可以省去零值特征,提高FFM模型训练和预测的速度,这也是稀疏样本采用FFM的显著优势。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:151783次
积分:4644
积分:4644
排名:第4374名
原创:297篇
转载:54篇
评论:74条
本科:南航“妓院”,软件工程专业,保送北大直博。
博士:北大信科学院,方向是大数据与机器学习,至今未入门,希望高人指点。。。
联系方式:hy.mao@。
本科实习:北京去哪儿网(北京趣拿软件科技有限公司),做: Arpu值预测——大数据应用; 流程效率监控平台——BPM类开发。
阅读:4833
文章:35篇
阅读:27267
(7)(2)(10)(7)(6)(14)(20)(3)(12)(18)(9)(7)(21)(42)(44)(11)(7)(11)(5)(3)(43)(16)(11)(13)}

我要回帖

更多关于 ppt超级工具包64位 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信