FFM模型豪沃克工具包64位支持64位吗

点击联系发帖人 时间：2016-08-25 11:51

ppt超级工具包64位

外国人聊天的时候喜欢用ffm提问，请问这是啥意思呀~_百度知道一台模型机有7条指令，其使用频度分别为35%，25%，20%，10%，5%，3%，2%。该模型机有8位和16位两种指令字_百度知道开源中国 - 找到您想要的开源项目，分享和交流
当前访客身份：游客 [
转眼就到9月，源创会日程已过大半，刚结束杭州站，就要到@红薯的根据地珠海，各位 OSCer 怎么能错过呢...
微软推出TypeScript编程语言已有差不多4年时间，不过该公司正准备发布第二个大版本。TypeScript 2.0的开...
最新人才入驻
最新作品与服务
56回/6152阅
By cloudwiseAPM
6回/1266阅
7回/1751阅
By sidney9111
7回/1969阅
By zouqilin
By GestureWei
By jj_soft...
By HeartArea
By 您的好友
By 您的好友
By tegger_net
By gdutqiang...
By GestureWei
By zabcd117
By zabcd117
By IdleMan
By IdleMan
热门招聘城市:
线下招聘沙龙
推荐招聘企业
最新招聘信息
10K-18K/上海
10-19K/深圳
10-18K/深圳
15-30K/北京
15-25K/北京
13-26K/北京
15-25K/上海
8-12K/武汉
16评/1064阅
By runner00
By 落下维幕
10评/673阅
By LonnyDong
13评/1535阅
By Kimi教授
13评/2338阅
By 网名还没想好
11评/1312阅
By 开源春哥
40评/3947阅
By 王静0716
28评/3973阅
By 原版什锦八宝饭
15评/2197阅
本周推荐 FreeCodeCamp
是热度非常高的开源项目，致力于帮助人们利用零散时间学习编程。它的使命是Learn to code and help nonprofits（学习编程，去帮助那些非盈利组织）。
最新推荐博客文章
团队协作开发平台，周报，便签，任务管理，应有尽有，轻松管理轻量级团队。
开源中国社区团队基于开源项目 GitLab 开发的在线代码托管平台。
开源中国基于Sonar打造的代码质量管理系统，与 Git@OSC 紧密结合。
开源中国社区团队跟 MoPaaS 合作，为开发者提供更可靠的代码托管和演示服务。
提供在线CSS/JS 调试，在线API文档,Less CSS编译器等在线工具。
在线编辑测试JS/HTML/CSS的工具,实时预览、保存、分享、Fork。
系统千差万别，开源软件来源不明？一键部署，上云从未如此简单。
扫一扫，关注OSChina微信公共账号
+ 友情链接ML in coding（15）
美团团队的不少文章都不错
/deep-understanding-of-ffm-principles-and-practices.html
自己实现了一把，用python，速度慢于台大的libffm，但效果更好。
几个注意点：
1）label与loss function之间的关系。。。
2）梯度计算时的中间数据预计算
3）AdaGrad自适应学习速率。。。
4）使用SGD优化
5）Field-aware Factorization Machine，每个参数都不再独立了，更少的数据能够训练出更好的模型。。。
假设样本的&nn&个特征属于&ff&个field，那么FFM的二次项有&nfnf个隐向量。而在FM模型中，每一维特征的隐向量只有一个。FM可以看作FFM的特例，是把所有特征都归属到一个field时的FFM模型。根据FFM的field敏感特性，可以导出其模型方程。
y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,fj,vj,fi?xixj(4)(4)y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,fj,vj,fi?xixj
其中，fjfj&是第&jj&个特征所属的field。如果隐向量的长度为&kk，那么FFM的二次参数有&nfknfk&个，远多于FM模型的nknk&个。此外，由于隐向量与field相关，FFM二次项并不能够化简，其预测复杂度是&O(kn2)O(kn2)。
下面，由于“第一”是ffm默认处理的，所以“第二”、“第三”就需要自己在把数据转换成libffm的数据格式时，处理完毕。。。（真的只有在用的时候，才会注意到各种细节。。。）
在训练FFM的过程中，有许多小细节值得特别关注。
第一，样本归一化。FFM默认是进行样本数据的归一化，即&pa.normpa.norm&为真；若此参数设置为假，很容易造成数据inf溢出，进而引起梯度计算的nan错误。因此，样本层面的数据是推荐进行归一化的。
第二，特征归一化。CTR/CVR模型采用了多种类型的源特征，包括数值型和categorical类型等。但是，categorical类编码后的特征取值只有0或1，较大的数值型特征会造成样本归一化后categorical类生成特征的值非常小，没有区分性。例如，一条用户-商品记录，用户为“男”性，商品的销量是5000个（假设其它特征的值为零），那么归一化后特征“sex=male”（性别为男）的值略小于0.0002，而“volume”（销量）的值近似为1。特征“sex=male”在这个样本中的作用几乎可以忽略不计，这是相当不合理的。因此，将源数值型特征的值归一化到&[0,1][0,1]&是非常必要的。
第三，省略零值特征。从FFM模型的表达式(4)可以看出，零值特征对模型完全没有贡献。包含零值特征的一次项和组合项均为零，对于训练模型参数或者目标值预估是没有作用的。因此，可以省去零值特征，提高FFM模型训练和预测的速度，这也是稀疏样本采用FFM的显著优势。
参考知识库
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：151783次
积分：4644
积分：4644
排名：第4374名
原创：297篇
转载：54篇
评论：74条
本科：南航“妓院”，软件工程专业，保送北大直博。
博士：北大信科学院，方向是大数据与机器学习，至今未入门，希望高人指点。。。
联系方式：hy.mao@。
本科实习：北京去哪儿网（北京趣拿软件科技有限公司），做： Arpu值预测——大数据应用；流程效率监控平台——BPM类开发。
阅读：4833
文章：35篇
阅读：27267
(7)(2)(10)(7)(6)(14)(20)(3)(12)(18)(9)(7)(21)(42)(44)(11)(7)(11)(5)(3)(43)(16)(11)(13)}

51无线网