2019-05-27 FM实践 背景Fm是工业界比较常用的机器学习算法,在点击预估场景下都能有很好的效果。 FMFM(Factorization Machine)通过向量交叉学习的方式来挖掘特征之间的相关性,实现组合特征,能够很好的挖掘数据特征间的相关性,可以做分类,排序,回归。适应于高度稀疏的特征矩阵,目标函数及优化学习时候都可以在线性时间完成从而也适合在线学习。适用于ctr点击预估,推荐。 FM 大航海 >>
2018-05-12 HA HA解决的问题:hdfs nn单点故障 主备切换过程AutomaticFailoverAutomated Failover 当active namenode崩溃的时候,自动将standby namenode切换成active namenode。 big_data hdfs 大航海 >>
2018-03-12 lvs 介绍LVS集群采用IP负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率,将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故障,从而将一组服务器构成一个高性能的、高可用的虚拟服务器。整个服务器集群的结构对客户是透明的,而且无需修改客户端和服务器端的程序。 lvs 负载均衡 大航海 >>
2018-03-05 决策树 algorithmID3基于熵做分类 熵 熵:度量样本集合不确定度的指标。代表随机变量的复杂度。用来评价整个随机变量x的平均信息量。(反比例) 公式:是每一类的出现概率p的logP倍和 ML 大航海 >>