记录

哈哈,随心记

文本相似度


二叉树

"数据结构"

二叉树的遍历 代码 二叉树的遍历 前序遍历:访问根节点->依照前序遍历访问左子树->依照前序遍历访问右子树 中序遍历:中序遍历左子树->根节点->中序访问右子树 后序遍历:后序遍历左子树->后序遍历右子树->根节点 注意事项:以根访问的顺序决定是何种遍历;左子树优先右子树 代码 1 2 3 ...

集成学习

"集思广益"

一、基本概念 二、学习器的选择 三、随机森林 四、AdaBoost 4.1、算法流程 4.2、\(Adaboost\)前向分布算法 4.3、总结 五、$GDBT$ 六、$XGBOOST$ 6.1、基本思想 6.2、基本原理 6.3、选择什么特征进行分裂 ...

问题总结

"面试问题"

公司面试问题 微盟 平安 一览群智 网络收集问题 机器学习理论 深度学习 NLP 图像 推荐系统 代码 自注意力 多头注意力 公司面试问...

协同过滤

"推荐"

概述 基于用户的协同过滤 基于物品的推荐系统 比较 协同过滤的一些问题 代码 参考 概述 考虑用户之间的相似度或者考虑物品之间的相似度。比如要为一个用户做出推荐,可以先找到与当前用户相似的用户,然后在里面找到当前用户没有购买过的物品推荐过去。同时考虑物品之间的相似度的话,就是针对需要推荐的用户购买过的物品,找到相似的物品进行推荐,比如你现在买了一本机器学习,就...

异常值处理

"机器学习"

异常点检测 异常值处理 异常点检测 简单统计 3\(\alpha\)原则,假设数据服从正太分布,异常值超过3倍的标准差就视其为异常值,正负\(3\alpha\)的概率是99.7%。 箱型图,通过四分位距来对异常值检测,超过上四分位+1.5四分位距离或者下四分位-1.5四分位距离称为异常值。 基于模型的检测 基于近邻度的离群点检测 基于密度的离群点检测 ...

Faiss

"搜索"

简介 简介 FaceBook开源的针对聚类和相似性搜索的库,为稠密向量提供高效相似度搜索和聚类

Pycharm

"工具"

专业版配置远程环境 激活码 远程连接 配置leetcode xshell配置跳板机转发 pycharm设置头文件 专业版配置远程环境 激活码 下载激活码打开http://idea.medeming.com/jets/ 远程连接 依次选择Tools-Deployment-Configuration 然后...

推荐系统多任务学习

"recommend"

概述 模型 ESSM MMOE 参考 概述 什么是多任务学习 1 给定m个任务,任务之间有所关联,目标是整合多个任务的特征来相互促进,最终使得各个任务都得到提升。 share-bottom结构中,各个任务底层参数完全的共享,那各个任务之间就会对参数产生不同的影响,从而加大了训练的难度。 1 2 优点:降低overfit风险,...

推荐系统bias and debias

"recommend"

bias产生的阶段 user->data data->model model->user debais 选择偏置 参考 bias产生的阶段 user->data 1 2 3 4 1.选择偏置:用户对推荐内容可以自由的反馈,一般一会对自己感兴趣或者没有兴趣的内...