记录

哈哈,随心记

错别字

"错别字"

错别字任务 工作流程 参考 错别字任务 通常又以下的错误类型,但在不同的任务中,不是每个都会出现。比如我们要处理的语音识别领域主要涉及到的就是下面的前两种错误: 1 2 3 4 5 6 7 8 谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 字词补全,如 爱有天意-假如爱有天意 形似字错误,如 高梁-高粱 中文拼音...

CTCloss

"损失函数"

目的 基本原理 主要解决的问题 详解 对齐 损失函数 预测 解码 贪心搜索 集束搜索 前缀束搜索 特点 参考 目的 针对语音识别中字符与因素的对应,手写识别中字符与图片的对应、视频标记中动作的标记等诸如输入与输出对应的问题。 上述场景下(各个输入...

一些工具

"环境"

anconda 腾讯云cos jupyter crontab 参考 anconda conda info -e:查看已有环境 conda create -n name python=3.6:新建环境 source activate name:激活环境 conda deactivate:离开环境 conda env remove -n name...

FFM

"推荐"

问题 POLY2 FM 参数更新 损失函数 参考 问题 逻辑回归作为推荐模型中的经典模型是对所有特征的线性加权组合,进而基于sigmod函数来进行非线性的加入: \(\hat{y}(x)=w_0+w_1 x_1+\ldots+w_n x_n=w_0+\sum_{i=1}^n w_i x_i\) 其缺陷就在于仅仅考虑了单一的特...

在线学习

"推荐"


ctr

"推荐"

前深度学习 Logistic Regression(LR) Degree-2 Polynomial Margin(POLY2) Factorization Machine(FM) Field-aware Factorization Machine(FFM) GDBT+LR Follow-the-regula...

lr+gdbt

"推荐"

LR GDBT+LR 参考 LR 逻辑回归作为一种广义线性模型,假设因变量是服从伯努利分布的,在点击率预估或者推荐系统中,点击、购买时间的发生就是模型的因变量y,而用户是否点击或者购买就是一个经典的二分类问题,因此因变量就是服从伯努利分布的,所以采用LR作为CTR或者推荐的模型符合点击购买这一物理意义。 公式化的解释,LR就是讲特征进行加权求和,然后再经过sigmod将...

SVD

"推荐"

基本概念 求解 SVD与推荐系统 参考 基本概念 特征值特征向量:\(Ax = \lambda x\)。其中A为n*n的矩阵,x为n维向量,\(\lambda\)为矩阵A的一个特征值,而x为A的特征值对应的特征性向量。 特征值分解:如果一个矩阵A是一个mm的实对称矩阵\(A = A^T\),那么它可以拆分为如下的形式: \(A=Q \Sigma Q^{T}=Q\lef...

统计机器学习

"统计机器学习"

第一章 第二章 参考 第一章 说明伯努利模型的极大似然估计以及贝叶斯估计中的统计学习三要素。伯努利模型是定义在取之为0和1的随机变量上的概率分布。假设观测到伯努利模型n次独立的数据生成结果为,k次为1,这时可以用极大似然估计或者贝叶斯估计来估计结果为1的概率。 答: 设$P(Y=1) = \theta, P(Y=0) = 1 - \theta$...

flask+uwsgi

"nginx"

项目 uwsgi supervisor nginx 参考 项目 编写各种服务 主要流程: 1 2 3 4 5 6 7 8 首先客户端请求服务资源, nginx作为直接对外的服务接口,接收到客户端发送过来的http请求,会解包、分析, 如果是静态文件请求就根据nginx配置的静态文件目录,返回请求的资源, 如果是动态的请求,nginx就通过配置文件,将请求传递给uW...