记录

哈哈,随心记

numpy

"numpy"

array array array合并: 1 2 3 4 A = np.array([1,1,1]) B = np.array([2,2,2]) np.vstack((A,B)) # 上下合并 np.hstack((A,B)) # 水平合并 空数组 1

lightgbm

"lightgbm"

配置 使用 配置 1 2 config('spark.jars.packages', "com.microsoft.ml.spark:mmlspark_2.11:0.18.1") .config('spark.jars', "./notebook/jar/lightgbmlib-2.2.350.jar") 使用 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ...

类别不均衡

"trick"

带来的问题 解决方式 模型层面 类别加权 Focal loss GHM loss 数据层面 欠采样 过采样 其他 参考 带...

ner

"实体抽取"

基础概念 bert+crf的不足 嵌套Nested 不连续 序列标注范式 MRC范式 指针范式 多头标注 典型模型 总结 参考 基础概念 bert+crf的不足 复杂场景:flat、nested ner以及不连续ner等复杂场景的出现 线上推断效率:crf的解码速...

优化方法

"优化方法"

优化方法框架 优化方法 GD mini-batch GD Momentum Nesterov Adagrad RMSprop Adadelta Adam Adammax Nadam RAdam lookhead rang...

实时数据测试

"实时数据测试"

nc nc 1 2 3 1.下载软件:https://eternallybored.org/misc/netcat/ 2.解压将其中的nv.exe复制到当前用户目录下 3.在cmd界面nc -L -p 端口号进行测试

深度学习部署

"onnx"

模型导出 预测 代码示例 模型导出 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 #构建模型 import torch class Dense(torch.nn.Module): def __init__(self): sup...

bandit

"bandit"

概述 探索和利用 bandit与推荐系统 累计遗憾 Bandit Epsilon-Greedy Thompson sampling Beta分布 UCB LinUCB ...

搜索排序

"搜索排序"

分类 参考 分类 pointWise 1 对排序列表中的每一项直接学习一个分值,然后按照相应的分值进行排序。常见的模型有LR、FM、XGB、GBDT。 pairWise 1 列表中两两学习先后关系,常见模型有GBRank、RankNet、LambdaMart、RankSVM。LambdaMart是Lambda和MART(Multiple Additive Regression...

工厂模式

"共产模式"

概念 一般实现 SpringBoot工厂模式 参考 概念 定义一个创建对象的接口,让其子类自己决定实例化哪一个工厂类,工厂模式使其创建过程 延迟到子类中。 一般实现 实现步骤 1 2 3 1.创建一个接口 2.实现接口的实体类 3.创建一个工厂,生成基于给定信息的实体类的对象 创建接口 1 2 3 public interface Fruit { vo...