记录

哈哈,随心记

huggingface

"huggingface"

国内镜像下载 国内镜像下载 huggingfacec 1 2 3 export HF_ENDPOINT=https://hf-mirror.com from huggingface_hub import snapshot_download snapshot_download(repo_id='defog/sqlcoder2',repo_type='model',local_dir=...

多机免密登录

"多机免密登录"

背景 步骤 参考 背景 多机之间多gpu的联合训练需要开启多机之间的免密登录。 步骤 1.查看本地是否存在秘钥文件 1 2 ls ~/.ssh/id_rsa.pub 注意:如果不存在的话需要进行第二步,存在的话就直接跳转第三步骤 2.使用 ssh-key-gen 在本地主机上创建公钥和密钥 1 ssh-keygen -t rsa 3.把公钥复制到需要打通的机器上 1 ...

deepspeed

"deepspeed"

环境 环境 1 conda install mpi4y mpich -c conda-forge

大模型综述

"llms"

概述 背景 GPT 资源 数据集 库资源 训练 数据 数据预处理 架构 模型训练 参考 概述 从技术上讲,语言建模(LM)是提高机器语言智能的主要方法之一。一般来说,LM 旨在对词序列的生成概率进行建模,以预测未来...

推荐系统概述

"recommend"

一、前言 二、背景 三、业界推荐系统架构 四、微盟推荐系统设计介绍 一、前言     电商系统中的推荐系统是一种基于用户历史行为、商品属性等信息,为用户推荐可能感兴趣的商品的系统。在电商系统中,推荐系统是非常重要的一环,因为它可以帮助用户快速找到自己需要的商品,提高用户购物体验,同时也可以帮助电商平台提高销售额。     推荐系统的实现需要考虑多个因素,包括数据收集、特征...

动态权重

"recommend"

参考 参考 1.动态权重 2.帮助新用户 3.先验知识 4.推荐算法五环

深度学习trick

"trick"

Drop多次 参考 Drop多次 回归中不适用DropOut 参考 1.科学空间 2.回归dropout

特征处理

"特征处理"

特征处理 什么是好的特征 缺失值处理 连续特征 分桶 非线性变换 归一化: 数据平滑 ctr平滑 参考 特征处理 1 2 3 4 1.覆盖率判断 2.采集成本分析 3.特征完整度:有的单一特征是没有意义的。例如视频的清晰度必须搭配...

sklearn

"sklearn"

模型保存 1 2 3 from sklearn.externals import joblib joblib.dump(model, "") model = joblib.load("")

pandas

"pandas"

基操 基操 1 2 1.创建空dataframe:df_empty = pd.DataFrame(columns=['A', 'B', 'C', 'D']) 2.合并dataframe:pd.concat([df1,df2],axis=1) 1 为列,0为行