AI · NLP · ML · Engineering

Practical AI Notes, Systems, and Engineering

围绕 NLP、LLM、机器学习与工程实践,持续沉淀值得复用的方法、系统设计、实验记录与项目思考。

Focus NLP / LLM / ML
Style Notes · Practice · Systems
Content Articles · Experiments · Engineering
Latest Posts

scala

"scala"

提交 性能调优 提交 1 spark-submit --conf spark.hadoop.mapreduce.input.fileinputformat.input.dir.recursive=true --conf spark.hive.mapred.supports.subdirectorie...

java

"java"

语法 语法 map 1 2 3 4 5 6 7 1.初始化:var a:Map[String,Int]=Map() 2.添加元素:a+=("key"->value) 3.获取元素:a.get("key").getOrElse("default") 4.遍历:for((k, v)<- a) 5...

ES

"ES"

基础知识 操作es高级客户端步骤 基本操作 连接es 索引 文档 ES插件开发 ES数据迁移 检索 Kibana 查询语句 嵌套查询 更新 ...

fasttext

"fasttext"

Hive

«««< HEAD layout: post title: “hive” subtitle: “ "hive"” date: 2021-03-22 18:00:00 author: “zwt” header-img: “img/post-bg-2015.jpg” c...

PCA

"降维"

基础概念 内积 基 最大可分性 PCA求解 总结 性质 其他 参考 基础概念 PCA作为一种常见的数据分析方式,常用于高维数据的降维,用于提取数据的主要特征分量。 内积 两个向量的A和B的内积的形式如下: \(\left...

房价数据分析

"数据"

引包 分析各个特征 CentralAir中央空调 OverallQual 总体评价 YearBuilt 建造年份 Neighborhood 地段 LotArea 地表面积 GrLivArea 不含车库的室内面积 ...

数据抓取

"crawl"

注意 需要添加headers 代理 参考 注意 需要添加headers 1 2 3 4 5 headers = { 'Cookie': 'OCSSID=4df0bjva6j7ejussu8al3eqo03', 'User-Agent'...

Hanlp

"hanlp"

文件下载 配置 java python 具体使用 自定义读取data 文件下载 下载data和release 配置 java 1 2 3 将上面的打他解压并复制到springboot项目中的resource下。 将上面的release解压...

pytorch

"torch"

参考 参考 torch提速