记录

哈哈,随心记

ES

"ES"

基础知识 操作es高级客户端步骤 基本操作 连接es 索引 文档 ES插件开发 ES数据迁移 检索 Kibana 查询语句 嵌套查询 更新 搜索更新 局部更新 ...

fasttext

"fasttext"


hive

"hive"

hive操作问题 sql hbase & hive hive事务 注意 hdfs topK 参考 hive操作问题 内存溢出 1 2 3 4 5 set hive.execution.engine=tez; set mapreduce.map.memory.mb=10240; set mapreduce.map.j...

pandas

"pandas"

一些操作 错误纠正 按照pid合并后面的数据: 字典读取为Dataframe 字符串操作 map or apply merge join concat merge join Concat pandas vs mysql 参考 一些操作 1 2 3 4 5 6 7 8 9 10 11 12 1...

PCA

"降维"

基础概念 内积 基 最大可分性 PCA求解 总结 性质 其他 参考 基础概念 PCA作为一种常见的数据分析方式,常用于高维数据的降维,用于提取数据的主要特征分量。 内积 两个向量的A和B的内积的形式如下: \(\left(a_{1}, a_{2}, \cdots, a_{n}\right) \cdo...

房价数据分析

"数据"

引包 分析各个特征 CentralAir中央空调 OverallQual 总体评价 YearBuilt 建造年份 Neighborhood 地段 LotArea 地表面积 GrLivArea 不含车库的室内面积 TotalBsmtSF 地下室面积 MiscVal 附加资产 ...

数据抓取

"crawl"

注意 需要添加headers 代理 参考 注意 需要添加headers 1 2 3 4 5 headers = { 'Cookie': 'OCSSID=4df0bjva6j7ejussu8al3eqo03', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; ...

Hanlp

"hanlp"

文件下载 配置 java python 具体使用 自定义读取data 文件下载 下载data和release 配置 java 1 2 3 将上面的打他解压并复制到springboot项目中的resource下。 将上面的release解压其中的hanlp.properties放在resource下 hanlp-1.7...

pytorch

"torch"

参考 参考 torch提速

sqlalchemy

"ORM(Object-Relational Mapping)"

简介 使用 几种常见的查询 批量增加 其他操作 参考 简介 SQLAlchemy是Python编程语言下的一款开源软件。提供了SQL工具包及对象关系映射(ORM)工具。 使用 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 3...