AH's Blog

小菜鸟的碎碎念

PCA

PCA Data Representation 数据集:${ \mathbf{x} i }{i=1}^n$ 每个样本都有$d$个特征:$ \mathbf{x}_ i = [ x_ {i1}, …, x_ {id} ]^T \in \mathbb{R}^d $ 可以把数据集表示为矩阵$\m...

Linear Regression

Statistics Review 均值 sample mean \[\overline{x} \triangleq \frac{1}{n} \sum_{i=1}^n x_i,~\overline{y} \triangleq \frac{1}{n} \sum_{i=1}^n y_i\] 方差 sample variance \[s_x^2 \triangleq \fr...

Kotlin Cheat Sheet

Kotlin Cheat Sheet Function fun main() { myFunction("Abigail") } fun myFunction(name: String) { println("Hello, $name!") } Declaration // val: read-only v...

Appendix A

Operating System Notes

Appendix A 指令集架构 机器语言的程序员:必须理解才能为计算机写出正确程序的计算机的结构 硬件设计者:必须理解才能为计算机设计合适的应用的机器描述 指令可被分成三类: 数据移动指令 ALU指令 分支指令(控制流指令) 栈 优点: 代码密度高 硬件要求低 为栈架构写一个简单编译器很方便 缺点:...

GDB简单教程

上班摸鱼

翻译自https://www.geeksforgeeks.org/gdb-command-in-linux-with-examples/ 示例程序 #include <iostream> #include <stdlib.h> #include <string.h> using namespace std; int findSquare(in...

Numpy小抄

这几天在赶工大作业,用到一些Numpy操作。年纪大了记性不好,总是查了忘忘了查,气死我了——打个小抄吧 基本操作 矩阵乘法:np.matmul(A, B) OR np.dot(A, B) OR A@B 其中matmul和dot在二维矩阵相乘情况下是一样的,高维矩阵相乘会不一样(暂时用不上就没研究) @是matmul的简便写法,在A和B都是np矩阵的情况...

PDFMiner使用

大作业选了“PDF解析和数据提取”的题目,搜了一圈发现PDFMiner比较靠谱。 安装 第一步当然是安装,pip失败了,总是提示read timeout类似的问题。于是直接去官网下载了包,解压后cmd安装(cd到setup.py的文件夹): setup.py install (顺便提一句,后来队友用pip安装成功了,说是要用梯子。) 使用 由于ddl快到了,准备先在博客上扒现成...

Data Visualization

数据科学基础课笔记(七)

看到一堆数字,或许很难发现其中的规律。但如果制作成图表,就能直观地发现其中的规律。 散点图 (Scatter Plot) 将很多小朋友的身高体重数据在图上戳点点,就可以得到散点图 散点图一般可以用来做一些相关性的分析,比如从上图可以看出小朋友的身高体重是正相关的。 线形图 (Line Graph) 从图中能直观地看到比特币的价格随时间的变化: 图表 (Chart) ...

Data Preprocessing

数据科学基础课笔记(六)

之前介绍过特征的预处理方法(比如$L_p$ nomalization和Z-score),这次介绍对raw data的预处理方法。 数据平滑 中值滤波 (Median Filter) 用一个滑动窗口滑动向量/矩阵(或者说tensor),对窗口内的数计算中位数。 为了让新的tensor尺寸和原来的一样,可以用padding的方法增加边缘。 均值滤波 (Mean Filter) 均...

学校ssh服务器使用

向Project低头

大作业队友传来坏消息,周五要交的report周一实验还没跑完,而她的小本本已经为此死机两回了,吓得我赶紧求实验室学长开了个服务器账号。 拿到账号,配环境是最麻烦的事情,在这篇记录一下整个过程。 服务器登录 命令行方式 >> ssh -p [port] account@ip 之后会要求输入密码,然后显示连接成功。登录的那一瞬间连命...