Knowledge
2020-08-26 10:27:40 0 举报
AI智能生成
知识
作者其他创作
大纲/内容
linux
概念
文件系统
硬链接/软链接
硬链接: 直接链接到inode上
(故删除原文件并不会导致链接失效)
(故删除原文件并不会导致链接失效)
软链接: 用目录作链接
(故原文件不在对应目录下则链接失效)
(故原文件不在对应目录下则链接失效)
inode(索引节点):
Linux 文件系统通过把 inode 节点和文件名进行连.
需要读取该文件时,文件系统在当前目录表中查找该文件名对应的项,由此得到该文件相对应的 inode 节点号.
通过该 inode 节点的磁盘地址表把分散存放的文件物理块连接成文件的逻辑结构。
Linux 文件系统通过把 inode 节点和文件名进行连.
需要读取该文件时,文件系统在当前目录表中查找该文件名对应的项,由此得到该文件相对应的 inode 节点号.
通过该 inode 节点的磁盘地址表把分散存放的文件物理块连接成文件的逻辑结构。
安全 nginx_waf防止SQL注入:
应用程序存在安全隐患. 用户可以提交一段数据库查询代码.
根据程序返回的结果, 获得某些他想得知的数据.
CC攻击: 多个不同用户不停访问
DDOS攻击(分布式拒绝服务攻击):
多个计算机联合, 通过大量合法的请求占用大量网络资源
多个计算机联合, 通过大量合法的请求占用大量网络资源
应用程序存在安全隐患. 用户可以提交一段数据库查询代码.
根据程序返回的结果, 获得某些他想得知的数据.
shell
常用命令
文件管理
文件处理
cp
mv
rm
查找
find:
find pathname -options [-print -exec -ok ...]
find pathname -options [-print -exec -ok ...]
locate:
类似find, 通过内建文档数据库快速查找
updatedb用以更新
类似find, 通过内建文档数据库快速查找
updatedb用以更新
which:
查看可执行文件的位置(搜PATH)
查看可执行文件的位置(搜PATH)
whereis:
whereis 查看文件的位置
whereis 查看文件的位置
文件内容查看
head
tail:
用于显示指定文件末尾内容.
不指定文件时, 作为输入信息进行处理.
常用查看日志文件.
用于显示指定文件末尾内容.
不指定文件时, 作为输入信息进行处理.
常用查看日志文件.
more
less
grep:
grep [option] pattern file|dir
grep [option] pattern file|dir
wc
sed: 文件编辑命令
ln: 建立链接
ln -sv source.log link.log
ln -sv source.log link.log
chmod:
文件类型/文件所有者/用户组/其他
_/rwx/rwx/rwx
文件类型/文件所有者/用户组/其他
_/rwx/rwx/rwx
chown:
chown <所有者>:<用户组> <文件名>
chown <所有者>:<用户组> <文件名>
磁盘命令
cd
df: 磁盘使用情况
du: 查看文件和目录的使用空间
ls
mkdir: 创建文件夹
-p创建整个路径
rmdir: 删除文件夹
-p创建整个路径
rmdir: 删除文件夹
pwd: 当前工作路径
读取用户输入: read <变量名>
用户/用户组管理
添加组: groupadd <组名>
添加用户: useradd -g <组名> <用户名>
删除用户: userdel -r <用户名>
网络命令
ifconfig: 查看网络接口(-a表示所有)
使用 up 和 down 命令启动或停止某个接口: ifconfig eth0 up 和 ifconfig eth0 down
使用 up 和 down 命令启动或停止某个接口: ifconfig eth0 up 和 ifconfig eth0 down
netstat: 显示网络状态
netstat [-acCeFghilMnNoprstuvVwx][-A<网络类型>][--ip]
netstat [-acCeFghilMnNoprstuvVwx][-A<网络类型>][--ip]
ping: 检测主机
telnet: 远端登录
telnet 192.168.0.5
telnet 192.168.0.5
系统管理命令
date: 时间
free: 内存使用情况
kill: 发送指定的信号到相应进程.
不指定型号将发送SIGTERM(15)终止指定进程.
不指定型号将发送SIGTERM(15)终止指定进程.
ps: 进程状态
pstree: 进程树
top: 系统状态
包括进程 ID、内存占用率、CPU 占用率等
包括进程 ID、内存占用率、CPU 占用率等
定时执行
crontab
压缩/解压缩, 打包/解包
压缩/解压
bzip2:
创建 *.bz2 压缩文件:bzip2 test.txt 。
解压 *.bz2 文件:bzip2 -d test.txt.bz2 。
创建 *.bz2 压缩文件:bzip2 test.txt 。
解压 *.bz2 文件:bzip2 -d test.txt.bz2 。
gzip:
创建一个 *.gz 的压缩文件:gzip test.txt
解压 *.gz 文件:gzip -d test.txt.gz
显示压缩的比率:gzip -l *.gz
创建一个 *.gz 的压缩文件:gzip test.txt
解压 *.gz 文件:gzip -d test.txt.gz
显示压缩的比率:gzip -l *.gz
uzip
打包解包
tar
程序/编程
ulimit -a: 数据段大小之类的
参数/变量
$0: 脚本本身文件名称
$1~$n: 各参数值
$*: 所有参数列表("1 2 3")
$@: 所有参数列表("1" "2" "3")
$#: 参数个数
$$: 脚本运行时的PID
$! : Shell最后运行的后台Process的PID
$?: 脚本退出码
$1~$n: 各参数值
$*: 所有参数列表("1 2 3")
$@: 所有参数列表("1" "2" "3")
$#: 参数个数
$$: 脚本运行时的PID
$! : Shell最后运行的后台Process的PID
$?: 脚本退出码
取消变量: unset <参数名>
列表/数组
调用seq: $(seq 1 30)
直接空格隔开: A B C
用括号: a=(Shirley 2 Hank)
遍历时可用${a[*]};
访问特定索引可用: ${a[1]}
对特定索引赋值: a[1]=loves
获取长度: ${#variable[*]}
遍历时可用${a[*]};
访问特定索引可用: ${a[1]}
对特定索引赋值: a[1]=loves
获取长度: ${#variable[*]}
${}操作
数字运算:
- $[16 + 4]
- expr 16 + 4
语句
比较运算符:
- ==
- -gt
- -lt
if语句:
if [ $x -gt $y ] then
命令
else
if [ 条件 ] then
命令
else
命令
fi
fi
if [ $x -gt $y ] then
命令
else
if [ 条件 ] then
命令
else
命令
fi
fi
循环
for循环:
for 变量 in 循环列表
do
命令
done
for 变量 in 循环列表
do
命令
done
也可以这样:
for((i=1;i<51;i++))
for((i=1;i<51;i++))
while循环:
while [ 条件 ]
do
命令
done
while [ 条件 ]
do
命令
done
函数
gcc
-E: 只预处理(宏, 头文件等)
-c: 直接生成.o文件
系统调用
进程
fork()
Shared Memory(POSIX)
int shm_open(const char *name, int oflag, mode_t mode)
// open a shared memory
// open a shared memory
int ftruncate(int fd, off_t length)
// Configure the size
// Configure the size
void *mmap(void *addr, size_t length, int prot, int flags,
int fd, off_t offset)
// mmap. Here we set flags as MAP_SHARED
int fd, off_t offset)
// mmap. Here we set flags as MAP_SHARED
int shm_unlink(const char *name)
// unlink and remove
// unlink and remove
管道
Anonymous Pipe
int pipe(int pipefd[2])
// pipefd[0] is the read end
// pipefd[1] is the write end
// This pipe is anonymous,
// using fork() to share fds
// pipefd[0] is the read end
// pipefd[1] is the write end
// This pipe is anonymous,
// using fork() to share fds
Named Pipe
int mkfifo(const char *pathname, mode_t mode)
// Named pipe
// Named pipe
int mkfifoat(int dirfd, const char *pathname, mode_t mode)
//
//
int mkfifo(const char *pathname, mode_t mode)
// Named pipe
// Named pipe
内存管理
brk()
// 在malloc()时要用到
// grow and shrink memory area
// 在malloc()时要用到
// grow and shrink memory area
进程调度
CFS
通过虚拟运行时间vruntime(与基于优先级的衰减因子有关)
调度程序选择具有最小vruntime值的任务运行
这里用红黑树维护任务
通过虚拟运行时间vruntime(与基于优先级的衰减因子有关)
调度程序选择具有最小vruntime值的任务运行
这里用红黑树维护任务
友好值(nice value), -20~+19
目标延迟(target latency), 即每个可运行任务应当运行一次的时间间隔
并行编程
OpenMP
基本操作
并行块
#pragma omp parallel
// 并行执行后续程序
// By default, there is a barrier at the end.
// 并行执行后续程序
// By default, there is a barrier at the end.
Clauses
#pragma omp parallel num_threads(N)
// N个线程并行执行后续程序
// N个线程并行执行后续程序
#pragma omp parallel shared(A,B,C) private(id)
// specify the shared and private variables
// specify the shared and private variables
同步
#pragma omp barrier
// Wait for all threads reaching here
// Wait for all threads reaching here
#pragma omp critical
// The following codes can be accessed by only ont thread at one time
// The following codes can be accessed by only ont thread at one time
#pragma omp atomic
// Like critical,
// but for simple scenarios(like increments),
// it will use special hardware constructs if available
// Like critical,
// but for simple scenarios(like increments),
// it will use special hardware constructs if available
for循环并行
#pragma omp for
Clauses
#pramga omp for reduction(op:list)
// The elements in list will be identity of op
// Elements are copied as local variable
// and finally be reducted
// The elements in list will be identity of op
// Elements are copied as local variable
// and finally be reducted
#pramga omp for nowait
// Generally the threads in for parallel
// won't exit until all threads are done.
// If waiting is unnecessary, use nowait.
// Generally the threads in for parallel
// won't exit until all threads are done.
// If waiting is unnecessary, use nowait.
work sharing
master结构
#pragma omp master
// Only the master will execute codes in this structure.
// Only the master will execute codes in this structure.
single结构
#pragma omp single
// Only 1 thread (the first one gets here)
// will do the codes
// Only 1 thread (the first one gets here)
// will do the codes
Clauses
#pragma omp single nowait
section结构
#pragma omp sections
{
#pragma omp section
do_x();
#pragma omp section
do_y();
}
{
#pragma omp section
do_x();
#pragma omp section
do_y();
}
锁
omp_lock_t
omp_lock_t
omp_init_lock()
omp_set_lock()
omp_unset_lock()
omp_destroy_lock()
omp_test_lock()
Runtime Library
threads numbers
omp_set_num_threads()
omp_get_num_threads()
// You won't get the threads number
// unless you've entered the parallel region
// You won't get the threads number
// unless you've entered the parallel region
omp_get_thread_num()
omp_get_max_threads()
omp_in_parallel()
// To check if running in parallel region
// To check if running in parallel region
dynamic mode:
Threads given may differ
Threads given may differ
omp_set_dynamic(int _Dynamic_threads)
omp_get_dynamic()
omp_num_procs()
// Get how many processors available
// Get how many processors available
Environment Variables
OMP_NUM_THREADS
By default, how many threads should I use
By default, how many threads should I use
OMP_STACKSIZE
Tell the system the stacksize needed
Tell the system the stacksize needed
OMP_WAIT_POLICY
ACTIVE | PASSIVE
ACTIVE | PASSIVE
- ACTIVE: actively spin till available(cost almost nothing)
- PASSIVE: put it sleep(cost a lot)
OMP_PROC_BIND
TRUE | FALSE
Threads once binded to a processor, leave there
TRUE | FALSE
Threads once binded to a processor, leave there
Data Environment
pivate
// This clause won't initialize the variable
// This clause won't initialize the variable
firstprivate
// Will be initialized as the global value
// Will be initialized as the global value
lastprivate
// The value will be copied to the global variable
// The value will be copied to the global variable
shared
Tasks
#pragma omp task
// Create a task to execute following codes
// Create a task to execute following codes
#pragma omp taskwait
Memory Model
Week Consistency
S>>W, S>>R, R>>S, W>>S, S>>S
S>>W, S>>R, R>>S, W>>S, S>>S
#pragma omp flush(list)
// Rs and Ws overlaping after the flush
// don't executed until after the flush.
// Rs and Ws overlaping after the flush
// don't executed until after the flush.
implicit flushes
- entry/exit of parallel region
- implicit/explicit barrier
- entry/exit of critical section
- a lock is set/unset
#pragma omp atomic [read|write|update|capture]
Thread Private
#pragma omp threadprivate(xxx)
// Each thread will have their
// own(identified by thread ID) xxx copy.
// And it's global, which means it is
// alivethrough all parallel blocks
// Each thread will have their
// own(identified by thread ID) xxx copy.
// And it's global, which means it is
// alivethrough all parallel blocks
copyin(xxx)
// copy in the main thread's xxx
// copy in the main thread's xxx
书
Using OpenMP
Patterns For Parallel Programming
by Tim Mattson
by Tim Mattson
Concurrency in Programming Languages
(About the histroy)
(About the histroy)
The Art of Concurrency
pthread(POSIX标准)
pthread_create()
pthread_exit()
// 可以给出返回值
// 可以给出返回值
pthread_join()
pthread_kill()
结构体为: pthread_t
pthread_cancel()
pthread_testcancel()
pthread_testcancel()
模式(Patterns)
SIMD(Single Instruction Multiple Data)
for parallel
Divide and Conquer Pattern:
Split problem, and solve the subproblem.
Recursively do above.
Split problem, and solve the subproblem.
Recursively do above.
编程语言
Python
re
re.match(pattern, string, flags=0)
# 尝试从字符串的起始位置匹配
# 尝试从字符串的起始位置匹配
.group(num)
.groups()
.span(num) # 返回索引
.groups()
.span(num) # 返回索引
re.search(pattern, string, flags=0)
# 返回第一个成功的匹配。
# 返回第一个成功的匹配。
re.sub(pattern, repl, string, count=0, flags=0)
# 替换
# 替换
re.findall(string[, pos[, endpos]])
# 返回所有匹配子串列表
# 返回所有匹配子串列表
re.finditer(pattern, string, flags=0)
# 类似findall, 但返回迭代器
# 类似findall, 但返回迭代器
re.split(pattern, string[, maxsplit=0, flags=0])
按照能够匹配的子串将字符串分割后返回列表
按照能够匹配的子串将字符串分割后返回列表
Consistency
(about R(read), W(write), S(sync)
(about R(read), W(write), S(sync)
Sequential Consistency
Program Order = Code Order = Commit Order
Program Order = Code Order = Commit Order
Relaxed Consistency
Algorithm
关联性
Apriori系
FP Tree
FP Tree算法原理总结
从零实现机器学习算法(十四)FP-growth
近邻算法
KNN
CNN
强化学习
Markov 决策过程
Q-Learning
SARSA
一致性哈希(Consistent Hashing)
K-V Store
Data Structures
Log-Structured Merge Tree (LSM-tree)
Advantages:
high write efficiency
low costs as a tiered storage
high write efficiency
low costs as a tiered storage
Disadvantages:
slow compactions(much I/O)
slow compactions(much I/O)
background compaction operations(a.k.a merge)
Paper
fast20: FPGA-Accelerated Compactions
for LSM-based Key-Value Store
for LSM-based Key-Value Store
数据中心
Fat Tree
All Reduce
Parameter Server
有一个服务器来弄
有一个服务器来弄
Collective AllReduce
Halving-Doubling
ring
double binary tree
Hierachical Aggregation
由于数据中心的特点, 一般两层
Math
概率论与数理统计
概率论
常见分布
离散
二项分布
Poisson分布
均匀分布
连续
正态分布
指数分布
卡方分布
t分布
数字特征
均值
方差
协方差/协方差矩阵
相关系数
平均绝对差 E|X-EX|
矩母函数: g(t)=E exp{tX}
特征函数: Φ(t)=E exp{itX}
两个变量分布相同⇔特征函数相同
两个变量分布相同⇔特征函数相同
极限理论
大数定律
Markov不等式
Chebyshev不等式
中心极限定理
中心极限定理推广(研究生课程)
(不需要i.i.d. 而是Linderberg条件)
(不需要i.i.d. 而是Linderberg条件)
数理统计
基础
样本的两重性
统计量
样本均值
样本方差
样本矩
样本原点矩
样本中心矩
样本中位数
样本极值
经验分布函数(不停抽样, 近似出分布)
正态总体
四个推论
三大分布
χ²分布
t分布
F分布
参数估计
点估计
矩估计
极大似然估计
区间估计
单正态总体
二正态总体
假设检验
参数检验
显著性水平
拒绝域
功效函数:
β(θ)=P(H0被拒绝|θ)
β(θ)=P(H0被拒绝|θ)
检验方法:
和区间估计类似, 也需要找到对应无参数分布(见区间估计模块)
和区间估计类似, 也需要找到对应无参数分布(见区间估计模块)
拟合优度检验:
检验分布
检验分布
卡方拟合优度检验(Karl Pearson提出)
离散情形拟合优度检验
含有未知参数(假设有r个):
通常用极大似然估计未知参数,
此时卡方分布自由度为(k-1-r)
通常用极大似然估计未知参数,
此时卡方分布自由度为(k-1-r)
p-value: 对应卡方分布上的P(t>统计量T)
应用
独立性检验问题
H0: 属性A与属性B独立
齐一性检验:
检验一个属性A各个水平对应的另一个属性B的分布完全相同
检验一个属性A各个水平对应的另一个属性B的分布完全相同
数理逻辑
命题演算 L
语法
对公式运算
¬¬x≠x
对公式运算
¬¬x≠x
L1,L2,L3和MP——P19
L1: P→(q→p)——肯定后件律
L2: (p→(q→r))→((p→q)→(p→r))——蕴含词分配律
L3: (¬p→¬q)→(q→p)——换位律
P21
1). 同一律: ⊢p→p
2). 否定前件律: ⊢¬q→(q→p)
3). 演绎定理,
4).三段论(HS)——P23
4).三段论(HS)——P23
5). 否定肯定律(P24): ⊢(¬p→p)→p
1.2.4. 反证,归谬,双否
6). 反证律: <Γ∪{¬p}⊢q, Γ∪{¬p}⊢¬q> ⇒ Γ⊢p
7). 归谬律: <Γ∪{p}⊢q, Γ∪{p}⊢¬q> ⇒ Γ⊢¬p
8). 双否律: ⊢¬¬p→p
9). 第二双否律⊢p→¬¬p
9). 第二双否律⊢p→¬¬p
语义
对0,1运算
¬¬x=x
对0,1运算
¬¬x=x
赋值: 具有保运算性(¬,→)的映射v: L(X)→Z₂
真值指派: v₀: X→Z₂
各种律——P41
语义演绎定理——P42
等值公式,对偶律,推广的De.Morgan律——1.5.1(P46)
(主)析取范式与(主)合取范式——1.5.2(P50)
谓词演算 K
语法
公式集——P64
闭式, 自由——P65
公理——P67
(K1) p→(q→p)
(K2) (p→(q→r))→((p→q)→(p→r))
(K3) (¬p→¬q)→(q→p)
(K4) ∀xp(x)→p(t), 其中项t对p(x)中的x是自由的
(K5) ∀x(p→q)→(p→∀xq), 其中x不在p中自由出现
证明——P67
MP
Gen
一些定理或永真式
∃1规则——P69
演绎定理——P70
反证律, 归谬律——P71
∃2规则——P71
等价判定(P72): Γ⊢p↔q ⇔ Γ⊢p→q且Γ⊢q→p
子公式的等价可替换性——P74
对偶律——P75
前束范式
只涉及Q,→,¬(P77-78)
1. 若y不在p(x)中出现, 则 ⊢Qxp(x) ↔ Qyp(y)
2.
若x不在p中自由出现, 则 ⊢(p→Qxq) ↔ Qx(p→q)
若x不在q中自由出现, 则 ⊢(Qxp→q) ↔ Q*x(p→q)
3. ⊢¬Qxp ↔ Q*x¬p
涉及合取析取(P78-80)
⊢(∀xp∧∀xq) ↔ ∀x(p∧q)
⊢(∃xp∨∃xq) ↔ ∃x(p∨q)
若x不在p中自由出现, 则
⊢(p∨Qxq) ↔ Qx(p∨q)
⊢(p∧Qxq) ↔ Qx(p∧q)
语义
一阶结构(解释域) M=(D,F,P)
项解释——P83
个体变元指派
变元变通——解释含量词公式
公式的赋值函数——P85
闭式的语义特征
- 若对项t中任一变元x都有φ(x)=ψ(x), 则φ(t)=ψ(t)
- 若对公式p中任一自由出现变元x都有φ(x)=ψ(x), 则|p|(φ)=|p|(ψ)
任一闭式在给定M中恒真/恒假必居其一
全称闭式——P90
|p|=1⇔|∀xp|=1⇔|p'|=1
|p|=0 ⇒ |∀xp|=0
|p|=0 ⇒ |p'|=0
|p|=0 ⇒ |p'|=0
语义推论与有效式——P92
M可满足的
存在I(p)=t
M有效的
∅⊧p时, p叫做K的有效式
模型: Γ的每个公式都在M恒真:
r∈Γ ⇒ |r|_M=1
r∈Γ ⇒ |r|_M=1
语义推论/语义后承: Γ⊧p
逻辑有效的: 对一切M, ⊧p
UG有效性: Γ⊧p ⇔ Γ⊧∀xp
K的可靠性和完全性
形式算数与递归函数
等词公理(P105)
(E1) t≈t
(E2) t_k≈u → (f(t1, ..., t_k, ..., t_n)≈f(t1, ..., u, ..., t_n))
(E3) t_k≈u → (R(t1, ..., t_k, ..., t_n) → R(t1, ..., u, ..., t_n))
若M是E的模型, 则等词≈必解释为M上的等价关系(P107)
- E ⊢ t≈t
- E ⊢ t≈u → u≈t
- E ⊢ t≈u → (u≈v → t≈v)
等项替换(P108)
(E2推广) E ⊢ u≈v → t(u)≈t(v)
(E3推广) E ⊢ t≈u → (p(t) → p(u))
(t和u的变元不在替换出受约束)
(t和u的变元不在替换出受约束)
正规模型: 等词解释为相等
正规模型存在性:
设任意E'⊆K+(Y)有K+模型, 则E'有正规K+模型
(证明: 构造这个模型的对应商集模型)
设任意E'⊆K+(Y)有K+模型, 则E'有正规K+模型
(证明: 构造这个模型的对应商集模型)
非正规模型存在性:
设E*⊆K+(Y)是E的任何相容扩张, E⊆E*且E*相容, 则E*有非正规K+模型
设E*⊆K+(Y)是E的任何相容扩张, E⊆E*且E*相容, 则E*有非正规K+模型
符号
set
∩
∪
⊆
∈
∅
⁰ ¹ ² ³ ⁴ ⁵ ⁶ ⁷ ⁸ ⁹
₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉
ᵢ ⱼ ₖ ₗ ₘ ₙ
logic
→
⇒
⇔
↔
∧
∨
¬
⊧
⊢
∀
∃
≠
数理方程
建立方程的问题
物理定律
物体内温度升高所需热量与物体内源产生热量之和
牛顿第二定律(F=ma)
傅里叶热传导定律
热流密度q: 指单位时间沿某个方向流过单位横截面的热量
q与温度下降率(梯度)成正比, 即q=k∇u
热流密度q: 指单位时间沿某个方向流过单位横截面的热量
q与温度下降率(梯度)成正比, 即q=k∇u
牛顿热交换定律(边界条件)
物体流向外部的热流密度q与物体和介质在表面处的温度差成正比
即q=h(u-θ), 其中h为热交换系数, u, θ分别表示物体和介质的表面处温度
物体流向外部的热流密度q与物体和介质在表面处的温度差成正比
即q=h(u-θ), 其中h为热交换系数, u, θ分别表示物体和介质的表面处温度
扩散定律:
粒子流密度(定义类似热流密度), q=-k∇u
粒子流密度(定义类似热流密度), q=-k∇u
Gauss定律
通过任意闭合曲面的电通量等于这个闭曲面所包围的自由电荷的电量/ε0
通过任意闭合曲面的电通量等于这个闭曲面所包围的自由电荷的电量/ε0
胡克定律
f=-kx
应力=杨氏模量*相对伸长, 即 F / S=-E*(Δl / l)
(应力: 单位截面面积上的受力, 即F/S)
f=-kx
应力=杨氏模量*相对伸长, 即 F / S=-E*(Δl / l)
(应力: 单位截面面积上的受力, 即F/S)
初始条件个数=t的导数的阶数
边界条件
第一类: u在边界上=φ
- 固定端
第二类: 偏导在边界上=φ
- 绝热
- 自由端
第三类: αu+β偏导=φ
- 热交换
泛定方程
分类
椭圆(与t无关, 称稳定方程)
Δu=0 (调和方程, Laplace方程)(齐次)
Δu=f (Poisson方程)(非齐次)
Lu=0
Lu=f
抛物(发展方程)
u_{t}=Δu (齐次)
u_{t}=Δu+f (非齐次)
u_{t}=Lu+f (齐次)
u_{t}=Lu (非齐次)
双曲(发展方程)
u_{tt}=Δu (齐次)
u_{tt}=Δu+f (非齐次)
u_{tt}=Lu (齐次)
u_{tt}=Lu+f (非齐次)
齐次泛定方程
有界区域
分离变量法
普通方程(Sturm-Liouville方程)
贝塞尔方程(柱坐标系)
勒让德方程(球坐标系)
非齐次泛定方程
有界区域
边界条件齐次
固有函数展开法后再分离变量法
叠加原理
特殊函数法
边界条件非齐次
把边界条件转化为齐次
- v(t,x)=A(t)x+B(t)
- v(t,x)=A(t)x^2+B(t)
泊松方程第一边值问题
基本解法
不考虑边界条件齐次性
√有关于趋于无穷的条件
变量取值范围为全无穷
傅里叶变换(291-296)
变量取值范围为半无穷
第一类边界条件(延拓为奇函数)
傅里叶正弦变换
第二类边界条件(延拓为偶函数)
傅里叶余弦变换(P296例3)
第三类边界条件(超出本书学习范围)
×无关于无穷点的条件
Laplace变换
- 要求有变换变量<通常是t>对应各低阶导数在0+的条件
- 无穷处一般应有界(问题的物理意义)
- 半无界(因此通常对t)
叠加原理和齐次化原理
无界区域
一维无界
行波法(达朗贝尔公式)
一维半无界
尝试延拓
第一类边界条件奇延拓
第二类边界条件偶延拓
第一类边界条件奇延拓
第二类边界条件偶延拓
u_{t}=Lu+f
u(0, M)=φ(M)
u(0, M)=φ(M)
基本解法
u_{tt}=Lu+f(t,M)
u(0, M)=φ(M), u_{t}(0,M)=ψ(M)
u(0, M)=φ(M), u_{t}(0,M)=ψ(M)
基本解法
分类
一维无界区域弦振动
行波法(达朗贝尔公式)
一维半无界区域
行波法作奇偶延拓
非齐次发展方程
齐次化原理
方程非齐次的方程
齐次化原理
常数变易法(先不看齐次项, 然后常数变易)
若非齐次项是关于x的函数而与t无关, 考虑特殊解法
边界条件非齐次的方程
先齐次化边界条件
- 第一类用: v(t,x)=A(t)x+B(t)
- 第二类用: v(t,x)=A(t)x^2+B(t)
齐次有界区域方程
分离变量法
齐次有界区域方程——极坐标下Δu=0的周期性问题
套用公式
运筹学基础
规划问题
线性规划
凸组合理论
线性规划可行域必为凸集
基可行解对应于可行域的顶点
目标函数在可行域(有界情况下)的顶点上达到最优
单纯形法
表格描述
- 计算检验数, 判断是否继续(求max时, 均≤0则不能再大; 求min反之)
- 若能继续, 最小检验数对应变量换入, b/系数取最小(保证矩阵变换后b≥0)
矩阵描述
对偶理论
对偶单纯形法
- 保证检验数≤/≥0, 检查b, 若未达均非负, 则继续计算
- 若能继续, 取负得最多的换出, 取检验数/系数负得最多的换入
原问题
max z
n个变量
≥0
≤0
无约束
m个约束
≤
≥
=
max z
n个变量
≥0
≤0
无约束
m个约束
≤
≥
=
对偶问题
min ω
n个约束
≥
≤
=
m个变量
≥0
≤0
无约束
min ω
n个约束
≥
≤
=
m个变量
≥0
≤0
无约束
记忆方法:
正常情况max问题: 变量≥0, 约束≤;
而min问题: 约束≥, 变量≥0;
异常情况对应排除法推出.
而=和无约束的对应关系始终成立
正常情况max问题: 变量≥0, 约束≤;
而min问题: 约束≥, 变量≥0;
异常情况对应排除法推出.
而=和无约束的对应关系始终成立
性质(P68 3..4.2)
对称性: 对偶问题的对偶是原问题
弱对偶性: 若X, Y分别是原, 对偶问题可行解, 则CX≤Yb
换句话说, max问题的最优解小于等于min问题的最优解
换句话说, max问题的最优解小于等于min问题的最优解
无界性: max问题为无界解, 则min问题无可行解
最优解条件: X, Y分别是min, max问题的可行解, 当CX=Yb时, X和Y分别是最优解
对偶定理: 若max问题有最优解, 则min问题有相同最优解
互补松弛性: 若X, Y为min, max问题可行解. 则YX_S=0和Y_SX=0 当且仅当 X, Y为最优解
检验数和基解的对应: 原问题单纯形表的检验数行对应对偶问题的一个基解
灵敏度分析(本质还是单纯形法)
运输问题
确定初始基可行解
西北角法: 每次取西北角的
最小元素法: 每次取最小运价的确定
伏格尔法: 作行列差额(最小两运价之差), 每次取差额最大的
(每次取差额最大是为了充分考虑次小运费)
(每次取差额最大是为了充分考虑次小运费)
最优解的判别
(本质是要算出检验数)
(本质是要算出检验数)
闭回路法: 对所有空格, 找闭回路, 对空格+1运量, 计算运费增量, 则为检验数
位势法: 计算行列位势(可以设u0=0). 只要记住 c_{ij}-u_i-v_j 为 x_{ij} 的检验数.
这里用基变量检验数为0来求所有u, v
这里用基变量检验数为0来求所有u, v
调整方法
闭回路调整法: 取最适检验数作换入变量, 作闭回路确定换出变量
退化:
- 有非基变量为0——无穷多解
- 确定初始基可行解时, 正好行列余量相等, 则其行列应添一0
- 调整过程, 同时让两个运量变0, 应保留一0
线性目标规划
置偏差变量于式末: ...+(d-)-(d+) = b
- 要求恰好达目标值, min z = f((d+)-(d-))
- 不超过目标值: min z = f(d+)
- 超过目标值: min z = f(d-)
解法: 主要为图解法或单纯形表法
整数线性规划
普通整数线性规划
分支定界法:
- 先求最优(无视整数条件), 对解中非整数分支(如x1=3.5, 则分x1≤3和x1≥4)
- 维护一个 可行下界(整数解) 和 可能上界(不一定整数)
割平面法:
- 用单纯形表算非整数最优解
- 列关系式, 分离整数/非整数部分, 从而多得一条件.
(如x1-x3=3/4-(3/4 * x3 + 1/4 * x4), 则右边≤0(左边为整数), 于是多一个条件(多一割线)) - 继续改进单纯形表(可能需要用对偶单纯形表)
0-1型整数线性规划
隐枚举法(可以先找一个解, 便于后面列表排除)
指派问题
理论基础
- 指派矩阵行列同减最小元素, 最优解不变
- 指派系数矩阵中独立0元素个数最多等于能覆盖所有0元素的最少直线数
解法
第一步: 先后每行, 每列减去该行, 该列最小元素
第二步:
- 轮流对只有一个0元素的行列上, 对应0元素加圈, 其他划去记作Φ
- 从剩0元素最少的行列开始(按选择性多礼让选择性少的原则), 加圈和划零
第三步: 作最少的直线覆盖所有0元素
(这里其实相当于找交错轨)
- 对没有圈的行打√
- 对已打√行中含Φ的列打√
- 对已打√列中含圈行打√
- 重复2, 3
- 对无√的行画横线, 有√的列画纵线
(这里其实相当于找交错轨)
第三步: 作最少的直线覆盖所有0元素
(这里其实相当于找交错轨)
- 对没有圈的行打√
- 对已打√行中含Φ的列打√
- 对已打√列中含圈行打√
- 重复2, 3
- 对无√的行画横线, 有√的列画纵线
(这里其实相当于找交错轨)
第四步: 处理最小元素(√行减, √列加). 重复执行前面步骤.
排队论
数学模型:
Kendall记号: X/Y/Z
(后扩充为X/Y/Z/A/B/C
本书只讨论X/Y/Z/∞/∞/FCFS)
Kendall记号: X/Y/Z
(后扩充为X/Y/Z/A/B/C
本书只讨论X/Y/Z/∞/∞/FCFS)
X: 相继顾客到达间隔时间的分布
Y: 服务时间的分布
Z: 服务台的个数
A: 系统容量限制N
B: 顾客源数目m
C: 服务规则(FCFS/LCFS等)
B: 顾客源数目m
C: 服务规则(FCFS/LCFS等)
各种分布
M: 负指数分布
D: 确定型
E_k: k阶爱尔朗分布(erlang)
GI: 一般相互独立的时间间隔分布
G: 一般服务时间的分布
基本概念符号
排队系统概念
- 队长: 系统中顾客数. 期望为L_s
- 排队长: 系统中排队等待的顾客数. 期望为L_q
- 逗留时间: 一个顾客在系统中停留时间. 期望为W_s
- 等待时间: 一个顾客在系统中排队等待的时间. 期望为W_q
- 忙期: 服务机构连续繁忙时间长度(关系到服务员工作强度)
- 损失率, 服务强度等
- 系统的状态: 系统中顾客数(期望为L_s)
系统中有n个顾客就称系统状态为n - t时刻状态为n概率为P_n(t)
一些平均值概念
平均间隔时间=总间隔时间/到达次数=总时间/到达次数
平均到达率=到达人数/总时间
平均服务时间=总服务时间/总人数
平均服务率=总人数/总服务时间
常用分布
泊松流
符号
N(t): 时间区间[0, t)内到达顾客数(t>0)
P_n(t1, t2)表示在[t1, t2)内有(n≥0)个顾客到达)
P_n(t1, t2)=P{ N(t2) - N(t1)=n }
P_n(t1, t2)=P{ N(t2) - N(t1)=n }
形成泊松流的条件
无后效性: 不重叠时间区间顾客到达独立.
充分小Δt内, [t, t+Δt)有1个顾客到达概率与Δt成正比
即P_1(t, t+Δt)=λΔt + o(Δt).
λ表示概率强度(单位时间内有一个顾客到达的概率
即P_1(t, t+Δt)=λΔt + o(Δt).
λ表示概率强度(单位时间内有一个顾客到达的概率
充分小Δt内, [t, t+Δt)有≥2个顾客到达概率极小, 可忽略
泊松流概率公式
数学期望: E[N(t)] = λt
方差: Var[N(t)] = λt
方差: Var[N(t)] = λt
负指数分布
负指数分布概率密度函数
负指数分布函数
负指数分布数字特征
其他性质
Markov性
相继到达的时间间隔是独立相同的负指数分布(参数为λ)与
输入过程为泊松流(参数为λ)是等价的.
所以在Kendall记号中都用M表示
输入过程为泊松流(参数为λ)是等价的.
所以在Kendall记号中都用M表示
服务时间v的分布有时也服从负指数分布,
则μ表示单位时间能被服务完成的顾客数, 称为平均服务率.
而1/μ=E(v)表示一个顾客的平均服务时间.
则μ表示单位时间能被服务完成的顾客数, 称为平均服务率.
而1/μ=E(v)表示一个顾客的平均服务时间.
爱尔朗分布(Erlang):
参数为kμ的k个指数分布和
参数为kμ的k个指数分布和
Erlang分布的概率密度函数
Erlang分布的数字特征
Little公式
逗留时间(W_s)内有效到达的顾客数(λ_e*W_s)为队列长(L_s)?
存储论
基本概念
需求: 从存储中间断式或连续式地取出一定量
补充: 备货时间(或称提前时间)
费用:
- 存储费: 存储所需仓库, 货物损坏等费用
- 订货费=订购固定费用+单价*数量
- 生产费: 自行生产(而不是订购)的费用
- 缺货费: 存储供不应求引起损失
存储策略
- t0-循环策略: 每隔t0时间补充存储量Q
- (s,S)策略: 存储量 x≤s 时才补充. Q=S-x
- (t,s,S)混合策略: 经过t时间检查, 若x≤s才补充到S, 即Q=S-x
模型
不允许缺货, 备货时间很短
不允许缺货, 生产需一定时间
允许缺货, 备货时间很短
允许缺货, 生产需一定时间
价格有折扣的存储问题
订货方式
定点订货
定时订货
定量订货
定时订货
定量订货
计算机组成原理
CPU
技术指标
CPI
IC
主频
加速比(Amdahl定律)
部件加速比
可改进比例
周期
机器周期
时钟周期: 包含多个机器周期
指令周期: 包含多个时钟周期
流水线
相关
冲突
结构相关
数据相关
控制相关
技术指标
吞吐率
加速比
效率
数据通路
(2020-03-31
2020-04-03)
(2020-03-31
2020-04-03)
控制信号
(2020-03-31
2020-04-03)
(2020-03-31
2020-04-03)
相关
(2020-04-03
2020-04-07
2020-04-10)
(2020-04-03
2020-04-07
2020-04-10)
结构相关
例子
MEM和IF同时需要访问存储器
解决方案
Stall
哈佛结构
数据相关
分类
写后读(RAW)
写后写(WAW)
读后写(WAR)
解决方案
(2020-04-07)
(2020-04-07)
停顿(Stall)
硬件实现
流水线互锁(interlock)
流水线互锁(interlock)
编译器实现
转发(Forwarding)
(或称旁路(bypassing))
(或称旁路(bypassing))
控制相关
(2020-04-10)
(2020-04-10)
解决方案
分支延迟槽:
先做, 如果跳转了再flush
必要时可以提前BEQ来减少延迟开销
先做, 如果跳转了再flush
必要时可以提前BEQ来减少延迟开销
调度来源:
- 分支前指令填充: 分支指令前的指令
(选择不会有依赖关系错误的放到分支指令后做) - 分支目标指令填充
- 分支失败指令填充
编译器优化
分支预测技术
静态
动态
饱和计数器
多发技术
(2020-04-10)
(2020-04-10)
超标量技术
超长指令字
超流水线
SIMD技术
存储
主存
DRAM
电容保存信息, 要刷新(按行刷新)
集中刷新: 存在死区(不能读写, 在刷新)
分散刷新: 穿插在读写中(每次访问都要等一次之类刷新之类的)
异步刷新: 有选择地结合上述两种
访存周期: 100~200ns
技术指标
存储容量
存取时间: 命令发出到完成及数据放到总线上的时间
存储周期: 连续两次读写最少间隔时间
存储器带宽
构成
控制线
读写
片选
译码驱动
线选法:
通过译码器选通一行(相当于一个地址),
一行中的所有位一起输出
通过译码器选通一行(相当于一个地址),
一行中的所有位一起输出
重合法:
行列地址分别选中, 得到交叉块
行列地址分别选中, 得到交叉块
扩展
位扩展
字扩展
与CPU的连接
地址线连接: 低位连接, 高位用以扩展
数据线连接: 存储器扩展到和CPU的一样大来连接
命令控制线
提高速度的方法
双端口
高速主存(SDRAM, CDRAM)
并行访问存储器: 交叉访问
比如: 一个存储器具有独立的两组读写电路
比如: 一个存储器具有独立的两组读写电路
单体多字:
一次访问多个字(一个地址多个字, 缓存起来(局部性原理)
一次访问多个字(一个地址多个字, 缓存起来(局部性原理)
多体单字:
预取, 需要了再从Bus过来(流水)
预取, 需要了再从Bus过来(流水)
低位交叉编址: 易于利用局部性原理提高性能
高位交叉编址: 易于扩展
结构化的存储系统(加缓存)
可靠性
信息冗余
海明码
CRC(Cyclic Redundancy Check)
循环冗余校验
循环冗余校验
奇偶校验码
时间冗余
回滚
空间冗余
RAID
Cache
- 加速(局部性原理)
- 解决冲突
SRAM:
密度低, 性能高, 访存延迟小
密度低, 性能高, 访存延迟小
锁存器
全硬件实现, 用户透明
评价指标
命中率: 与容量和块长有关
容量越大, 命中率越高(有极限值)
块长变长, 命中率先增后减
(容量一定, 块数会减少)
一般每块4-8字.
(容量一定, 块数会减少)
一般每块4-8字.
访问效率: e=t_{访问cache总时间} / t_{总时间}
分类
单一/多级
统一/分离(指令和数据是否分开放)
地址映射
全相联映射:
地址分为块号+字号, 写Cache时同时写入
地址分为块号+字号, 写Cache时同时写入
优点: 冲突概率小
缺点: 需要相联存储器(代价高)
缺点: 需要相联存储器(代价高)
直接映射:
{Cache块号 i} = {主存块号 j} mod {Cache块数 m}
{Cache块号 i} = {主存块号 j} mod {Cache块数 m}
优点: 比较电路少
缺点: 冲突概率高
缺点: 冲突概率高
组相联映射:
分u组, 按直接映射确定组, 按全相联映射确定块号(共v块)
若v=1, 就是直接映射, u=1就是全相联映射
称为v路相联映射
分u组, 按直接映射确定组, 按全相联映射确定块号(共v块)
若v=1, 就是直接映射, u=1就是全相联映射
称为v路相联映射
替换策略
FIFO
随机法
最少使用(LFU): 每次访问计数器++, 替换时选计数器最小的块并清零
最近最少使用(LRU): 访问到置0, 其他没访问到的+1, 替换最大的块
读写策略
读
写
写不失效时
写直达法:
写入Cache和内存. 时间为写内存时间
写入Cache和内存. 时间为写内存时间
写回法:
写入Cache. 时间为访问Cache时间
但替换的时候需要写回主存
多核的时候也会有问题
写入Cache. 时间为访问Cache时间
但替换的时候需要写回主存
多核的时候也会有问题
写失效时
写分配法
绕写法
虚存
分类
页式: 虚拟页号通过页表换算成物理页号, 结合偏移量而得到物理地址
组成结构
页表基址寄存器(CPU中)
页表(内存中)
二级页表
反向页表(逻辑页数大于物理页数)
TLB(Translation Look-aside Buffer)(快表): 缓存页表
页长固定, 碎片少
段式
组成结构
段表基址寄存器
段表:
段起址+有效位+段长
段起址+有效位+段长
优点: 动态改变段长(如代码为一段, 数据为一段)
缺点: 空间分配复杂, 容易产生碎片
缺点: 空间分配复杂, 容易产生碎片
段页式:
先分段再每段自己分页
先分段再每段自己分页
虚地址: 基号(程序的序号)+段号+页号+偏移量
替换策略(由操作系统支持)
FIFO
最少使用(LFU): 每次访问计数器++, 替换时选计数器最小的块并清零
最近最少使用(LRU): 访问到置0, 其他没访问到的+1, 替换最大的块
FIFO+LRU
总线
分类
并行/串行总线
计算机总线
测控总线
网络通信总线
...
测控总线
网络通信总线
...
同步/异步/半同步/分离式总线
内部总线: CPU内部寄存器, 运算部件等
系统总线: 连接各高速设备和中低速IO等(包括数据/地址/控制总线)
系统总线: 连接各高速设备和中低速IO等(包括数据/地址/控制总线)
常见总线
infiniband
nvlink
nvlink
VPX
VME
VME
ISA
EISA
VESA
PCI
AGP(Accelerated Graphics Port): 加速图形接口
STD
SCSI(Small Computer System Interface): 小型计算机系统接口
USB总线
连硬盘的
IDE
SATA
IDE
SATA
结构
单总线结构: 受限于最慢的设备, 且易产生冲突
多总线结构: 还可加DMA(Direct Memory Access
仲裁方式
集中式仲裁: 如CPU总线仲裁器
设备和仲裁器之间有
设备和仲裁器之间有
- 送往仲裁器的请求信号BR
- 仲裁器送出的授权信号BG
链式查询: 一个一个按优先级查, 有请求就授权
计数定时: 仲裁器计数决定设备地址
独立请求
分布式仲裁
自举分布式仲裁:
各个设备通过请求总结果判断自己是否可以使用总线(独立判断自己是否具有最高优先级)
各个设备通过请求总结果判断自己是否可以使用总线(独立判断自己是否具有最高优先级)
冲突检测分布式仲裁: 检测到冲突则按某种规则选择一个设备
并行竞争分布式仲裁
读写
猝发式传送(Burst)
写后读: 校验
读后写: 保护共享资源
广播/广集
总线周期
申请分配
寻址
传送
结束(撤除总线占用)
通信方式
同步/异步
波特率(单位: bps): 总传输速率
比特率(单位: bps): 有效传输速率
波特率(单位: bps): 总传输速率
比特率(单位: bps): 有效传输速率
同步通信: 需要取决于最低频时钟
异步通信
不互锁
半互锁: 等从设备应答
全互锁: 等从设备应答, 主设备再告诉从设备好了
半同步: 同步为基本, 但有等待线(一直占有), 设备好了再去取
分离式: 分为两个子周期
- 发送请求后放弃使用权
- 准备好了再次申请使用权
IO系统
控制方式
- CPU指令控制
- 通道指令控制
发展阶段(2020-05-19)
接口模块和DMA:
具有通道结构:
专门的通道指令
专门的通道指令
具有IO处理机
编址方式(2020-05-19)
统一编址: 看作存储器地址的一部分
独立编址: 专门的IO指令
接口与端口(2020-05-19)
端口: 接口电路中的一些寄存器
存放状态, 命令, 状态信息等
存放状态, 命令, 状态信息等
接口: 若干端口加上逻辑控制组成
功能
选址
传送命令
传送数据
反映IO设备状态
类型
并行/串行
可编程/不可编程
通用/专用
程序型/DMA
信息交换方式(2020-05-19)
程序查询方式
软件上: 写代码逐个查询设备是否准备好, 若好, 则处理之
硬件上: 设备选择电路, 数据缓冲寄存器, 设备状态标志
程序中断方式
软件: 设置中断服务程序
硬件: CPU中设置中断机构, 外设接口设置中断控制器
DMA方式
DMA完成数据传输功能, 其控制还是需要CPU
DMA和CPU同时访存冲突怎么处理?
停止CPU访问
周期挪用(窃取): CPU为主
交替访存: 固定每个访问一周期之类的
组成
内存地址寄存器(计数器)AR:用于存放内存中要交换的数据的地址,DMA传送时,每交换一次数据,寄存器值加“1”
字计数器WC:用于记录传送数据块长度
数据缓冲寄存器BR:用于暂存每次传送的数据
设备地址寄存器DAR:IO设备码或辅存寻址信息
控制/状态逻辑:负责管理DMA传送过程,用于修改相关信息和状态
通道方式
接受CPU专门的IO指令
IO设备(2020-05-19)
辅助存储器(2020-05-22)
磁盘
基本概念
柱面(cylinder)
轨道(track)
扇区(sector)
技术指标
道密度: 沿半径方向单位长度的磁道数
位密度: 单位长度磁道所记录的数据位数
存储总量=盘面数*磁道数*每道代码数
寻址时间=寻道时间+等待时间
传输率 = 记录密度 * 介质运行速度
误码率 = 出错位数 / 总读位数
误码率 = 出错位数 / 总读位数
柱面数=磁道数
(同磁道在同一柱面)
(同磁道在同一柱面)
记录方式
方式
归零制(NZ)
不归零制(NRZ)
见1就翻制(NRZ1)
调相制-曼彻斯特编码(PM): 0就给上升沿, 1就给下降沿
调频制(FM)
改进调频制(MFM)
评价指标
编码效率
自同步能力
RAID技术
RAID 0 (无差别控制的区组)
RAID 1 (镜像, 同样的数据备份, 可修复)
RAID 2 (带海明码检验)
RAID 3 (带奇偶校验(独立一个磁盘)的并行传送)
RAID 4 (按数据块访问数据)
RAID 5 (奇偶校验码分布在每个磁盘上, 与 RAID 4 不同在按 bit 存 ?)
RAID 10 (RAID 0 和 RAID 1 一起用(多体并行 + 镜像))
光盘
Flash闪存器
写之前必须有额外擦除操作(原有数据先放在Buffer里)
固态硬盘(用的是NAND)
OS
进程管理
X程
进程(process)
状态
new
running
waiting
ready
terminated
PBC(Process Control Block, 程序控制块)
组成
进程状态(process state)
程序计数器(program counter)
CPU寄存器(CPU registers)
CPU调度信息(CPU-scheduling information)(优先级等)
内存管理信息(memory-management information)(基地址, 界限寄存器, 页表, 段表等)
记账信息(accounting information)(CPU时间, 实际使用时间等)
I/O状态信息(I/O status information)(I/O设备表, 打开文件表等)
PCB块按双向链表存放, 有指针指向父进程
进程终止时:
- 若子进程终止, 父进程未调用wait,
- 若父进程结束了还没调用wait, 则子进程变成孤儿进程(orphan process),
用SIGCHLD唤醒父进程
IPC 进程间通信
(Inter-Process Communication)
(Inter-Process Communication)
共享内存
(POSIX shm)
(POSIX shm)
组成
A Producer Process
Buffer
A Consumer Process
消息传递
(socket, pipe)
(socket, pipe)
组成
send
recv
分类
直接/间接
直接
间接(相当于有个信箱)
同步/异步
(阻塞/非阻塞)
(阻塞/非阻塞)
Buffer大小
Zero Capacity
Bounded Capacity
Unbounded Capacity
实现
socket
pipe
Ordinary Pipe
- 父子进程间
- 单向
Named Pipe
- 存在直到显式删除
- 双向半双工
进程同步
临界区(Critical Section)
实现方法
硬件(原子指令)
test_and_set()
compare_and_swap()
软件
禁止中断
- 禁止中断
- 临界区
- 允许中断
优点
- 便于kernel的简单操作
- 在用户进程不允许中断不合理(如恶意代码)
- 只对单处理器有效
strict alternation(严格轮转)
缺点
- 访问次序太过严格
- 忙等
peterson's solution
(限于指令不同)
(限于指令不同)
缺点
- 忙等
- 优先权翻转(如果有优先权的话)
mutex lock
优点
- 锁时间短的时候还是有用的, 还免去上下文切换
- 需要忙等(因此也称自旋锁)
- 需要硬件实现相应原子操作
semaphore
操作
wait()——P
signal()——V
up()
down()
类型
Binary Semaphore(二进制信号量)
相当于互斥锁
相当于互斥锁
Counting Semaphore(计数信号量)
优点
wait的进程可以丢进队列, 可以了再唤醒
wait的进程可以丢进队列, 可以了再唤醒
要求
互斥(Mutual Exclusion)
无过多约束
(要求两个CPU之类的)
(要求两个CPU之类的)
进步(Progress): 进程要有进展
有限等待(bounded waiting)
一个进程请求临界区过程中允许其他进程进入次数有上限
一个进程请求临界区过程中允许其他进程进入次数有上限
死锁
条件
Mutual Exclusion
Hold and Wait
No Preemption(不允许抢占)
若允许, 抢占去执行就好了
若允许, 抢占去执行就好了
Circular Wait
描述
资源分配图
点边类型
进程结点P_i
资源类型R_j
申请边P_i -> R_j
分配边R_j -> P_i
定理
无环⇒无死锁
有环 ∧ 所有资源各只有一个 ⇒ 死锁
(否则不一定)
(否则不一定)
检测和分配
单资源: DFS找环
多资源: 银行家算法
处理方法
通过协议来预防避免死锁: 破坏死锁的四个条件
可共享资源不要求互斥访问
每个进程申请一个资源的时候不能占有其他资源
- 执行前就申请好全部所需资源
- 没有资源的时候才能申请资源.
先申请一部分, 用再申申请下一部分之前要释放之前的
抢占: 通常适用于状态可保存恢复的资源(CPU寄存器和内存等)
对所有资源完全排序, 按顺序申请资源(打破循环等待条件)
检测死锁并加以恢复
鸵鸟算法: 无视死锁, 不作处理
经典案例
生产者消费者问题
解决方案
Pipe
Binary Semaphore
- semaphore mutex = 1;
- semaphore empty = N;
- semaphore full = 0;
哲学家用餐问题
解决方案
先后拿起左右两边的筷子, 再吃.
这种方案下会死锁, 但满足互斥条件.
有这样几种补救方案:
这种方案下会死锁, 但满足互斥条件.
有这样几种补救方案:
- 最多允许4个哲学家上餐桌
- 只有两根筷子都可用时才拿起
- 单号哲学家先拿左边, 双号先拿右边
Semaphore
读者写者问题
解决方案
semaphore db;
semaphore mutex; // 对read_count的锁
int read_count = 0;
semaphore mutex; // 对read_count的锁
int read_count = 0;
线程(thread)
模型
Many-to-One Model:
用户空间实现多线程, 由内核空间一个进程管理
内核易实现, 但一个阻塞全都阻塞
用户空间实现多线程, 由内核空间一个进程管理
内核易实现, 但一个阻塞全都阻塞
One-to-One Model:
每个用户空间线程对应一个内核空间进程
高并发, 但要对内核做较多修改
Windows 和 Linux 都是用这种
每个用户空间线程对应一个内核空间进程
高并发, 但要对内核做较多修改
Windows 和 Linux 都是用这种
Many-to-Many Model:
并不严格一一对应
并不严格一一对应
协程(coroutine)
如Python中的yield语法
当执行不下去的时候, 协程让调度器调度其他协程运行
当执行不下去的时候, 协程让调度器调度其他协程运行
发展历史:
- stack-twine: 栈中对应分配一段空间专门用作协程栈
- stackful: 利用多线程, 分配一个栈专门运行协程(Go语言的即是)
- stackcopy: 把栈内容拷贝出去以减少内存消耗(但不安全, 没有流行)
- stackless: 本质上是一个状态机, 没有自己的栈,
只有自己的帧(python中的协程就是stackless的)
纤程(fiber)
通常特指Windows对协程的实现
通常特指Windows对协程的实现
进程调度
调度方案
普通Schedule(调度)
Context Switch(上下文切换):
各种寄存器内存等状态的保存
各种寄存器内存等状态的保存
类型
不可抢占: 只能自己释放
优点
优点
- 减少了切换开销
- 相应延迟等
可抢占
优点
优点
- 延迟小
- 上下文切换开销
性能指标
CPU使用率(通常达到40%~90%)
吞吐量: 每秒做多少xx(事务啥的)
周转周期: 提交任务开始到任务结束时间(包括运行, 等待, IO等)
等待时间: 在queue里等的时间
响应时间: 提交开始到第一次运行的时间
调度算法
FIFO/FCFS(先到先服务)
SJF(Shortest Job Fisrt, 最短作业优先)
允许抢占则为SRTF(Shortest Remaining Time First)
允许抢占则为SRTF(Shortest Remaining Time First)
- SJF是最优的, 平均等待时间最小.
- 问题: 无法知道下次CPU执行长度
可以预测为以前长度的指数平均(exponential average)
RR(Round-Robin, 轮转)
给每个进程运行一段时间, 可抢占
针对多个不同优先级队列, 设置不同时间片长度
给每个进程运行一段时间, 可抢占
针对多个不同优先级队列, 设置不同时间片长度
优点
- 响应好
- 公平性
- 等待时间, 运行时间, 切换开销都比较大
Priority Scheduling(优先级调度)
优先级定义依据
时间限制
内存需要
打开文件数
CPU burst
I/O burst
缺点
- 存在极端无限等待block(可随等待时间调整优先级)
Priority Scheduling with Multiple Queues
Multilevel Feedback Queue(多级反馈队列)
Multilevel Feedback Queue(多级反馈队列)
参数
队列数量
每个队列的调度算法
确定升级优先级的方法
确定降级优先级的方法
确定进程需要服务时进入哪个队列的方法
多处理器调度
方法
非对称多处理(asymmetric multiprocessing)
对称多处理asymmetric multiprocessing, SMP)
亲和性(processor affinity):
让一个进程尽可能在同一个CPU上运行,
即为一个进程对CPU的亲和性
让一个进程尽可能在同一个CPU上运行,
即为一个进程对CPU的亲和性
软亲和性
硬亲和性
负载均衡
推迁移(push migration)
周期性检查, 负载高就推到空闲处理器
周期性检查, 负载高就推到空闲处理器
拉迁移(pull migration)
周期性检查, 空闲就拉一个来
周期性检查, 空闲就拉一个来
实时CPU调度
即有DDL之类的
即有DDL之类的
分类
软实时系统(soft real-time system)
只保证关键进程优先级高点
只保证关键进程优先级高点
硬实时系统(hard real-time system)
要求一个任务在截止期限前必须完成
要求一个任务在截止期限前必须完成
调度算法
单调速率调度(rate-monotonic)
- 采用抢占的, 静态优先级的策略, 调度周期性任务
- 优先级高的(周期短的)先抢占运行
- 不保证硬实时
最早截止期限优先(Earliest-Deadline-First, EDF)
案例
linux的调度
总体是多级反馈队列, 0~99级用RR,
后面100~139表示nice value从-20~19, 使用CFS算法(vruntime越小, 越先运行)
总体是多级反馈队列, 0~99级用RR,
后面100~139表示nice value从-20~19, 使用CFS算法(vruntime越小, 越先运行)
算法评估
确定型模型
给定workload, 测评各个算法
起演示效果
给定workload, 测评各个算法
起演示效果
排队模型
W为队列平均等待时间, λ为平均到达率, n为平均队列长度, 则
n=λ*W
W为队列平均等待时间, λ为平均到达率, n为平均队列长度, 则
n=λ*W
仿真
使用实际负载例子跑一遍
使用实际负载例子跑一遍
内存管理
逻辑地址空间
结构
Global and Static Variable(Data Segment, 初始化了) and BSS(Block Started by Symbol, 未初始化)
Code and Constant
Code and Constant
分配
首次适应(First-Fit): 从头开始, 找到足够大的空闲孔为止
下次适应(Next-Fit): 从上次适应结束开始, 找到足够大的空闲孔为止
下次适应(Next-Fit): 从上次适应结束开始, 找到足够大的空闲孔为止
最优适配(Best-Fit): 满足要求的剩余最小的孔
最差适应(Worst-Fit): 分配最大的孔
段错误: 读写非法区域
空闲块组织形式
隐式空闲链表(相当于要遍历所有块)
显式空闲链表(free时加next和prev指针)
分离空闲链表(不同范围大小的分开, 伙伴系统)
MMU
(On-CPU Device)
(On-CPU Device)
直接给个起始和大小, 见课本237页
分页: LUT只用来查高几位
即高位定页, 低位定页内地址
需要一个页表基地址寄存器
即高位定页, 低位定页内地址
需要一个页表基地址寄存器
页表
结构
frame(帧)地址
Valid-Invalid Bit
未分配的逻辑空间不必对应一个帧, 可先不确定
未分配的逻辑空间不必对应一个帧, 可先不确定
Permission(read, write, exec, share)
按需调页(Demanding Page)
访问的时候若invalid就触发Page Fault中断来分配一个Page
访问的时候若invalid就触发Page Fault中断来分配一个Page
页表替换算法
最优页面置换: 置换最长时间不会使用的页面
这只是一个标准, 实际一般不用
这只是一个标准, 实际一般不用
FIFO页面置换: 置换最旧的页面
正常应该帧数越多, 页错误数越少,
但FIFO页面置换会有Belady异常(Belady's anamaly)
但FIFO页面置换会有Belady异常(Belady's anamaly)
LRU(最近最少使用)页面置换
实现方式
计数器
堆栈
近似LRU页面置换
额外引用位算法
如页表每页保留一个8位字节, 每次右移, 有用就最高位置1.
这样最小编号的就是LRU页面
如页表每页保留一个8位字节, 每次右移, 有用就最高位置1.
这样最小编号的就是LRU页面
第二次机会算法
若页面引用位为0, 直接置换, 若为1, 给它一次机会, 变成0.
可以用时钟算法实现
若页面引用位为0, 直接置换, 若为1, 给它一次机会, 变成0.
可以用时钟算法实现
增强型第二次机会算法
有 (引用位, 修改位) 两个位
有 (引用位, 修改位) 两个位
- (0,0)是最佳
- (0,1)置换前要把修改写出
- (1,0)最近用过但没有修改, 可能很快再次使用
- (1,1)最近用过, 可能很快再次使用, 且换出要写出
内存已经分配完, 就要替换到交换区
涉及页面替换算法
涉及页面替换算法
需多次访存怎么缓解?
扩大页表
内部碎片化
重复数据删除(Deduplication)机会变小
TLB缓存
(相联存储器)
(相联存储器)
有效内存访问时间EAT=(t+ε)α+(2t+ε)(1-α)
其他类型页表
多级页表: 将页号进一步分
Hash页表
Inverted Page Table(倒置页表)
帧分配
分配算法
平均分配
n个进程分配m个帧, 每个进程m/n帧
n个进程分配m个帧, 每个进程m/n帧
比例分配
根据进程大小的比例分配
可结合考虑优先权
根据进程大小的比例分配
可结合考虑优先权
系统抖动(thrashing)
原因: 需要物理帧不够, 会频繁导致Page Fault
解决方案
局部置换算法/优先级置换算法
即, 一个进程开始抖动则不能从另一个进程获取帧
但还是需要等待调页(Page List会变长), 所以其他进程有效访问时间仍然会增加
即, 一个进程开始抖动则不能从另一个进程获取帧
但还是需要等待调页(Page List会变长), 所以其他进程有效访问时间仍然会增加
工作集模型: 估计需要帧数
工作集(working-set): 在最近的Δ个访问页面的集合
太小不足以包含局部, 太大会包含多个局部
太小不足以包含局部, 太大会包含多个局部
工作集大小WSS
其和大于m就会抖动
其和大于m就会抖动
内核内存管理
伙伴系统
slab分配
若干个连续帧分配为slab, 丢缓存里
kernel要分配的时候就先从cache整
kernel要分配的时候就先从cache整
大容量管理
磁盘
磁盘管理
坏块管理
正常来说有个上限
正常来说有个上限
方式
Sector Sparing/Forwarding
调到别的地方
调到别的地方
- 可能影响调度效率
Sector Slipping
坏了就写到接下来一个扇区
坏了就写到接下来一个扇区
- 可能出现数据移动
- 但这样能够使队磁盘调度的影响小
格式化
通常出厂就设置好了, 侧重于物理格式化
把磁盘做一个扇区划分
通常出厂就设置好了, 侧重于物理格式化
把磁盘做一个扇区划分
扇区结构
头部和尾部: 包含磁盘控制器的使用信息, 如
- 扇区号
- 纠错代码(Error-Correcting Code, ECC)
数据区域(通常512KB)
使用
文件系统
分区
逻辑格式化
创建文件系统, 存储文件系统信息
创建文件系统, 存储文件系统信息
IO优化
更多顺序读写, 减少随机读写
更多顺序读写, 减少随机读写
Raw Disk: 视作一个大数组, 相当于直接控制
磁盘调度
FCFS调度(先到先服务)
SSTF调度(Shortest-Seek-Time-First, 最短寻道时间优先)
并非最优
并非最优
SCAN调度(扫描算法, 也称电梯算法(elevator algorithm)
移到0再移到另一端, 往复来回
移到0再移到另一端, 往复来回
C-SCAN(循环扫描)
从一端到另一端后立即返回开头, 再继续循环
从一端到另一端后立即返回开头, 再继续循环
LOOK调度
SCAN调度的实际实现, 即 只移动到最远的就返回
相应有LOOK和C-LOOK调度
SCAN调度的实际实现, 即 只移动到最远的就返回
相应有LOOK和C-LOOK调度
固态硬盘SSD
特点
non-volatile
shock resisting
high speed
low energy consumption
结构
外部接口
Flash Controller
软件层
Flush Mux/Demux
通道连接芯片(闪存颗粒)
操作
program(写, 以page为单位)
erase(只能以block为单位)
trim: 标记无效后, 读到缓存再弄回去, 实现真正清除
逻辑上
读的时候(写就反过来)
Page-->registers-[bus]->(controller)
Page-->registers-[bus]->(controller)
Overwrite: no in-place overwrite
读-修改-写的话, 需要读到缓存再刷回去
Flush Translation Layer
文件系统和Flush memory之间的层, 在硬盘里.
用的也是逻辑地址.
文件系统和Flush memory之间的层, 在硬盘里.
用的也是逻辑地址.
Address Mapping
Sector Mapping
Block Mapping
Hybrid Mapping
Log-Structured Mapping
Garbage Collection
Wear-leveling
RISC V
Instruction Formats
I-type
ADDI
SLTI: Set Less Than Imm
shift instructions
R-type
SLT, SLTU: Set Less Than
SRL, SLL, SRA: Shift Logic/Arimetic Left/Right
S-type
branch
UJ-type
J/JAL
HTML
文本类
html: 描述网页
body: 网页可见内容
背景色信息: bgcolor="yellow"
h1, h2, h3: 标题
对齐方式: align="center"
p: 段落
br: 换行
<hr />: 分割线
链接类
a: 链接
href: 链接地址
图表类
img: 图像
src: 图源
width: 宽
height: 高
area: 定义可点击区域
table: 表格
<tr></tr>: 行
<td></td>: 行内单元格
board: 边框
<th></th>: 表头单元格(大多数浏览器作加粗居中处理)
<td> </td>: 空格占位格
colspan, rowspan: 指定跨越单元格数
响应式设计: 随屏幕大小调整
(bootstrap)
(bootstrap)
框架: 显示多个html文档
内联框架: 页面内显示页面
内联框架: 页面内显示页面
头部元素
<title>
<base>
<link>
<meta>
<script>
<style>
字符实体
表单: 各种input元素
input: 输入
文本框: <input type="text" name="firstname">
单选按钮: <input type="radio" name="sex" value="male" checked>Male
提交: <input type="submit" value="Submit">
action: 指定处理程序(若忽略, 会被指定为当前页面)
method: 指定http方法(GET/POST)
name: 设置该属性每个字段才能正确提交
password, checkbox, date, number等
select: 下拉列表
textarea: 多行文本框
button: 可点击按钮
fieldset: 组合表单数据
注释: <!--注释内容-->
收藏
0 条评论
下一页