dtm_master_worker_flow_rough
2016-04-28 16:24:58 0 举报
dtm_master_worker_flow_rough是一种分布式任务处理框架,它采用主从模式和工作流方式进行任务调度和执行。在这种方式下,一个主节点负责任务的分配和监控,多个工作节点负责具体的任务执行。这种架构可以有效地提高系统的并发处理能力和资源利用率,同时也可以方便地进行任务管理和故障恢复。然而,由于主从模式的特性,如果主节点出现故障,可能会导致整个系统的工作暂停,因此需要采取相应的备份和故障转移策略来保证系统的稳定运行。此外,由于任务的分配和调度需要考虑到各个节点的工作负载和性能,因此也需要设计合理的调度算法和策略。
作者其他创作
大纲/内容
if(proc_info[i].graceful_shutdown == 1)如果是被master显式kill的
Y
将channel作为EPOLLIN放入本WORKER的epoll
for 0 ~ g_srv-config-basic_config.max_threadsfork WORKER记录channeladd_accept_worker
代码中通过声明控制action变量来注册控制action放入action_vector
connect to global_config_db_node配置中心db测活
如果现在持有accept锁,则放入队列,后续处理如果没有持有accept锁,则立即处理处理函数均为dtm_event_channel
现在的signal handler没有区分角色难道每种角色收到同样信号的处理都一样吗?难道不应该是某些信号只能给worker发不能给master发以免无操作吗?
N
将proc_info中现有所有子进程均标记为graceful_shutdown=1,包括worker和func
epid 0
创建g_srv
遍历proc_info,向所有子进程均发送kill SIGTERMprocess_type = -1process_num = 0
直接read channel,做处理不write back
初始化signal handlers
有超时的阻塞epoll_wait
初始化shm
return
子进程收到SIGUSR1或者SIGTERM就g_gracefully_shutdown=1
g_gracefullly_child_shutdown = 1
直接write给各个worker的channel不再read
遍历本次epoll返回的ready fd
更新conf_modify_time读取config
这里不关闭channeldel accept和设置shutdown=0wait到了再做这些
reload_dtm
for 0 ~ func_process[i] LOCKGUARD_PROCESSfork FUNC记录channel
while (g_gracefully_shutdown == 0)
将proc_info中现有所有子进程均kill SIGUSR1,包括worker和funcprocess_type = -1process_num = 0
遍历proc_info寻找是否dead child是哪个子进程
WIFSIGNALED(statloc)如果是被信号干掉的child,log一下继续
将proc_info中现有所有graceful_shutdown=0的子进程均kill SIGUSR1,均标记为graceful_shutdown=1
子进程收到SIGTERM就g_gracefully_shutdown=1
g_gracefully_reload == 1
del_accept_worker(epid);
1 == g_gracefully_loadconf
如果是channel
此时新老子进程均在proc_info里面均与master有channel均在accept队列里面
记录自己的channel关掉master侧用的channel
遍历proc_info当前所有子进程如果仍有alive且shutdown=0的,则什么都不做,否则:
这里不再wait所有worker真的退出吗?
初始化proc_info数组包括每个channel
子进程收到SIGUSR1就g_gracefully_shutdown=1
更新conf_modify_time重新load_config_from_file
init_accept_manager
dtm_unlock_mutexes(epid);
主循环while (! (g_gracefully_shutdown == 1 && all_finished == 1) )
sleep 100ms
dtm_config_action_manager::manager_run每次执行要么当前cur_action的action要么新设action的preaction每次执行都read db获取每个action的执行phase每次执行都write db更新每个action的执行phase
channel的另一端因为child死掉而closeonexec但是我们这边的channel因为没有exec而没有close不需要显示close吗?会浪费fd,socketpair的系统资源也不会释放
reset proc_info[i]不会重启,不会close channel直接置为-1
关掉从master处继承的所有与其他worker通信的channel
end of while
创建g_srv-service_socket
不是worker也执行这个,好吗?
accept_worker_manager由master来均匀调度哪个worker来持有accept锁
g_gracefullly_child_start = 1
0 条评论
下一页
为你推荐
查看更多