dtm_master_worker_flow_rough

2016-04-28 16:24:58   0  举报





dtm_master_worker_flow_rough是一种分布式任务处理框架，它采用主从模式和工作流方式进行任务调度和执行。在这种方式下，一个主节点负责任务的分配和监控，多个工作节点负责具体的任务执行。这种架构可以有效地提高系统的并发处理能力和资源利用率，同时也可以方便地进行任务管理和故障恢复。然而，由于主从模式的特性，如果主节点出现故障，可能会导致整个系统的工作暂停，因此需要采取相应的备份和故障转移策略来保证系统的稳定运行。此外，由于任务的分配和调度需要考虑到各个节点的工作负载和性能，因此也需要设计合理的调度算法和策略。

作者其他创作

大纲/内容

if(proc_info[i].graceful_shutdown == 1)如果是被master显式kill的

将channel作为EPOLLIN放入本WORKER的epoll

for 0 ~ g_srv-config-basic_config.max_threadsfork WORKER记录channeladd_accept_worker

代码中通过声明控制action变量来注册控制action放入action_vector

connect to global_config_db_node配置中心db测活

如果现在持有accept锁，则放入队列，后续处理如果没有持有accept锁，则立即处理处理函数均为dtm_event_channel

现在的signal handler没有区分角色难道每种角色收到同样信号的处理都一样吗？难道不应该是某些信号只能给worker发不能给master发以免无操作吗？

将proc_info中现有所有子进程均标记为graceful_shutdown=1，包括worker和func

epid 0

创建g_srv

遍历proc_info，向所有子进程均发送kill SIGTERMprocess_type = -1process_num = 0

直接read channel，做处理不write back

初始化signal handlers

有超时的阻塞epoll_wait

初始化shm

return

子进程收到SIGUSR1或者SIGTERM就g_gracefully_shutdown=1

g_gracefullly_child_shutdown = 1

直接write给各个worker的channel不再read

遍历本次epoll返回的ready fd

更新conf_modify_time读取config

这里不关闭channeldel accept和设置shutdown=0wait到了再做这些

reload_dtm

for 0 ~ func_process[i] LOCKGUARD_PROCESSfork FUNC记录channel

while (g_gracefully_shutdown == 0)

将proc_info中现有所有子进程均kill SIGUSR1，包括worker和funcprocess_type = -1process_num = 0

遍历proc_info寻找是否dead child是哪个子进程

WIFSIGNALED(statloc)如果是被信号干掉的child，log一下继续

将proc_info中现有所有graceful_shutdown=0的子进程均kill SIGUSR1，均标记为graceful_shutdown=1

子进程收到SIGTERM就g_gracefully_shutdown=1

g_gracefully_reload == 1

del_accept_worker(epid);

1 == g_gracefully_loadconf

如果是channel

此时新老子进程均在proc_info里面均与master有channel均在accept队列里面

记录自己的channel关掉master侧用的channel

遍历proc_info当前所有子进程如果仍有alive且shutdown=0的，则什么都不做，否则：

这里不再wait所有worker真的退出吗？

初始化proc_info数组包括每个channel

子进程收到SIGUSR1就g_gracefully_shutdown=1

更新conf_modify_time重新load_config_from_file

init_accept_manager

dtm_unlock_mutexes(epid);

主循环while (! (g_gracefully_shutdown == 1 && all_finished == 1) )

sleep 100ms

dtm_config_action_manager::manager_run每次执行要么当前cur_action的action要么新设action的preaction每次执行都read db获取每个action的执行phase每次执行都write db更新每个action的执行phase

channel的另一端因为child死掉而closeonexec但是我们这边的channel因为没有exec而没有close不需要显示close吗？会浪费fd，socketpair的系统资源也不会释放

reset proc_info[i]不会重启，不会close channel直接置为-1

关掉从master处继承的所有与其他worker通信的channel

end of while

创建g_srv-service_socket

不是worker也执行这个，好吗？

accept_worker_manager由master来均匀调度哪个worker来持有accept锁

g_gracefullly_child_start = 1

 收藏

立即使用

Jan2017_1

 收藏

立即使用

Jan2017_1

 收藏

立即使用

Jan2017_1

 收藏

立即使用

concurrent_io

Jesse

职业：暂无

去主页





0 条评论

下一页

为你推荐

查看更多



dtm_master_worker_flow_rough