最近公司项目需要,需要在我们的嵌入式linux设备中创建一个守护进程,用于保护系统中的主进程,防止某些不可预期的意外导致主进程异常结束后,系统完全宕机没有任何反应,破坏用户体验感。但是,查阅诸多资料之后发现,大部分人都只讲述了如何在x86平台上创建和实现守护进程,而并没有人介绍过如何在嵌入式平台上创建和实现守护进程。于是,经过一番摸索之后,从原理到代码,都进行了一些大致的了解,我自己提出了一些想法。下面就进行一下简单的总结和整理。
1、技术原理
下面是网上摘抄的,关于x86的linux系统中对于守护进程的介绍和描述。
守护进程(Daemon)是一种运行在后台的一种特殊的进程,它独立于控制终端并且周期性的执行某种任务或等待处理某些发生的事件。
守护进程是个特殊的孤儿进程,这种进程脱离终端,为什么要脱离终端呢?之所以脱离于终端是为了避免进程被任何终端所产生的信息所打断,其在执行过程中的信息也不在任何终端上显示。由于在 Linux 中,每一个系统与用户进行交流的界面称为终端,每一个从此终端开始运行的进程都会依附于这个终端,这个终端就称为这些进程的控制终端,当控制终端被关闭时,相应的进程都会自动关闭。但是守护进程却能突破这种限制,它脱离于终端并且在后台运行,并且它脱离终端的目的是为了避免进程在运行的过程中的信息在任何终端中显示并且进程也不会被任何终端所产生的终端信息所打断。它从被执行的时候开始运转,知道整个系统关闭才退出(当然可以认为的杀死相应的守护进程)。如果想让某个进程不因为用户或中断或其他变化而影响,那么就必须把这个进程变成一个守护进程。
2、设计步骤
对于x86平台的linux系统,理论上来说,要想实现上述的效果,守护进程具有一套严格的实现步骤。也就是说,守护进程必须在启动伊始,就去除掉一些系统相关的限制,这样才能稳定的在后台运行,而不至于被其他任务所干扰和影响。
下面是在x86平台编写守护进程的基本过程:
-
下面就是摘自某前辈的博客上的全套源码:
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
int init_daemon(void)
{
int pid;
int i;
// 1)屏蔽一些控制终端操作的信号
signal(SIGTTOU,SIG_IGN);
signal(SIGTTIN,SIG_IGN);
signal(SIGTSTP,SIG_IGN);
signal(SIGHUP ,SIG_IGN);
// 2)在后台运行
if( pid=fork() ){
// 父进程
exit(0);//结束父进程,子进程继续
}else if(pid<0){
// 出错
perror("fork");
exit(EXIT_FAILURE);
}
// 3&#xff09;脱离控制终端、登录会话和进程组
setsid();
// 4&#xff09;禁止进程重新打开控制终端
if( pid&#61;fork() ){
// 父进程
exit(0);// 结束第一子进程&#xff0c;第二子进程继续&#xff08;第二子进程不再是会话组长&#xff09;
}else if(pid<0){
// 出错
perror("fork");
exit(EXIT_FAILURE);
}
// 5&#xff09;关闭打开的文件描述符
// NOFILE 为
// NOFILE 为文件描述符最大个数&#xff0c;不同系统有不同限制
for(i&#61;0; i
}
// 6&#xff09;改变当前工作目录
chdir("/tmp");
// 7&#xff09;重设文件创建掩模
umask(0);
// 8&#xff09;处理 SIGCHLD 信号
signal(SIGCHLD,SIG_IGN);
return 0;
}
int main(int argc, char *argv[])
{
init_daemon();
while(1);
return 0;
}
3、实际情况
从上面的流程逻辑和实际代码可以看出&#xff0c;x86平台的守护进程&#xff0c;其实还是比较复杂的&#xff0c;需要进行一堆比较繁琐的初始化过程。然而&#xff0c;对于嵌入式平台而言&#xff0c;流程似乎可以简化一些&#xff0c;不用这么复杂的处理。因为&#xff0c;在本次嵌入式系统中启用守护进程。其目的只是简单的利用这个守护进程来启动另一个被守护的进程&#xff0c;然后定时监控该进程是否仍在正常运行&#xff0c;一旦发现其运行异常&#xff0c;则立即重启该进程就好。
所以&#xff0c;我对上述的流程进行了简化&#xff0c;得到如下的流程&#xff1a;
-
4、实际源码
以下就是在本嵌入式系统项目中所设计的守护进程模块的全套代码。
/************************************************************************************************** ** 函数名称: lockfile ** 功能描述: 对文件加锁/解锁 ** 输入参数: lock: 1表示进行加锁处理&#xff0c;0表示进行解锁处理 ** 输出参数: 无 ** 返回参数: 无 **************************************************************************************************/
int tryto_lockfile(int fd, int lock)
{
struct flock fl;
fl.l_type&#61; (lock &#61;&#61; 1) ? F_WRLCK : F_UNLCK;
fl.l_start &#61; 0;
fl.l_whence &#61; SEEK_SET;
fl.l_len &#61; 0;
return (fcntl(fd, F_SETLK, &fl));
}
/************************************************************************************************** ** 函数名称: get_proc_running_state ** 功能描述: 获取进程运行状态 ** 输入参数: 无 ** 输出参数: 无 ** 返回参数: 返回-1表示路径错误 ** 返回参数: 返回0表示进程从未运行过&#xff0c;返回1表示进程曾经运行过但是现在停止运行了&#xff0c;返回2表示进程正在运行中 **************************************************************************************************/
static int get_proc_running_state(const char* filename)
{
int fd;
if (filename &#61;&#61; NULL) { /* 文件名为空 */
return -1;
}
fd &#61; open(filename, O_RDWR, (S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH));
if (fd <0) { /* 文件不存在&#xff0c;表示进程从未运行过 */
return 0;
}
if (tryto_lockfile(fd, 1) &#61;&#61; -1) { /* 文件加锁失败&#xff0c;表示进程在运行中 */
close(fd);
return 2;
} else { /* 文件加锁成功&#xff0c;表示进程已经消失 */
tryto_lockfile(fd, 0); /* 此处要注意记得解锁和关闭文件 */
close(fd);
return 1;
}
}
/************************************************************************************************** ** 函数名称: proc_watch ** 功能描述: 检测进程是否有在运行&#xff0c;没有运行则重新启动之 ** 输入参数: procname: 进程名 ** 输出参数: 无 ** 返回参数: 返回-1表示进程从未运行过&#xff1b;返回0表示进程当前运行正常&#xff1b; ** 返回参数: 返回其他非零值表示进程不存在且已被重新启动&#xff0c;返回的值是新的pid值 **************************************************************************************************/
int proc_watch(const char *procname)
{
int result, state;
char filename[100];
result &#61; 0;
sprintf(filename, "/var/run/%s.pid", procname);
state &#61; get_proc_running_state(filename);
switch (state)
{
case 0:
result &#61; -1;
break;
case 1:
result &#61; start_proc_by_name(procname);
break;
case 2:
result &#61; 0;
break;
default:
break;
}
return result;
}
/************************************************************************************************** ** 函数名称: start_proc ** 功能描述: 启动进程开始运行 ** 输入参数: 无 ** 输出参数: 无 ** 返回参数: 进程的ID号&#xff0c;若启动失败则返回0 **************************************************************************************************/
int start_proc_by_name(const char* procname)
{
pid_t pid, child_pid;
char filename[100];
sprintf(filename, "%s%s", PROC_FILE_PATH, procname);
child_pid &#61; 0;
if (access(filename, X_OK | F_OK) !&#61; 0) { /* 如果文件存在&#xff0c;并且可执行 */
return 0;
}
pid &#61; fork(); /* 首先要fork一个进程出来 */
if (pid <0) { /* 创建进程失败 */
return 0;
} else if (pid &#61;&#61; 0) { /* 创建进程成功&#xff0c;此处是子进程的代码 */
if (execl(filename, procname, (char *)NULL) !&#61; -1) {
return 1;
} else {
return 0;
}
} else { /* 创建进程成功&#xff0c;此处是父进程代码 */
child_pid &#61; pid;
}
return (int)child_pid;
}
/************************************************************************************************** ** 函数名称: thread_client_hdl ** 功能描述: client进程监视线程 ** 输入参数: 无 ** 输出参数: 无 ** 返回参数: 无 **************************************************************************************************/
static void *thread_client_hdl(void *pdata)
{
int result;
pdata &#61; pdata;
sleep(10);/* 第一次要进行延时 */
for (;;) {
printf("time to check thread_client...\n");
result &#61; proc_watch(PROC_NAME_CLIENT);
if (result &#61;&#61; -1) {
printf("thread_client never exist...\n");
} else if (result &#61;&#61; 0) {
printf("thread_client running ok...\n");
} else {
printf("thread_client has gone! but restarted...\n");
}
sleep(10);
}
return NULL;
}
/************************************************************************************************** ** 函数名称: main ** 功能描述: 入口主函数 ** 输入参数: 无 ** 输出参数: 无 ** 返回参数: 无 **************************************************************************************************/
int main(int argc, char *argv[])
{
int client_para;
char *p, *process_name;
pthread_t thread_client;
process_name &#61; argv[0]; /* 获取进程名称 */
p &#61; process_name &#43; strlen(process_name);
while (*p !&#61; &#39;/&#39; && p !&#61; process_name) {
p--;
}
if (*p &#61;&#61; &#39;/&#39;) {
process_name &#61; p &#43; 1;
}
printf("\"%s\" starting...\n", process_name);
client_para &#61; 0x01;
if (pthread_create(&thread_client, NULL, thread_client_hdl, &client_para) !&#61; 0) {
printf("create thread_client failed!\n");
return 1;
}
if (start_proc_by_name(PROC_NAME_CLIENT) &#61;&#61; 0) {
printf("start thread_client failed!\n");
return 1;
}
for (;;) {
sleep(60);
printf("i am still alive...\n");
}
return 0;
}
5、其他说明
待补充
6、参考文献
1、http://blog.csdn.net/lianghe_work/article/details/47659889
2、http://blog.csdn.net/liangxanhai/article/details/7752898