荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: oopilix (。。), 信区: Visual
标  题: [zz]Windows服务编写原理及探讨(4)
发信站: 荔园晨风BBS站 (Sat Oct  4 18:21:24 2003), 站内信件

四)一些问题的讨论

  前面几章的内容都是服务的一些通用的编写原理,但里面隐含着一些问题,编
写简单的服务时看不出来,但遇到复杂的应用就会出现一些问题,所以本章就是用
来分析、解决这些问题的,适用于高级应用的开发人员。我这一章的内容都是经过
实验得到的,很有实际意义。

  我在第一章里面就说过,是由一个服务的主线程执行CtrlHandler函数,它将
收到各种控制命令,但是真正处理命令,执行操作的是ServiceMain的线程。现在
,当一个SERVICE_CONTROL_STOP到达之后,你作为一个开发者,要怎样停止这个服
务?在我看过的一些源代码里,大部分只是简单的调用TerminateThread函数去强
行杀掉服务进程。但应该稍稍有点线程编程的常识就应该知道TerminateThread函
数是可用的调用中最为糟糕的一个,服务线程将得不到任何机会去做应该的清理工
作,诸如清除内存、释放核心对象,Dlls也得不到任何线程已经被毁的通知。

  所以停止服务的适当方法是以某种方式激活服务线程,让它停止继续提供服务
功能,然后执行完当前操作和清除工作后返回。这就表示你必须在CtrlHandler线
程和ServiceMain线程之间执行适当的线程通信。现在已知的最好的内部线程通信
机制是I/O Completion Port(I/O 完成端口),假如你编写的是一个大型的服务,
需要同时处理为数众多的请求,并且运行在多处理器系统上面,这个模型就可以提
供最佳的系统性能。但也正因为它的复杂性较高,在小规模的应用上面不值得花费
很多的时间和精力,这时作为开发者可以适当的选取其它的通信方式,诸如异步过
程调用队列、套接字和窗口消息,以适应实际情况。

  开发服务时的另外一个重要问题就是调用SetServiceStatus函数时的所有状态
报告问题。很多的服务开发者为了在什么时候调用SetServiceStatus的问题而常常
产生争论,一般推荐的方法就是:先调用SetServiceStatus函数,报告
SERVICE_STOP_PENDING状态,然后将控制代码传给服务线程或者再建立一个新的线
程,让它去继续执行操作,当该线程即将执行完操作之前,再由它将服务的状态设
置成SERVICE_STOPPED,然后服务正好停止。

  上面的主意从两个方面来讲还是很不错的。首先服务可以立即确认收到了控制
代码,并将在它认为适当的时候进行处理;然后就是因为前面说过的,执行
CtrlHandler函数的是主线程,如果按照这种工作方法,CtrlHandler函数可以迅速
的返回,不会影响到其它服务可能收到的控制请求,对含有多个服务的程序来说,
响应各个服务的控制代码的速度会大大的提高。可是,随之而来的是问题——
race condition 即“竞争条件”的产生。

  摆在下面的就是一个竞争条件的例子,我花了一点时间来修改我的基本服务的
代码,意图故意引发“竞争条件”的发生。我添加了一个线程,CtrlHandler函数
的线程在收到请求后立刻作出反应,将当前的服务状态设置成“请求正在被处理”
即..._PENDING,然后由我添加的线程在睡眠了5秒之后再将服务状态设置成“请求
已完成”状态——以模拟服务正在处理一些不可中止的事件,只有处理完成后才会
更改服务的状态。一切就绪之后,我尝试在短时间内连续发送两个“暂停”请求,
如果“竞争条件”不存在的话应该只有先发送的那个请求能够到达SCM,而另一个
则应该返回请求发送失败的信息,天下太平。

  事实上很不幸的,我成功了。当我在两个不同的“命令提示符”窗口分别同样
的输入下面的命令:

net pause kservice

  之后在“事件查看器”里面,我找到了我的服务在“应用程序日志”里添加的
事件记录,结果是我得到了这样的事件列表:

SERVICE_PAUSE_PENDING
SERVICE_PAUSE_PENDING
SERVICE_PAUSED
SERVICE_PAUSED

  看上去很奇怪是不是?因为服务处于正在暂停状态的时候,它不应该被再次暂
停的。但事实摆在眼前,很多服务都曾明确的报告过上面的顺序状态。我曾经认为
这时SCM应该说些什么或做些什么,以阻止“竞争状态”的出现,但实验结果告诉
我SCM似乎对此无能为力,因为它不能控制状态代码在什么时候被发送。当用户使
用“管理工具”里面的“服务”工具来管理服务的状态的时候,在一个“暂停”请
求已经发出之后不能再次用这个工具向它发出“暂停”请求,如果正在暂停服务,
会有一个对话框出现,阻止你按下它后面的“服务”工具的工具栏上的任何按钮,
如果已经暂停,“暂停“按钮将变成灰色。但是这时用命令行工具 net.exe 就可
以很顺利地将暂停请求再次送到服务。证据就是我添加的其他事件记录里面记下了
SetServiceStatus的调用全都成功了,这更进一步的说明了我提交的两个暂停请求
都经过SCM,然后到达了我的服务。

  接下来我又进行了其它的测试,例如先发送“暂停”请求,后发送“停止”请
求,和先发送“停止”请求,再发送“暂停”或“停止”请求。前一种情况更加糟
糕,先发送的“暂停”请求和后发送的“停止”请求都没有得到什么好下场,虽然
SCM老老实实的先暂停了服务,后停止了服务,但 net.exe 的两个实例的调用均告
失败。不过在测试先发送停止“请求”的时候,所有的现象都表示这两个请求只有
先发送的“停止”到达了SCM,这还算是个好消息...

  为了解决这个问题,当服务得到一个“停止”“暂停”或“继续”请求的时候
,应该首先检查服务是否已经在处理另外的一个请求,如果是,就依情况而定:是
不调用SetServiceStatus直接返回还是暂时忍耐直到前一个请求动作完成再调用
SetServiceStatus,这是你作为一个开发者要自己决定的。

  如果说前面的问题已经足够麻烦了,下面的问题会令你觉得更加怪异。它其实
是一种可以解决上面的问题的方法:当CtrlHandler函数的线程收到
SERVICE_PAUSE_PENDING请求之后,它调用SetServiceStatus报告服务正在暂停,
然后由它自己调用SuspendThread来暂停服务的线程,然后再由它自己调用
SetServiceStatus报告服务已经被暂停。这样做的确避免了“竞争条件”的出现,
因为所有的工作都是由一个函数来做的。现在需要注意的不是“竞争条件”而是服
务本身,挂起服务的线程会不会暂停服务呢?答案是会的。但是暂停服务意味着什
么呢?

  假如我的服务是用来处理网络客户的请求,那么暂停对于我的服务来说应该是
停止接受新的请求。如果我现在正处在处理请求的过程中,那么我应该怎么办?也
许我应该结束它,使客户不至于无限期悬挂。但如果我只是简单的调用
SuspendThread,那么不排除服务线程正处于孤立的中间状态的可能,或者正在调
用malloc函数去尝试分配内存,如果运行在同一个进程中的另一个服务也调内存分
配函数,那么它也会被挂起,这肯定不是我期望的结果。

  还有一个问题:用户认为自己可以被允许去停止一个已经被暂停了的服务吗?
我认为是这样的,而且很明显的,微软也这么认为。因为当我们在“服务”管理工
具里面选中一个已暂停的服务之后,“停止”按钮是可以被按下的。但我要怎样停
止一个由于线程被挂起才处于暂停状态的服务呢?不,不要TerminateThread,请
别跟我提起它。

  解决这所有的混乱的最好方法,就是有一个能够把所有事做好的线程,而且它
应该是服务线程,而不是CtrlHandler线程。当CtrlHandler函数得到控制代码之后
,它要迅速的将控制代码通过线程内部通讯手段送到服务线程中排队,然后
CtrlHandler函数就应该返回,它决不应该调SetServiceStatus。这样,服务可以
随心所欲的控制每件事情,因为没有什么比它更有发言权的了,没有“竞争条件”
。服务决定暂停意味着什么,服务能够允许自己在已经暂停的情况下停止,服务决
定什么内部通讯机制是最好的——并且CtrlHandler函数必须简单的与这种机制相
一致。

  事情没有完美的,上面的方法也不例外,它仅有一个小缺陷:就是假定当服务
收到控制代码后,在较短的时间内就能做出应有的响应。如果服务线程正在忙于处
理一个客户的请求,控制代码可能进入等待队列,而且SetServiceStatus可能也无
法迅速的被调用。如果真是这样的话,负责发送通知的SCP可能会认为你的服务已
经失败,并向用户报告一个消息框。事实上服务并没有失败,而且也不会被终止。


  这种情况够糟糕了,没有用户会去责怪SCP——虽然SCP将他们引导到了错误的
状态,他们只会责怪服务的作者——就是我或你...因此,在服务中怎么做才能防
止这种问题发生呢?很简单,使服务快速有效的运行,并且总保持一个活动线程等
待去处理控制代码。

  说起来好像很容易,但实际做起来就被那么简单了,这也不是我能够向各位解
释的了,只有认真的调试自己的服务,才能找出最为适合处理方法。所以我的文章
也真的到了该结束的时候了,感谢各位的浏览。如果我有什么地方说的不对,请不
吝赐教,谢谢。

  下面是我写的一个服务的源代码,没什么功能,只能启动、停止和安装。

#include
#include
#include
#include


#define SZAPPNAME "basicservice"
#define SZSERVICENAME "KService"
#define SZSERVICEDISPLAYNAME "KService"
#define SZDEPENDENCIES ""

void WINAPI KServiceMain(DWORD argc, LPTSTR * argv);
void InstallService(const char * szServiceName);
void LogEvent(LPCTSTR pFormat, ...);
void Start();
void Stop();


SERVICE_STATUS ssStatus;
SERVICE_STATUS_HANDLE sshStatusHandle;


int main(int argc, char * argv[])
{
if ((argc==2) && (::strcmp(argv[1]+1, "install")==0))
{
InstallService("KService");
return 0;
}

SERVICE_TABLE_ENTRY service_table_entry[] =
{
{ "KService", KServiceMain },
{ NULL, NULL }
};
::StartServiceCtrlDispatcher(service_table_entry);
return 0;
}

void InstallService(const char * szServiceName)
{
SC_HANDLE handle = ::OpenSCManager(NULL, NULL, SC_MANAGER_ALL_ACCESS);
char szFilename[256];
::GetModuleFileName(NULL, szFilename, 255);
SC_HANDLE hService = ::CreateService(handle, szServiceName,
szServiceName, SERVICE_ALL_ACCESS, SERVICE_WIN32_OWN_PROCESS,
SERVICE_DEMAND_START, SERVICE_ERROR_IGNORE, szFilename, NULL,
NULL, NULL, NULL, NULL);
::CloseServiceHandle(hService);
::CloseServiceHandle(handle);
}

SERVICE_STATUS servicestatus;
SERVICE_STATUS_HANDLE servicestatushandle;

void WINAPI ServiceCtrlHandler(DWORD dwControl)
{
switch (dwControl)
{

//下面虽然添加了暂停、继续等请求的处理代码,但没有实际作用
//这是为什么呢?到了下面的KServiceMain函数里面就明白了...

case SERVICE_CONTROL_PAUSE:
servicestatus.dwCurrentState = SERVICE_PAUSE_PENDING;
// TODO: add code to set dwCheckPoint & dwWaitHint
// This value need to try a lot to confirm
// ...
::SetServiceStatus(servicestatushandle, &servicestatus);
// TODO: add code to pause the service
// not called in this service
// ...
servicestatus.dwCurrentState = SERVICE_PAUSED;
// TODO: add code to set dwCheckPoint & dwWaitHint to 0
break;

case SERVICE_CONTROL_CONTINUE:
servicestatus.dwCurrentState = SERVICE_CONTINUE_PENDING;
// TODO: add code to set dwCheckPoint & dwWaitHint
::SetServiceStatus(servicestatushandle, &servicestatus);
// TODO: add code to unpause the service
// not called in this service
// ...
servicestatus.dwCurrentState = SERVICE_RUNNING;
// TODO: add code to set dwCheckPoint & dwWaitHint to 0
break;

case SERVICE_CONTROL_STOP:
servicestatus.dwCurrentState = SERVICE_STOP_PENDING;
// TODO: add code to set dwCheckPoint & dwWaitHint
::SetServiceStatus(servicestatushandle, &servicestatus);
// TODO: add code to stop the service
Stop();
servicestatus.dwCurrentState = SERVICE_STOPPED;
// TODO: add code to set dwCheckPoint & dwWaitHint to 0
break;

case SERVICE_CONTROL_SHUTDOWN:
// TODO: add code for system shutdown
// as quick as possible
break;

case SERVICE_CONTROL_INTERROGATE:
// TODO: add code to set the service status
// ...
servicestatus.dwCurrentState = SERVICE_RUNNING;
break;
}
::SetServiceStatus(servicestatushandle, &servicestatus);
}

void WINAPI KServiceMain(DWORD argc, LPTSTR * argv)
{
servicestatus.dwServiceType = SERVICE_WIN32;
servicestatus.dwCurrentState = SERVICE_START_PENDING;
servicestatus.dwControlsAccepted = SERVICE_ACCEPT_STOP;//上面的问题的答
案就在这里
servicestatus.dwWin32ExitCode = 0;
servicestatus.dwServiceSpecificExitCode = 0;
servicestatus.dwCheckPoint = 0;
servicestatus.dwWaitHint = 0;

servicestatushandle =
::RegisterServiceCtrlHandler("KService", ServiceCtrlHandler);
if (servicestatushandle == (SERVICE_STATUS_HANDLE)0)
{
return;
}

bool bInitialized = false;
// Initialize the service
// ...
Start();

bInitialized = true;

servicestatus.dwCheckPoint = 0;
servicestatus.dwWaitHint = 0;
if (!bInitialized)
{
servicestatus.dwCurrentState = SERVICE_STOPPED;
servicestatus.dwWin32ExitCode = ERROR_SERVICE_SPECIFIC_ERROR;
servicestatus.dwServiceSpecificExitCode = 1;
}
else
{
servicestatus.dwCurrentState = SERVICE_RUNNING;
}
::SetServiceStatus(servicestatushandle, &servicestatus);
return;
}


void Start()
{
LogEvent("Service Starting...");
}

void LogEvent(LPCTSTR pFormat, ...)
{
TCHAR chMsg[256];
HANDLE hEventSource;
LPTSTR lpszStrings[1];
va_list pArg;

va_start(pArg, pFormat);
_vstprintf(chMsg, pFormat, pArg);
va_end(pArg);

lpszStrings[0] = chMsg;

if (1)
{
// Get a handle to use with ReportEvent().
hEventSource = RegisterEventSource(NULL, "KService");
if (hEventSource != NULL)
{
// Write to event log.
ReportEvent(hEventSource, EVENTLOG_INFORMATION_TYPE, 0, 0, NULL, 1, 0,
(LPCTSTR*) &lpszStrings[0], NULL);
DeregisterEventSource(hEventSource);
}
}
else
{
// As we are not running as a service, just write the error to the
console.
_putts(chMsg);
}
}

void Stop()
{
LogEvent("Service Stoped.");
}

本文测试环境为Win2000 Server + SP2
Athlon XP 1700 + 256MB DDR
全部资料参考自MSDN OCT 2001

--

※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 61.144.235.39]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店