回 帖 发 新 帖 刷新版面

主题:求助!!delphi的一个简单问题,急急急!!!!!

将一个htm文件转换成txt文件后,想提取其中的汉字,要怎么实现??
例如:
<br>
<center>
<table width="93%" border="1" cellpadding="5" style="border-collapse: collapse" cellspacing="0" bordercolor="#EFEFEF">
<tr>
<td colspan="2" width="501" bgcolor="#F7F7F7">
<h5 align="center">成语爱博而情不专详细说明</h5>
<p align="center">成语:<font color="#FF0000">爱博而情不专</font> 拼音:<font color="#FF0000">ài  bó  ér  qíng  bù  zhuān</font> 搜索关键字:<font color="#FF0000">abez</font></td>
</tr>
<tr>
<td width="68" valign="top" align="right" bgcolor="#F7F7F7">
成语解释:</td>
<td width="422">
对人或事物的喜爱很广泛,而感情不能专一。</td>
</tr>
<tr>
<td width="68" valign="top" align="right" bgcolor="#F7F7F7">
成语出处:</td>
<td width="422">
唐·韩愈《与陈给事书》:“夫位益尊则贱者日隔,伺候于门墙者日益进,则爱博而情不专。”</td>
</tr>


想提取:【爱博而情不专】ài  bó  ér  qíng  bù  zhuān⊙abez〖释〗对人或事物的喜爱很广泛,而感情不能专一。〖源唐·韩愈《与陈给事书》:“夫位益尊则贱者日隔,伺候于门墙者日益进,则爱博而情不专。”

望各位大侠帮帮忙!!!!

回复列表 (共2个回复)

沙发

使用IHTMLDocument2:
这是BCB的几句。


IHTMLDocument2 *ihd2;
这是BCB的几句。
CComPtr<IHTMLElement> ihe;
//SendMessage(hie, WM_CONTROL, 0,0);
//SendMessage(Hie, WM_KEYDOWN, "A", 0);
//if (MyGetHTMLDocInterface(hie))
//{//ShowMessage("Found IHTMLDocument2!") ;//成功
//ihd2=MyGetHTMLDocInterface(hie);}

     CoInitialize(NULL);
     HINSTANCE hInst = LoadLibrary("OLEACC.DLL");

     UINT nMsg = RegisterWindowMessage("WM_HTML_GETOBJECT");
     //SendMessageTimeout(hie01, nMsg, 0L, 0L, SMTO_ABORTIFHUNG,10000, &dwRes);
     SendMessageTimeout(hie, nMsg, 0L, 0L, SMTO_ABORTIFHUNG,100, &dwRes);

板凳

关注

我来回复

您尚未登录,请登录后再回复。点此登录或注册