上一篇:获取含跨域网址的框架网页的源码
下一篇:Delphi的WebBrowser改造,对网页中Alter等对话框的改造方法(转载)

使用WebBrowser控件获取含框架的网页的完整HTML代码

发布于: 2012/12/15 14:38:32   |  发布在: Delphi文章   |  点击:

使用WebBrowser控件获取网页源码的方法,网上有很多介绍,但绝大多数的人都是使用以下的方法获取:

(WebBrowser1.Document as IHtmlDocument2).body.outerHtml;

我以前也是这么用的,这种方法的美中不足就是只能获取网页<body>与</body>之间的网页源码,而<body>之外如<head>部分的网页源码就获取不到了,本人在网上搜了很久,终于找到解决方法。好的东西不敢独享,现将这种方法共享出来:

procedure TForm1.Button1Click(Sender: TObject);
var
  ole_index, oleObj: OleVariant;
  i: integer;
begin
  if WebBrowser1.Busy then Exit;  //网页加载中,退出。
  Memo1.Lines.Clear;
  //获取主框架网址及网页源码
  Memo1.Lines.Add(WebBrowser1.OleObject.document.url);
  Memo1.Lines.Add(WebBrowser1.OleObject.document.documentElement.outerHTML);
  Memo1.Lines.Add(' '); Memo1.Lines.Add(' '); //添加空行
  //循环获取每一个子框架网址及网页源码
  for i := 0 to WebBrowser1.OleObject.document.frames.length - 1 do
  begin
    ole_index := i;
    oleObj := WebBrowser1.OleObject.document.frames.item(ole_index);
    Memo1.Lines.Add(oleObj.document.url);
    Memo1.Lines.Add(oleObj.document.documentElement.outerHtml);
    Memo1.Lines.Add(' '); Memo1.Lines.Add(' '); //添加空行
  end;
end;

TWebBrowser网页