Возник вопрос по XMLHTTPRequest. Хочу сделать запрос на этот сайтhttp://www.google.com/adplanner/static/top1000/  и далее хочу сделать сравнение текущего URL адреса и тех адресов что на этом сайте. Как мне реализовать этот сравнение? Как URL адреса с этого сайта преобразовать чтобы их можно было сравнивать с текущим? Организовать массив?
Приведите хотя бы примерный скрипт или дайте ссылку на полезную инфу.

Я вот так и не понял, как название темы соотносится с вопросом внутри?

Lynn пишет

Я вот так и не понял, как название темы соотносится с вопросом внутри?

Как мне сделать запрос так чтобы получить содержимое сайта, а именно URL адреса, чтобы их сравнивать с текущим адресом?

20-12-2011 13:05:57
вернее мне нужно содержимое страницы

Видимо, Вам ещё рано учить наизусть такие сложные сочетание латинских букв. Сначала поизучайте, что такое URL, чем он отличается от контента, etc...

arka пишет

Видимо, Вам ещё рано учить наизусть такие сложные сочетание латинских букв. Сначала поизучайте, что такое URL, чем он отличается от контента, etc...

Прекрасно знаю что такое URL и чем он отличается от контента. Повторюсь что мне надо получить с этой страничкиhttp://www.google.com/adplanner/static/top1000/
URL адреса которые там содержатся. Каким способом их вытащить оттуда?

rafael
Если именно черех XMLHttpRequest - то можно так:

Выделить код

Код:

var xhr=new XMLHttpRequest();
xhr.onload=function()
{
  let dom = this.responseXML;
  let urlNodes = dom.evaluate("//table[@id='data-table']//a[img]", dom, null, XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE, null);
  let urls=[];
  for(var i=0; i<urlNodes.snapshotLength; i++)
    urls.push(urlNodes.snapshotItem(i).href);
}
xhr.open("GET", "http://www.google.com/adplanner/static/top1000/");
xhr.responseType="document";
xhr.send(null);

Нюансы: 1) запрос - только асинхронный, в синхронных запросах парсинг HTML в DOM не поддерживается; 2) согласно вот этому, работать будет только в FF11.0 и выше; в IE/chrome/opera данная фича также пока не реализована.
Если такой вариант не устраивает - остается обычным образом получить контент в виде текста, и парсить его регэкспами.
Есть еще один вариант - грузить документ в скрытый iframe, после загрузки вытаскивать нужные вам ссылки с помощью XPath так же, как в вышеприведенном коде.