вопрос по XMLHTTPRequest | Форум Mozilla Россия

>Форум Mozilla Россия
   http://forum.mozilla-russia.org/index.php
>Разработка
   http://forum.mozilla-russia.org/viewforum.php?id=18
>вопрос по XMLHTTPRequest
   http://forum.mozilla-russia.org/viewtopic.php?id=52921

rafael > 20-12-2011 12:23:31

Возник вопрос по XMLHTTPRequest. Хочу сделать запрос на этот сайтhttp://www.google.com/adplanner/static/top1000/ и далее хочу сделать сравнение текущего URL адреса и тех адресов что на этом сайте. Как мне реализовать этот сравнение? Как URL адреса с этого сайта преобразовать чтобы их можно было сравнивать с текущим? Организовать массив?
Приведите хотя бы примерный скрипт или дайте ссылку на полезную инфу.

Lynn > 20-12-2011 12:28:34

Я вот так и не понял, как название темы соотносится с вопросом внутри?

rafael > 20-12-2011 12:45:55

Lynn пишет

Я вот так и не понял, как название темы соотносится с вопросом внутри?

Как мне сделать запрос так чтобы получить содержимое сайта, а именно URL адреса, чтобы их сравнивать с текущим адресом?

20-12-2011 13:05:57
вернее мне нужно содержимое страницы

arka > 20-12-2011 23:42:04

Видимо, Вам ещё рано учить наизусть такие сложные сочетание латинских букв. Сначала поизучайте, что такое URL, чем он отличается от контента, etc...

rafael > 21-12-2011 13:01:09

arka пишет

Видимо, Вам ещё рано учить наизусть такие сложные сочетание латинских букв. Сначала поизучайте, что такое URL, чем он отличается от контента, etc...

Прекрасно знаю что такое URL и чем он отличается от контента. Повторюсь что мне надо получить с этой страничкиhttp://www.google.com/adplanner/static/top1000/
URL адреса которые там содержатся. Каким способом их вытащить оттуда?

hydrolizer > 22-12-2011 03:16:27

rafael
Если именно черех XMLHttpRequest - то можно так:

Выделить код

Код:

var xhr=new XMLHttpRequest();
xhr.onload=function()
{
  let dom = this.responseXML;
  let urlNodes = dom.evaluate("//table[@id='data-table']//a[img]", dom, null, XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE, null);
  let urls=[];
  for(var i=0; i<urlNodes.snapshotLength; i++)
    urls.push(urlNodes.snapshotItem(i).href);
}
xhr.open("GET", "http://www.google.com/adplanner/static/top1000/");
xhr.responseType="document";
xhr.send(null);

Нюансы: 1) запрос - только асинхронный, в синхронных запросах парсинг HTML в DOM не поддерживается; 2) согласно вот этому, работать будет только в FF11.0 и выше; в IE/chrome/opera данная фича также пока не реализована.
Если такой вариант не устраивает - остается обычным образом получить контент в виде текста, и парсить его регэкспами.
Есть еще один вариант - грузить документ в скрытый iframe, после загрузки вытаскивать нужные вам ссылки с помощью XPath так же, как в вышеприведенном коде.