Спасибо. Назрел еще вопрос:
Не могу спарсить xml
Вбиваю в адресную строку адрес:
http://mysite.com/cgi-bin/projects/wordnet...ry.pl?word=slut
и получаю такой результат:
<?xml version="1.0" ?>
- <synsets word="slut">
- <synset id="109153287" pos="n" gloss="a woman adulterer">
<word word="adulteress" />
<word word="fornicatress" />
<word word="hussy" />
<word word="jade" />
<word word="loose_woman" />
<word word="slut" />
<word word="strumpet" />
<word word="trollop" />
</synset>
</synsets>
Проблема в том, что последующей веткой Get + Web Brouser я не могу получить текст страницы (исходный и dom тексты также не удалось).
В чем у меня проблема? Ведь в других щаблонах мне удавалось спарсить хтмл страницы...
Вот шаблон если что:
Код:
<?xml version="1.0" encoding="utf-8"?>
<Project Name="Synonyms_parser.xml" ProxyFilter="" Flags="DLCTL_DLIMAGES, DLCTL_VIDEOS, DLCTL_BGSOUNDS, DLCTL_NO_SCRIPTS, DLCTL_NO_JAVA, DLCTL_NO_RUNACTIVEXCTLS, DLCTL_NO_DLACTIVEXCTLS, DLCTL_NO_FRAMES, CMD_ALLOWPOPUP" Version="3.0">
<Step ID="●4●1●6●1●4●2●" Type="Web" x="30" y="30">
<Branch ID="cca-5738" Type="WebBrowser" PictureIndex="" Action="Set" Name="CMD_CLEARCOOKIE" Comment="Очистка куков">
<Parameters />
<Results />
</Branch>
<Branch ID="nav-6497" Type="WebBrowser" PictureIndex="" Action="Set" Name="CMD_NAVIGATE" Comment="Переход на http://mysite.com/cgi-bin/projects/wordnet/query.pl?word=read">
<Parameters>
<Value>http://mysite.com/cgi-bin/projects/wordnet/query.pl?word=slut-|-page</Value>
</Parameters>
<Results />
</Branch>
<Branch ID="≡1≡2≡4≡0≡1≡8≡8≡0≡1≡5≡" Action="Get" Type="WebBrowser" PictureIndex="" Name="CMD_PAGE_TEXT" Comment="Парсим текст">
<Parameters>
<Finder>
<Document />
<Form />
<Element>
<TabPath>page</TabPath>
</Element>
</Finder>
<Value>page-|-</Value>
</Parameters>
<Results />
</Branch>
</Step>
</Project>