Kako Napraviti Parser

Sadržaj:

Kako Napraviti Parser
Kako Napraviti Parser

Video: Kako Napraviti Parser

Video: Kako Napraviti Parser
Video: КАК СДЕЛАТЬ ПАРСЕР | PYTHON 2024, Maj
Anonim

Raščlanjivanje je jedna od široko korištenih tehnika u programiranju web stranica. To vam lako i jednostavno omogućava da putem malog broja naredbi dobijete potrebnu uslugu do web lokacije, kada ne postoji mogućnost da sami napišete potrebnu skriptu.

Kako napraviti parser
Kako napraviti parser

Instrukcije

Korak 1

Najjednostavniji način raščlanjivanja je pomoću PHP funkcije file_get_contents (). Omogućava vam da sadržaj datoteke dobijete kao tekstualni niz. Funkcija koristi algoritam "mapiranje memorije", koji poboljšava njegove performanse.

Korak 2

Na primjer, da biste napisali skriptu koja raščlanjuje podatke s web stranice Centralne banke Ruske Federacije, morate dobiti sadržaj XML stranice pomoću odgovarajuće funkcije, prethodno definirajući datum u formatu koji odgovara web lokaciji, a zatim pomoću regularnih izraza da ga podijeli. Za prikaz odabrane valute koristi se kod dobijen na web lokaciji Banke: $ data = date (“d / m / Y”); $ get = file_get_contents (https://www.cbr.ru/scripts/XML_daily.asp ? date_req = $ podaci); preg_match (“/(.*?)/ is”, $ get, $ string); preg_match (“/(.*?)/ is”, $ string [1], $ str);

Korak 3

Ako želite raščlaniti samu XML datoteku, za to postoje i odgovarajuće funkcije. Da biste pokrenuli parser, morate ga inicijalizirati koristeći xml_parser_create: $ parser = xml_parser_create ();

Korak 4

Tada se navodi lista funkcija koje će obrađivati odgovarajuće oznake i tekstualne informacije. Postavljeni su odgovarajući obrađivači početka i kraja XML elementa: xml_set_element_handler ($ parser, “startElement”, “endElement”);

Korak 5

Podaci se mogu čitati pomoću standardnih funkcija fopen () i fgets () unutar odgovarajuće petlje. Sadržaj datoteka vraća se red po red u xml_parse (). Posljednji parametar sadrži zastavu čitanja posljednjeg retka: while ($ content = fgets ($ fparse)) {

if (! xml_parse ($ parser, $ content, feof ($ fparse)))) {

odjek „Greška“;

break; }}

Korak 6

Funkcija xml_parser_free () koristi se za oslobađanje resursa koje sistem zauzima. Ove funkcije su najsnažnije prilikom obrade XML datoteka.

Preporučuje se: