Klausimai pažymėti „html-parsing“

HTML analizavimas yra HTML dokumento serializavimo procesas ir požiūrio kūrimas, kurį galite dirbti su programiniu būdu, pavyzdžiui, iš duomenų ištraukimo. HTML specifikacija apibrėžia standartinį HTML analizės algoritmą, kuris yra įdiegtas visose pagrindinėse naršyklėse.
29
atsakymai

Kaip analizuoti ir apdoroti HTML / XML PHP?

Kaip galite išanalizuoti HTML / XML ir ištraukti informaciją iš jo?
nustatyti 26 rug. '10, 20:17
40
atsakymai

HTML valymo parinktys?

Aš galvoju bandyti „Beautiful Soup“, „Python“ paketą HTML valymui. Ar yra kitų HTML failų, kuriuos reikia valyti? „Python“ nėra reikalavimas, man labai įdomu sužinoti apie kitas kalbas. Kol kas istorija: ...
nustatyti rugpjūčio 06 d '08 0:09
8
atsakymai

HTML eilutės analizavimas su JS

Aš ieškojau sprendimo, bet nieko nėra reikšminga, todėl čia yra mano problema: noriu analizuoti eilutę, kurioje yra HTML tekstas. Noriu tai padaryti javascript'e. Bandžiau šią biblioteką, bet atrodo, kad ji analizuoja dabartinio puslapio HTML, o ne iš ...
gegužės 14 d., 12 val
18
atsakymai

Reguliarių išraiškų naudojimas HTML analizavimui: kodėl gi ne?

Atrodo, kad kiekvienas „stackoverflow“ klausimas, kuriame apgavikas naudoja regex, kad gautų tam tikrą informaciją iš HTML, neišvengiamai turi „atsakymą“, kuris sako, kad nenaudoja reguliarios išraiškos HTML analizavimui. Kodėl gi ne? Aš žinau, h ...
nustatyti 26 vas '09 17:24
0
atsakymai

Patikimas ir brandus HTML analizatorius

Ar yra patikimų ir brandžių HTML PHP analizatorių? Greitas „PEAR“ vaizdas nepadėjo (nemažai klasių, skirtų HTML kūrimui, ne tiek daug vartoti), ir „Google“ man išmokė, kad daugelis žmonių pradėjo ir vėliau atsisakė įvairių analizatorių projektų ...
lapkričio 15 d. '08 10:09 val
7
atsakymai

HTML analizė naudojant „Python“

Aš ieškau HTML Parser modulio, skirto Python, kuris gali man padėti gauti žymas sąrašų / žodynų / Python objektų pavidalu. Jei turiu formos dokumentą: <html> <head> Heading </ head> <body attr1 = 'val1'> <div class = 'yra ...
yra nustatytas liepos 29 d. 12 val
21
atsakymas

Kaip išgauti img src, titulą ir alt iš html naudojant php?

Norėčiau sukurti puslapį, kuriame visi mano svetainėje esantys vaizdai pateikiami su pavadinimu ir alternatyviu vaizdu. Aš jau parašiau nedidelę programą, kad galėtumėte ieškoti ir atsisiųsti visus HTML failus, bet dabar esu įstrigo, kaip ...
rugsėjo 26 d '08 11:33
4
atsakymai

„JavaScript“: kaip pašalinti HTML žymes iš eilutės?

Galimas dublikatas: HTML juostelė iš teksto JavaScript Kaip pašalinti HTML iš „JavaScript“ eilutės?
15 Vasario mėn. '11 12:56
14
atsakymai

„Regex“ pasirenka visą tekstą tarp žymių.

Koks yra geriausias būdas pasirinkti visą tekstą tarp dviejų žymių - pavyzdžiui: tekstas tarp visų „etiketės“ ​​puslapyje.
nustatytas rugpjūčio 23 d '11 23:42
5
atsakymai

Kaip HTML analizuoja darbą, jei jie nenaudoja regexp?

Kiekvieną dieną matau klausimus apie tai, kaip analizuoti ar išgauti kažką iš tam tikros HTML eilutės, o pirmasis atsakymas / komentaras visada yra „Nenaudokite„ RegEx, kad analizuotumėte HTML “, kad nesijaustumėte piktas! (paskutinė dalis kartais praleidžiama). Jis ...
nustatykite kovo 10 d. 13.30 val
8
atsakymai

Kaip normalizuoti HTML JavaScript ar jQuery?

Žymės gali turėti kelis atributus. Atributų kodo tvarka nėra reikšminga. Pavyzdžiui: <a href="#" title="#"> <a title="#" href="#"> Kaip galiu „normalizuoti“ HTML „Javascript“, todėl atributų tvarka ...
nustatyti 20 okt. '10, 7:19
6
atsakymai

Kaip analizuoti HTML puslapį naudojant „Node.js“

Turiu analizuoti (serverio pusėje) daug HTML puslapių. Visi sutinkame, kad regexp čia nėra. Man atrodo, kad javascript yra gimtoji būdas analizuoti HTML puslapį, tačiau ši prielaida priklauso nuo kodo, esančio šone.
nustatyti 10 sept. '11 19:18
29
atsakymai

Ar galite pateikti HTML analizės pavyzdžius?

Kaip analizuoti HTML su skirtingomis kalbomis ir analizuoti bibliotekas? Atsakydami: atskiri komentarai bus susieti su atsakymais į klausimus apie tai, kaip analizuoti HTML su reguliariomis išraiškomis, kad būtų rodomas teisingas būdas tai padaryti ...
nustatytas balandžio 21 d '09 18:55
8
atsakymai

Kaip išskirti eilutę po modelio naudojant GREP, REGEX arba PERL

Turiu tokį failą: <table name = "content_analyzer" pirminis-key = "id"> <type = "global" /> </ table> <table name = "content_analyzer2" pirminis raktas = "id "> <type =" global "/> </ table> <skirtukas ...
nustatytas vasario 22 d '11 19:34
0
atsakymai

Kaip analizuoti HTML naudojant PHP?

Galimas dublikatas: Kaip apdoroti ir apdoroti HTML su PHP? Siūloma nuoroda į klausimą. Kasdien pasirodo dešimtys klausimų „Kaip išardyti HTML“. Tačiau labai sunku uždaryti kaip dublikatą, ...
nustatyti 06 rugsėjis '10, 11:51