Klausimai, pažymėti „levenshtein-distance“

Metrika, skirta matuoti skirtumą tarp dviejų sekų.
10
atsakymai

Artimiausių atitikmenų eilutės

Turiu būdą palyginti kelias eilutes su bandymo linija ir grąžinti liniją, kuri yra labai panaši į ją: BANDYMO STRING: RED COW JUMPED, SKIRTAS ŽALIOJE VIETOS BŪDU B: ..
gegužės 02 d. 11 val
5
atsakymai

Kokį algoritmą rašo rašybos tikrintojas?

Kokį algoritmą paprastai naudojate įvedant rašybos tikrinimą, prie kurio pridedami žodžiai? Iš pradžių aš maniau, kad tikslinga patikrinti kiekvieną naują įvestą žodį (jei jis nerastas žodyne) Levenshtein atstumu nuo kiekvieno ...
nustatyti 19 Vas '10, 11:31
7
atsakymai

„Levenshtein“ atstumas T-SQL

Mane domina T-SQL algoritmas, kuris apskaičiuoja Levenshteino atstumą.
vasario 18 d '09 14:38
2
atsakymai

Fuzzy eilutės palyginimas Pythone, supainiotas su kokia biblioteka naudoti

Aš noriu padaryti fuzzy eilutės palyginimą, bet aš suprantu, kurią biblioteką naudoti. 1 variantas: importuoti „Levenshtein Levenshtein.ratio“ („sveikas pasaulis“, „sveikas“) Rezultatas: 0,625 2 variantas: importuoti diflib difflib.SequenceMatcher (Nėra, „sveikas pasaulis“, h ...
yra nustatytas liepos 14 d. 11 val
7
atsakymai

Kaip apskaičiuoti 2 linijų atstumo panašumo matą?

Turiu apskaičiuoti panašumą tarp dviejų eilučių. Taigi, ką tiksliai turiu galvoje? Leiskite man paaiškinti pavyzdžiu: Dabartinis žodis: ligoninė Klaidos žodis: haspita Dabar mano tikslas yra nustatyti, kiek simbolių man reikia keisti klaidingą ...
nustatyti 26 vas '12, 5:05 val
4
atsakymai

Levenshtein atstumas VBA

Turiu „Excel“ lapą su duomenimis, kuriuos noriu pasiekti. Aš jau bandžiau eksportuoti kaip tekstą, skaityti iš scenarijaus (php), paleisti „Levenshtein“ (apskaičiuoti „Levenshtein“ atstumą), išsaugoti jį, kad galėtumėte dar kartą. Bet aš ieškau būdų ...
lapkričio 22 d. '10, 9:58
7
atsakymai

Rūšiuoti masyvą pagal „Levenshtein atstumą“ su geriausiais „Javascript“ rezultatais

Taigi, turiu atsitiktinį „JavaScript“ pavadinimų asortimentą ... [@larry, @nicholas, @notch] ir tt Jie visi prasideda simboliu @. Norėčiau surūšiuoti juos pagal Levenshtein atstumą, kad tie, kurie buvo sąrašo viršuje, būtų arčiausiai paieškos ...
nustatyti 12 d. '12 4:37
10
atsakymai

„Levenshtein“ atstumo realizavimas „MySQL“ / „fuzzy“ paieškai?

Norėčiau sugebėti ieškoti lentelės taip, kaip ir pusbrolis, kaip gauti viską per 1 dispersiją. Duomenys: O'Brien Smithe Dolan Smuth Wong Smoth Gunther Smiht Aš tyrinėjau Levenshteino atstumo naudojimą, ar kas nors žino ...
nustatyti kovo 11 d
1
atsakymas

Skirtumas tarp atstumo tarp Yaro-Winkler ir Levenshteyn?

Turiu naudojimo atvejį, kai man reikia atlikti milžinišką milijonų įrašų iš kelių failų išdėstymą. Tam aš identifikavau du algoritmus: Yaro-Winkler atstumą ir Levenshteino atstumą. Kai pradėjau studijuoti abu, negalėjau suprasti, kad ...
nustatyti 28 rug. '14, 7:10
6
atsakymai

„Python“ panašumo metrikos

Noriu rasti eilutės panašumą tarp dviejų eilučių. Šiame puslapyje yra keletas jų pavyzdžių. „Python“ įgyvendina Levenshteino algoritmą. Ar pagal šiuos apribojimus yra geresnis algoritmas (ir, tikiuosi, pythono biblioteka). Nenoriu nieko daryti ...
nustatytas 24 sep. '09 14:43
11
atsakymai

Įdiegus paprastą „Levenshtein“ - „Java“ atstumo apskaičiavimo metodą

UPDATE 3 Atlikta. Žemiau yra kodas, kuris galiausiai praėjo visus mano testus. Vėlgi, tai modeliuojama po to, kai Murilo Vasconcelo pakeičia Steve Khanov algoritmo versiją. Ačiū visiems, kurie padėjo! / ** * Apskaičiuoja minimalų Levenshtein Distanc ...
nustatyti 02 vas '11 2:01
6
atsakymai

Kaip palyginti beveik panašias eilutes Java? (Išmatuotas eilutės ilgis)

Norėčiau palyginti dvi eilutes ir gauti jų panašumo įverčius. Pavyzdžiui, „Pasiūlymas yra beveik panašus“ ir „Pasiūlymas yra panašus“. Nesu susipažinęs su esamais „Java“ metodais, bet PHP žinau „levenshtein“ funkciją. Ar yra geresnių būdų java?
nustatytas sausio 18 d '10, 11:38
1
atsakymas

Hammingas ir Levenshteino atstumas

Dėl problemos, kurią dirbau, suraskite atstumus tarp dviejų sekų, kad nustatytumėte jų panašumą, sekos tvarka yra labai svarbi. Tačiau sekos, kurių aš neturiu, yra tokio pat ilgio, todėl aš ...
nustatytas sausio 04 d '11 0:29
2
atsakymai

Palyginkite panašumo algoritmus

Noriu naudoti eilutės panašumo funkcijas ieškant sugadintų duomenų savo duomenų bazėje. Aš atėjau per daugelį iš jų: Yaro, Yaro-Winkler, Levenshtein, Euclid ir Q-gramus, norėjau sužinoti, koks jų skirtumas ir kokiose situacijose jie dirba ...
yra nustatytas kovo 23 d., 12 val
4
atsakymai

Ar Levenshteino atstumo algoritmas yra geresnis nei O (n * m)?

Aš ieškojau pažangaus levenshtein atstumo algoritmo, o geriausias, kurį iki šiol radau, yra O (n * m), kur n ir m yra dviejų eilučių ilgiai. Priežastis, kodėl algoritmas yra tokioje skalėje, yra erdvė, o ne laikas, sukuriant dviejų eilučių matricą.
nustatyti 30 okt. '10, 9:17