Klausimai pažymėti „fuzzy-search“

Paieškos sistema, kurios tikslas yra rasti visus apytikslius, svarbius ar galbūt susijusius paieškos rakto rezultatus, o ne rasti tikslią atitikimą.
22
atsakymai

Geriausias panašumo reitingavimo algoritmas kintamųjų ilgių eilutėms

Aš ieškoju eilutės panašumo algoritmo, kuris suteikia geresnių rezultatų kintamojo ilgio stygoms, nei paprastai siūlomos (atstumas levenshtein, soundex ir kt.). Pavyzdžiui, „Nurodyta eilutė A“: „Robertas“, tada eilutė B: „Amy Robertson“ ...
nustatykite kovo 17 d. 09:10
8
atsakymai

„Fuzzy Java“ paieškos eilutė

Ieško aukštos kokybės java bibliotekos, kuri ieškotų fuzzy styginių. Yra daug panašių linijų paieškos algoritmų, „Levenshtein“ atstumo, „Daitch-Mokotoff Soundex“, „n-gramų“ ir kt. Kokios yra „Java“ diegimo galimybės? Privalumai ir trūkumai jiems ...
lapkričio 29 d. '08 4:17 val
8
atsakymai

Fuzzy žemėlapių sudarymas naudojant T-SQL

Turiu asmenų, turinčių asmens duomenis, lentelę ir pan. Yra daug stulpelių, tačiau čia domina: addressindex, pavardė ir vardas, kur addressindex yra unikalus adresas, nukreiptas iki buto durų. Todėl, jei turiu „kaip žemiau“, du žmonės ...
Nustatyta gegužės 28 d
5
atsakymai

„Fuzzy javascript“ paieška yra prasminga

Aš ieško javascript bibliotekos su fuzzy paieška filtruoti masyvą. Bandžiau naudoti „fuzzyset.js“ ir „fuse.js“, bet rezultatai yra baisūs (yra demo, kurį galite pabandyti susietuose puslapiuose). Po tam tikro skaitymo per atstumą Leven ...
nustatytas balandžio 26 d '14, 3:11
6
atsakymai

Fuzzy reguliarios išraiškos

Savo darbe su puikiais rezultatais naudoju apytikslius eilutės atitikimo algoritmus, pvz., „Damerau-Levenshtein“ atstumą, kad mano kodas būtų mažiau pažeidžiamas rašybos klaidų atžvilgiu. Dabar reikia suderinti paprastas eilutes ...
vasario 28 d '10, 19:08
5
atsakymai

„Typo“ istorija realiame pasaulyje?

Kur galiu rasti tikrą statistiką apie tipišką pasaulį? Bandau suderinti įvesties tekstą su vidiniais objektais, o žmonės linkę daryti rašybos klaidas. Yra 2 tipų klaidų: typos - "Helllo" vietoj "Hello" / "Satudray" vietoj "Sat ...
nustatyti rugpjūčio 06 d '10 - 0:38
6
atsakymai

Kaip padaryti, kad „MYSQL“ kompanijų pavadinimų „fuzzy“ atitikimas su PHP automatiniam užpildymui?

Mano naudotojai importuos per iškarpą ir įklijuos didelę eilutę, kurioje bus įmonės pavadinimai. Turiu esamą ir augančią MYSQL duomenų bazę, kurioje yra įmonės pavadinimai, kurių kiekvienas turi unikalų įmonės_id. Aš noriu ...
gruodžio 16 d '08 0:21
2
atsakymai

Fuzzy paieškos laukelio valdiklis su „Shiny“ R?

Ar kas nors sukūrė ar matė puikią programą su paieškos laukelio valdikliu, kuris pateikia kontekstinius pasiūlymus, kai rašote, remiantis fuzzy atitikmeniu? „Bloomberg“ naudoja jį, „Google“ ją naudoja. Vienas iš galimų pagrindinių ...
nustatyti liepos 5 d. 14 d. 22:15
5
atsakymai

Patikrinkite, ar „Python“ ilgesnėje eilutėje yra neskaidrus / apytikslis substratas?

Naudojant algoritmus, tokius kaip leveinstein (leveinstein arba difflib), lengva rasti apytikslius atitikmenis. >>> importuoti diflib >>> difflib.SequenceMatcher (Nėra, "nuostabi", "amaging"). santykis () 0.8571428571428571 Fuzzy rungtynės gali ...
nustatytas liepos 19 d., 13 val. 10:51
2
atsakymai

Geriausias fuzzy atitikimo algoritmas?

Koks yra geriausias „fuzzy“ atitikimo algoritmas („Fuzzy Logic“, „N-Gram“, „Levenstein“, „Soundex ...“), kad būtų galima apdoroti daugiau nei 100 000 įrašų per trumpesnį laiką?
nustatė sausio 29 d '09 13:33
2
atsakymai

Kaip sukurti paprastą „fuzzy“ paiešką tik naudojant „Postgresql“?

Turiu nedidelę problemą, susijusią su paieškos funkcija mano svetainėje pagal RoR. Turiu daug produts su KODU. Šis kodas gali būti bet kokia eilutė, pvz., „AB-123-lHdfj“. Dabar naudoju ILIKE operatorių, kad galėčiau ieškoti produktų: Product.where (...
nustatyti spalio 11 d. '11 20:29
4
atsakymai

Fuzzy tekstas (sakiniai / antraštės), atitinkantis C #

Ei, aš naudoju Levenshteins algoritmą, kad gautume atstumą tarp šaltinio ir tikslinės linijos. Aš taip pat turiu metodą, kuris grąžina vertę nuo 0 iki 1: /// <summary> /// Gauti dviejų stygų panašumą. /// Visų santykių sco ...
nustatyti 10 sept. '08 8:37
6
atsakymai

„Fuzzy Match“ styginių algoritmai

Fuzzy atitikmeniu, aš nesuprantu panašių linijų Levenshtein atstumu ar kažką panašaus, bet taip, kaip jis buvo naudojamas TextMate / Ido / Icicles: nurodant eilių sąrašą, suraskite tuos, kurie apima visus simbolius paieškos eilutėje, bet eikite į. ..
gegužės 23 d., 14 val
7
atsakymai

Kaip rasti geriausią eilutės fazių atitikimą didelėje eilučių duomenų bazėje

Turiu eilutės duomenų bazę (savavališką ilgį), kuriame yra daugiau nei milijonas elementų (galbūt daugiau). Turiu palyginti vartotojo pateiktą eilutę su visa duomenų baze ir gauti identišką eilutę, jei ji yra, arba ...
lapkričio 21 d. '08 8:02 val
1
atsakymas

Efektyvus styginių atitikimas „Apache Spark“

Naudojant OCR įrankį, ištraukiau tekstus iš ekrano nuotraukų (apie 1–5 sakinius). Tačiau, rankiniu būdu tikrinant išgauti tekstą, pastebėjau keletą klaidų, kurios kartais atsiranda. Atsižvelgiant į tekstą „Sveiki, 😊! Man labai patinka Spar ...
gegužės 12 d. 17 d. 16:14