Klausimai pažymėti kaip „panašumas“

Panašumo priemonės nustato identiškų objektų skaičių (pavyzdžiui, dokumentus, objektų vektorius).
4
atsakymai

Kosino panašumas prieš Hammingo atstumą

Norėdami apskaičiuoti dviejų dokumentų panašumą, sukuriu funkcijų vektorių, turinčio dažnių terminus. Bet tada kitą žingsnį negaliu nuspręsti tarp „kosino panašumo“ ir Hammingo nuotolio. Mano klausimas: ar turite patirties su šiuo klausimu?
birželio 03 d., 09:29
6
atsakymai

Raskite dviejų masyvų kosino panašumą

Įdomu, ar R yra integruota funkcija, kuri gali rasti kosininį panašumą (arba kosininį atstumą) tarp dviejų masyvų? Šiuo metu įgyvendinau savo funkciją, bet negaliu padėti, bet manau, kad R jau turėtų būti su juo.
nustatytas kovo 29 d. 10 val
7
atsakymai

gauti dvigubą panašumą tarp dviejų dokumentų lucene

„Lucene“ sukūriau indeksą. Noriu, nenurodydamas užklausos, gauti tik sąmatą (kosino panašumą ar kitą atstumą?) Tarp dviejų indekso dokumentų. Pavyzdžiui, gaunu iš anksčiau atidaryto „IndexReader“ ir dokumentus su identifikatoriais 2 ir 4. D ...
nustatyti 04 gruodis '09 3:58
2
atsakymai

Panašus nltk modulio metodas suteikia skirtingus rezultatus skirtingose ​​mašinose. Kodėl?

Mokiau keletą įvadinių klasių teksto gavybai naudojant „Python“, o klasė bandė panašų metodą su pateiktais praktiniais tekstais. Kai kurie studentai gavo skirtingus rezultatus tekstui1.similar () nei kiti.
lapkričio 6 d. '15, 5:57
5
atsakymai

Kaip rasti panašų žodį php su klaida?

Aš paaiškinsiu savo problemą: turiu duomenų bazės lentelę, pavadintą „šalis“. Jame yra du stulpeliai: ID ir pavadinimas. Kai noriu ieškoti „paris“, bet klaidingai parašiau žodį: „pares“ („e“ vietoj „i“), iš duomenų bazės negausiu jokių rezultatų. Noriu ...
15 val. '10, 9:35
5
atsakymai

Teksto panašumo algoritmas

Turiu du subtitrų failus. Man reikia funkcijos, kuri pasakoja, ar jie atitinka tą patį tekstą ar panašų tekstą, o kartais yra komentarų, pvz., „Vėjas pučia ... muziką groja“ tik viename faile. Tačiau 80% bus vienas ...
nustatyti 24 vas '10, 14:34
7
atsakymai

Žodžio palyginimo algoritmas

Aš naudoju CSV importavimo įrankį projektui, kuriame dirbau. Klientas turi turėti galimybę įvesti duomenis į „Excel“, eksportuoti jį kaip CSV ir įkelti į duomenų bazę. Pavyzdžiui, turiu šį CSV įrašą: 1, John Doe, ACME Comap ...
nustatytas sausio 23 d '09 19:22
6
atsakymai

Koks yra geriausias algoritmas, skirtas suderinti dvi eilutes, kuriose yra mažiau nei 10 žodžių lotyniškame rašte

Palyginu dainų pavadinimus naudojant lotynišką scenarijų (nors ne visada), mano tikslas yra algoritmas, kuris duoda aukštą rezultatą, jei du dainų pavadinimai yra vienodi, ir labai mažas rezultatas, jei jie neturi nieko bendro. Dabar aš jau atėjau ...
lapkričio 28 d '14, 18:55
2
atsakymai

Gera mysql užklausa rasti panašias vertes viename stulpelyje

Turiu pasikartojančius įrašus, kurie yra labai panašūs, bet ne tikslūs. Štai keletas pavyzdžių: - 2016: Obama America - 2016: Obama America (VF) - Hurt Locker - The Hurt Locker Koks bus klausimas, kurį galėčiau naudoti norint gauti potencialą ...
nustatyti 12 vas '13, 23:58
3
atsakymai

Įvairaus ilgio vektorių panašumo kosinas?

Bandau naudoti TF-IDF rūšiuoti dokumentus į kategorijas. Kai kuriems dokumentams apskaičiuojau tf_idf, bet dabar, kai bandau apskaičiuoti dviejų šių dokumentų Cosine panašumą, gaunu pėdsaką: #len (u) == 201, len (v) == 246 ...
birželio 25 d., 23:27
2
atsakymai

„Javascript“ teksto panašumo algoritmas

Sukuriu svetainę, kurioje turėtų būti renkami įvairūs naujienų kanalai, ir norėčiau, kad tekstai būtų panašūs. Man reikia naujienų teksto sintezės algoritmo. Žinau, kad php turi panašią teksto funkciją ir nesu įsitikinęs, kiek jis yra ...
vasario 18 d '11, 18:03
1
atsakymas

Kaip normalizuoti „Levenshtein“ atstumą, kad ilgis būtų maksimalus, o ne eilutės ilgis?

Problema: Levenshtein atstumo realizatoriai yra įgyvendinami keliuose R paketuose, kad būtų galima apskaičiuoti dviejų stygų panašumą. http://finzi.psych.upenn.edu/R/library/RecordLinkage/html/strcmp.html. Apskaičiuoti skaičiavimai gali būti lengvai normalizuojami ...
nustatytas balandžio 13 d '12 15:34
2
atsakymai

Kaip rasti dvigubas eilutes dviem skirtingais failais? Unix

Iš UNIX terminalo galime naudoti diff file1 file2, kad rastume skirtumą tarp dviejų failų. Ar yra panaši komanda, rodanti dviejų failų panašumus? (jei reikia, leidžiama naudoti daug vamzdžių. Kiekviename faile yra st ...
nustatyti kovo 18 d., 13 val
2
atsakymai

Kaip apskaičiuoti dviejų brėžinių vaizdų panašumą greitai

Turime palyginti du ranka pieštus vaizdus. Šie vaizdai sudaromi iš spritų rinkinio. Turime pamatyti, ar šios nuotraukos tinka, ar ne. Pavyzdžiui, jei kas nors atkreipia nuotrauką su šypsena, turime patikrinti, ar vaizdas atrodo kaip ...
nustatytas rugpjūčio 19 d '15, 14:33
2
atsakymai

Simetrinio Kullab-Leibler skirtumo apskaičiavimas tarp dviejų dokumentų

Čia sekiau čia ir kode (jis įgyvendinamas naudojant simetrišką kld ir atvirkštinį modelį, pasiūlytą dokumente, esančiame 1-oje nuorodoje), kad būtų apskaičiuotas KLD tarp dviejų tekstų duomenų rinkinių. Grįžau į pabaigą, kai grįžau ...
vasario 18 d '16, 16:35