Klausimai, pažymėti „kosinuso panašumu“

Kosino panašumas yra dviejų produkto vidinės erdvės vektorių panašumo matas, kuris matuoja tarp jų esančio kampo kosinusą. Tai yra populiarus dviejų vektorių panašumo matas, nes jis apskaičiuojamas kaip normalizuotas taško produktas tarp dviejų vektorių, kuris gali būti apskaičiuojamas naudojant paprastas matematines operacijas.
9
atsakymai

Ar kas nors gali pateikti kosininio panašumo pavyzdį labai paprastu, grafiniu būdu?

Vikipedijos straipsnis apie kosino panašumus Ar galite rodyti vektorius čia (sąraše ar kitame) ir tada atlikti matematiką ir pamatyti, kaip jis veikia? Aš esu naujas.
lapkričio 17 d. '09, 7:03
3
atsakymai

Apskaičiuokite kosino panašumą su 2 sakinių eilutėmis

Iš Python: tf-idf-cosine: norėdami rasti dokumentų panašumą, galite apskaičiuoti dokumento panašumą naudojant tf-idf cosine. Ar be jokių išorinių bibliotekų importavimo būdų galima apskaičiuoti abiejų eilučių panašumą? s1 = "Tai yra ...
Nustatykite kovo 13 d. 13: 06
7
atsakymai

Koks yra greičiausias būdas „Python“ apskaičiuoti kosino panašumą naudojant retus matricos duomenis?

Atsižvelgiant į retų matricų sąrašą, koks yra geriausias būdas apskaičiuoti kosinijų panašumą tarp kiekvieno matricos stulpelio (ar eilučių)? Aš nenoriu eiti per n-select-du kartus. Tarkime, kad įvesties matrica: A = [0 1 0 0 1 0 0 1 1 1 1 1 1 1 0] ...
liepos 13 d., 13 val
9
atsakymai

2 sąrašų panašumo kosinas

Turiu apskaičiuoti kosino panašumą tarp dviejų sąrašų, pavyzdžiui, 1 sąrašą, kuris yra dataSetI ir 2 sąrašas, kuris yra dataSetII. Negaliu naudoti nieko, pvz., Numpy ar statistikos modulio. Turiu naudoti bendrus modulius (mate ...
nustatyti 25 rug. '13, 2:37
5
atsakymai

Kosino panašumas ir tf-idf

Ačiū už visą pagalbą, kurią anksčiau davėte. Turiu tik vieną nedidelį klausimą, kuris, man atrodo, sumišęs. TF-IDF ir kosino panašumas. Aš perskaičiau abu, o po to wiki pagal Cosinus. Manau, kad šis sakinys: „Ieškant ...
nustatytas birželio 06 d. 11 val. 20:36
3
atsakymai

Kozino atstumas kaip vektoriaus funkcija k-priemonėms

Turiu N viršūnių grafiką, kur kiekvienas viršūnė yra vieta. Aš taip pat turiu vektorių, po vieną kiekvienam vartotojui, kiekvieną iš N koeficientų, kur koeficiento vertė yra trukmė sekundėmis, praleistomis atitinkamame ...
nustatyti 07 rug '14 14:15 val
3
atsakymai

kosininis klasterizavimas

Turiu didelį duomenų rinkinį, kurį norėčiau nukopijuoti. Mano bandomojo bandymo dydis yra 2500 objektų; kai jį paleisiu „realiame sandoryje“, turėsiu apdoroti bent 20 tūkst. Šie objektai turi kosininius panašumus ...
birželio 22 d. 12 val
2
atsakymai

Ieškoti geriausio kosino panašumo vektorių rinkinyje

Turiu n vektorių, kurių kiekviename yra m elementai (tikrasis skaičius). Noriu surasti porą, kurioje kosminis panašumas yra didžiausias tarp visų porų. Paprastas sprendimas bus O (n 2 m). Ar yra geresnis sprendimas? Atnaujinama ...
01 gr. '12 19:39
2
atsakymai

Kaip efektyviai apskaičiuoti kosino panašumą tarp milijonų linijų

Turiu apskaičiuoti kosino panašumą tarp sąraše esančių eilučių. Pvz., Turiu daugiau nei 10 milijonų eilučių sąrašą, kiekviena eilutė turėtų nustatyti vienodus tarpusavio ir kiekvienos kitos eilutės sąrašus. Kas yra geriausias algoritmas, kurį aš ...
nustatytas vasario 23 d '13, 17:34
1
atsakymas

Kaip efektyviai apskaičiuoti dokumentų srautą dokumentų sraute

Renku tekstinius dokumentus (Node.js), kur vienas dokumentas i yra pateikiamas kaip žodžių sąrašas. Koks yra veiksmingas būdas apskaičiuoti šių dokumentų panašumus, atsižvelgiant į tai, kad nauji dokumentai veikia kaip dokumento srautas ...
nustatyti 21 d. '12 11:17
4
atsakymai

TF-IDF (kosino panašumo) derinimas su pagerank?

Atsižvelgiant į užklausą, turiu kosininį dokumento įvertinimą. Aš taip pat turiu „pagerank“ dokumentus. Ar yra standartinis geras būdas derinti šiuos du? Aš galvojau apie jų dauginimą Total_Score = cosine-score * pagerank Nes jei jūs ten pateksite ...
vasario 18 d '13, 19:12
1
atsakymas

word2vec, bendras ar vidutinis žodžių priedas?

Naudoju word2vec, kad atstovaučiau nedidelę frazę (nuo 3 iki 4 žodžių) kaip unikalų vektorių, arba pridedant kiekvieną atskirą žodį įterpiant, arba apskaičiuojant vidutinę žodio įterpimo vertę. Iš eksperimentų, kuriuos padariau ...
nustatyti gegužės 09 '15, 19:23
2
atsakymai

integruota kosinavimo išlyginimo funkcija matlab

Noriu apskaičiuoti kosinijos panašumus tarp įvairių matricos eilių. Matlab'e parašiau šį kodą: i = 1: n_row už j = i: n_row S2 (i, j) = taškas (S1 (i, :), S1 (j, :)) / (norm_r (i) * norm_r (j)); S2 (j, i) = S2 (i, j); matricos ...
nustatytas sausio 04 d '18, 21:36
3
atsakymai

Cosine TSNE afinitetas sklearn.manifold

Turiu nedidelę problemą su TSNE mano duomenų rinkinyje, naudojant kosinuso panašumus. Apskaičiuojau visų mano vektorių kosininį panašumą, todėl turiu kvadratinę matricą, kurioje yra mano panašumas su kosinu: A = [[1 0,7 ...
nustatytas balandžio 11 d '16, 12:58
1
atsakymas

Kodėl scikit-learn (artimiausias kaimynas) neatrodo, kad atstatytų teisingus kosinijos panašumo atstumus?

Bandau naudoti „scikit“ artimiausią kaimyną, kad surastumėte artimiausius stulpelio vektorius į tam tikrą stulpelio vektorių iš atsitiktinių verčių matricos. Šis kodas turėtų rasti artimiausius 21 skilties kaimynus ir tada patikrinti tikrą šių kosinijų panašumą su ...
nustatytas balandžio 12 d '14, 18:50