Klausimai, pažymėti „data.table“

„R.table“ duomenų paketas yra duomenų.frame išplėtimas, sukurtas greitai duomenų analizei atmintyje. Naudokite „DataTables“ paketo dt žymą naudodami „Shiny“ (DT).
3
atsakymai

data.table vs dplyr: ar kažkas gali būti gera ir kažkas bloga ar bloga?

Aš esu gana susipažinęs su data.table, ne tiek su dplyr. Aš perskaičiau kai kurias vinjetes ir pavyzdžius, susijusius su SO, ir iki šiol mano išvados yra tokios: data.table ir dplyr yra panašūs greičiu, išskyrus atvejus, kai yra daug (tai yra> ...
nustatė sausio 29 d '14, 18:21
8
atsakymai

Kaip ištrinti stulpelį pavadinimu data.table?

Norint atsikratyti stulpelio su pavadinimu „foo“ duomenų.frame, galiu padaryti: df <- df [-grep ('foo', colnames (df))] Tačiau, kai df yra konvertuojamas į duomenų lentelę, tai neįmanoma ištrinti stulpelį. Pavyzdys: df <- data.frame (id = 1: 100 ...
nustatyti 09 vas '12 at 1:20
2
atsakymai

Supratimas, kada duomenų lentelė yra nuoroda į (palyginti su kopija) kitą duomenų lentelę

Turiu sunkumų suprasti, kaip perduodamos nuorodos duomenys. Atrodo, kad kai kurios operacijos „nutraukia“ ryšį, ir norėčiau tiksliai suprasti, kas vyksta. Kurdami data.table iš kito duomenų.table (per <- ir tada atnaujindami naują t ...
nustatytas 19 d '12 12:19
3
atsakymai

Kodėl pandas sujungia į pythoną greičiau nei data.table?

Neseniai aš susitikau su pandų biblioteka, kuri pagal šį testą atlieka labai greitai susijungimą į atmintį. Tai netgi greitesnis už duomenų paketą R. (mano pasirinkta kalba analizei). Kodėl „pandas“ yra daug greitesnis nei „data.table“? Taip yra dėl ...
nustatyti 24 sausis '12 20:59
8
atsakymai

Greičiausias būdas pakeisti NA dideliame duomenų lape.

Turiu didelį duomenų.tabelį, kuriame yra daug trūkstamų reikšmių visose ~ 200k eilėse ir 200 stulpelių. Norėčiau perrašyti šias NA vertes į nulius kuo veiksmingiau. Matau dvi parinktis: 1: konvertuoti į data.fr ...
paklausė 29 rug. '11 23:35
6
atsakymai

Pasirinkite kelis stulpelius data.table pagal jų skaičių indeksus.

Kaip mes galime pasirinkti kelis stulpelius, naudojant jų skaitinių indeksų (pozicijų) vektorių duomenų.taberyje? Taigi mes darysime su data.frame: df <- data.frame (a = 1, b = 2, c = 3) df [, 2: 3] # bc # 1 2 3
lapkričio 14 d. '12 20:18
2
atsakymai

Ką .SD duomenų bazėje R

.SD atrodo naudinga, bet aš nežinau, ką su juo darau. Ką tai reiškia? Kodėl yra ankstesnis laikotarpis (pilnas sustojimas). Kas atsitinka, kai jį naudoju? Aš perskaičiau: .SD yra data.table, turintis x duomenų poaibį kiekvienam r ...
gruodžio 14 d '11 19:59
2
atsakymai

Kodėl rbindlist „geriau“ nei rbind?

Aš peržiūriu duomenų lentelės dokumentaciją ir pastebėjau, kad kai kurie iš čia vykusių SO pokalbių rodo, kad rbindlist turėtų būti geriau nei rbind. Norėčiau sužinoti, kodėl rbindlist yra geresnis už rbind ir kokiais scenarijais rbindlist tikrai pranoksta rbindlist ...
kovo 28 d., 13 val
3
atsakymai

Duomenų lentelės eilių rūšiavimas mažėjančia tvarka pagal eilutės raktą „užsakymas (-x, v)“ suteikia klaidą duomenų.taboje 1.9.4 arba anksčiau.

Tarkime, kad turiu šiuos duomenis: „R: library“ (data.table) DT = data.table (x = rep (c ("b", "a", "c"), kiekvienas = 3), y = c (1,3,6), v = 1: 9) Noriu jį užsisakyti dviem stulpeliais (pavyzdžiui, x ir v stulpeliai). Aš tai panaudojau: DT [tvarka (x, v)] # rūšiuoja fi ...
nustatyti 10 sept. '12, 5:30 val
5
atsakymai

Kaip ištrinti eilutę pagal nuorodą data.table?

Mano klausimas yra susijęs su nuoroda ir kopijavimu į data.table. Noriu žinoti, ar galite ištrinti eilutes pagal nuorodą, panašiai kaip DT [, someCol: = NULL] Noriu sužinoti apie DT [someRow: = NULL,] Manau, kad yra gera priežastis, kodėl tai ...
gegužės 28 d., 12 val
4
atsakymai

Keletas kintamųjų sumos / sumos kiekvienai grupei (pvz., Suma, vidutinė vertė)

Ar duomenų rėmuose yra paprastas būdas apibendrinti (sumą, vidurkį, max ir c) kelis kintamuosius vienu metu? Toliau pateikiami kai kurie duomenys: bibliotekos (lubridate) dienos = 365 * 2 data = seq (kaip data ("2000-01-01"), ilgis = dienos, = = "diena") metai = metai (...)
yra nustatytas kovo 15 d. 12 val
8
atsakymai

Stulpelių klasių konvertavimas į data.table

Turiu problemų, susijusių su data.table naudojimu: Kaip konvertuoti stulpelių klases? Štai paprastas pavyzdys: su data.frame aš neturiu problemų dėl jos konversijos, su data.table aš nežinau kaip: df <- data.frame (ID = c (rep ("A", 5), rep (" B ", 5)), Quarte ...
nustatytas spalio 18 d '11 23:53
2
atsakymai

Priskirti kelis stulpelius naudodami: = duomenų.table grupėje

Koks yra geriausias būdas priskirti kelis stulpelius naudojant „data.table“? Pavyzdžiui: f <- funkcija (x) {c ("hi", "hello")} x <- data.table (id = 1:10) Norėčiau padaryti kažką panašaus (žinoma, ši sintaksė neteisinga) : x [, (col1, col2): = ...
liepos 27 d. 12 val
3
atsakymai

Kodėl X [Y] prisijungia prie duomenų.tabelių, neleidžiantį pilno išorinio ryšio ar kairiojo ryšio?

Tai šiek tiek filosofinis klausimas apie duomenų lentelės sintaksę. Man vis daugiau ir daugiau duomenų.tables naudoja, bet vis dar mokosi ... Jungiamojo formato X [Y] data.tables yra labai trumpas, patogus ir efektyvus, bet kiek galiu spręsti ...
nustatyti spalio 08 '12, 2:46
5
atsakymai

Kas yra greičiausias būdas sujungti / sujungti duomenis.

Pavyzdžiui (nežinote, kas, pavyzdžiui, yra tipiškiausias pavyzdys): N <- 1e6 d1 <- data.frame (x = mėginys (N, N), y1 = rnorm (N)) d2 <- data.frame (x = mėginys (N, N), y2 = rnorm (N)) Štai ką aš vis dar turiu: d <- sujungti (d1, d2) # 7.6 sek.
01 gr. '10, 10:47