Klausimai pažymėti „dplyr“

Naudokite šią žymą klausimams, susijusiems su dplyr paketo funkcijomis, pvz., Group_by, apibendrinkite, filtruokite ir pasirinkite.
3
atsakymai

data.table vs dplyr: ar kažkas gali būti gera ir kažkas bloga ar bloga?

Aš esu gana susipažinęs su data.table, ne tiek su dplyr. Aš perskaičiau kai kurias vinjetes ir pavyzdžius, susijusius su SO, ir iki šiol mano išvados yra tokios: data.table ir dplyr yra panašūs greičiu, išskyrus atvejus, kai yra daug (tai yra> ...
nustatė sausio 29 d '14, 18:21
5
atsakymai

Ar dplyr paketas gali būti naudojamas sąlyginei mutacijai?

Ar galima mutuoti, jei mutacija yra sąlyginė (priklausomai nuo tam tikrų stulpelių reikšmių reikšmių)? Šis pavyzdys padeda parodyti, ką aš turiu galvoje. struktūra (sąrašas (a = c (1, 3, 4, 6, 3, 2, 5, 1), b = c (1, 3, 4, 2, 6, 7, 2, 6) ...
birželio 27 d. 14 val
7
atsakymai

Kelių įspėjimų „nežinomas stulpelis“ tvirtinimas

Turiu nuolatinį pakartotinį „nežinomos stulpelio“ įspėjimą dėl visų tipų komandų (pvz., Str (x) paketų naujinimų diegimui), ir nesu įsitikinęs, kaip jį ištaisyti ar išspręsti. Įspėjimas „nežinoma stulpelis“ yra aiškiai susijęs su ne ...
nustatytas rugpjūčio 19 d '16 at 17:07
8
atsakymai

Grupuokite keliais stulpeliais dplyr naudodami vektoriaus linijos įvestį

Bandau perteikti savo supratimą apie plyrą, bet aš negaliu suprasti, kaip grupuoti keliais stulpeliais. # hardwired data = data.frame (asihckhdoydkhxiydfgfTgdsx = pavyzdys (laiškai [1: 3], 100, rep ...
nustatytas sausio 18 d '14, 10:26 val
7
atsakymai

„Rename“ pakeitimas dplyr

Man patinka plyr pervadinimo funkcija. Neseniai pradėjau naudoti dplyr ir stebėjau, ar yra paprastas būdas pervardyti kintamuosius naudodami dplyr funkciją, kuri yra tokia pat paprasta naudoti kaip plyr pervadinti?
01 Feb rinkinys '14, 10:25 val
6
atsakymai

Taikykite funkciją kiekvienai lentelės eilutei naudodami dplyr?

Dirbant su plyr, man buvo naudinga naudoti skaliarines funkcijas, kurias turiu kreiptis į kiekvieną eilutę. Pavyzdžiui. Duomenų (rainelės) bibliotekos (plyr) galvutė (pridėti (rainelė, 1, transformuoti, Max.Len = max (Sepal.Length, Petal.Length))) ...
nustatyti 17 vas '14, 2:21
7
atsakymai

Pasirinkite pirmąją ir paskutinę eilutes iš sugrupuotų duomenų.

Klausimas Naudojant dplyr, kaip galiu pasirinkti viršutines ir apatines grupuotų duomenų eilutes ir eilutes? Duomenys ir pavyzdys Atsižvelgiant į duomenų rėmelį df <- data.frame (id = c (1,1,1,2,2,2,3,3,3), stopId = c ("a", "b", " c ", ...
nustatytas liepos 21 d., 15 val
5
atsakymai

Apibendrinant kelis stulpelius su dplyr?

Kovoju šiek tiek su dplyr sintakse. Turiu duomenų rėmelį su skirtingais kintamaisiais ir vienu grupavimo kintamuoju. Dabar noriu apskaičiuoti kiekvienos grupės stulpelio vidutinę vertę, naudojant dplyr R. df <- data.frame (a = pavyzdys (1: 5, ...
nustatyti 08 vas '14, 13:27
3
atsakymai

Peržiūrėkite visą duomenų rėmelį, kai baigsite tbl_df?

tibble (anksčiau tbl_df) yra duomenų rėmo versija, sukurta naudojant dplyr duomenų rėmo manipuliavimo paketą R. Tai neleidžia išeiti iš ilgų lentelių, kai duomenų rėmelis atsitiktinai kreipiamasi. Kai tik duomenų rėmas buvo suvyniotas į tibble / tbl_df, ar yra koma ...
nustatytas balandžio 21 d '14, 2:55
7
atsakymai

dplyr - mutate: naudokite dinaminius kintamųjų pavadinimus

Noriu naudoti dplyr mutate (), kad duomenų rėmelyje būtų sukurta keletas naujų stulpelių. Stulpelių pavadinimai ir jų turinys turi būti generuojami dinamiškai. Diafragmos duomenų pavyzdys: reikia (dplyr) duomenų (rainelės) iris <- tbl_df (iris), kurį sukūriau ...
rugsėjo 23 d '14, 10:51 val
6
atsakymai

Ištraukite dplyr tbl kolonėlę kaip vektorių

Ar yra glaustesnis būdas gauti vieną dplyr tbl stulpelį kaip vektorių iš tbl su duomenų bazės duomenų baze (t. Y. Duomenų rėmelis / lentelė negali būti tiesiogiai poaibis)?
nustatyti 07 vas '14, 5:55
6
atsakymai

Kaip kiekvienoje grupėje pasirinkti linijas, kuriose yra didžiausios vertės, naudojant dplyr?

Norėčiau pasirinkti eilutę su didžiausia verte kiekvienoje grupėje su dplyr. Pirma, sukuriu keletą atsitiktinių duomenų, kad galėčiau parodyti savo klausimą set.seed (1) df <- expand.grid (sąrašas (A = 1: 5, B = 1: 5, C = 1: 5)) df $ vertė <- runif (nrow (df ...)
birželio 16 d. 9 val
4
atsakymai

Dublikatų linijų ištrynimas su dplyr

Aš turiu tokį duomenų rinkinį: set.seed (123) df = data.frame (x = mėginys (0: 1,10, pakeiskite = T), y = mėginys (0: 1,10, pakeiskite = T ), z = 1: 10)> df xyz 1 0 1 1 2 1 1 2 3 3 1 1 3 7 1 1 5 5 1 5 5 6 1 1 7 7 1 7 7 1 1 8 8 1 1 9 10 0 1 10 aš x ...
nustatytas balandžio 09 d '14, 13:22
4
atsakymai

dplyr: "Klaida n (): funkcija neturėtų būti vadinama tiesiogiai"

Bandau atkurti vieną iš pavyzdžių dplyr pakete, tačiau tai yra klaidos pranešimas. Tikiuosi, kad pamatysite naują stulpelį n, gautą kiekvienos kombinacijos dažnumu. Ar kas nors gali man pasakyti, kas trūksta? Aš trigubai patikrinau, ar paketas įkeliamas ...
nustatytas 02 balandis '14, 6:44
2
atsakymai

Filtruokite eilutę, kurioje yra tam tikra eilutė, naudojant dplyr

Turiu filtruoti duomenų rėmelį, kaip kriterijų naudoti tas eilutes, kuriose yra RTB eilutė. Aš naudoju dplyr. d.del <- df%.% group_by (TrackingPixel)%.% suvestinė (Mėnesio pristatymas = as.integer (suma (pajamos))%.% tvarko (...
04 Bal '14 ne 1:15