Klausimai pažymėti kaip „duomenų rinkinys“

Duomenų rėmas yra lentelinių duomenų struktūra. Paprastai jame yra duomenų, kuriuose eilutės yra stebimos, o stulpeliai yra skirtingų tipų kintamieji. Nors „duomenų rėmelis“ arba „duomenų rėmas“ yra sąvoka, vartojama šiai sąvokai keliomis kalbomis (R, Apache Spark, deedle, Maple, pandų biblioteka Pythone ir „DataFrames“ biblioteka Julijoje), „lentelė“ yra terminas, vartojamas MATLAB ir SQL.
30
atsakymai

Pervardykite stulpelius pandas

Turiu „DataFrame“, kuris naudoja pandas ir stulpelių etiketes, kurias reikia redaguoti, kad pakeistumėte pradines stulpelių etiketes. Norėčiau pakeisti stulpelių pavadinimus „DataFrame A“, kur pradiniai stulpelių pavadinimai yra: ['$ a', '$ b', '$ c', '$ d', '$ e'] ...
Nustatykite liepos 05 d. 12 val
19
atsakymai

Kaip rūšiuoti duomenis keliais stulpeliais?

Noriu rūšiuoti duomenis. Pvz., Žemiau esančiu duomenų.framo numeriu norėčiau surūšiuoti pagal stulpelį z (mažėjančia tvarka), tada pagal stulpelį b (didėjančia tvarka): dd <- data.frame (b = faktorius (c ("Hi", "Med") , „Hi“, „Low“), ...
nustatytas rugpjūčio 19 d '09 0:33
13
atsakymai

Pasirinkite eilutes iš „DataFrame“ pagal vertes, esančias stulpelyje „pandas“

Kaip pasirinkti eilutes iš „datarafra“ pagal vertes stulpelyje „pandas“? SQL naudosiu: pasirinkite * iš lentelės, kurioje yra colume_name = some_value. Bandžiau pažvelgti į pandos dokumentus, bet neradu atsakymo.
yra nustatytas birželio 12 d., 13 val. 20:42
13
atsakymai

Kaip sujungti (sujungti) duomenų rėmus (vidinius, išorinius, kairius, dešinius)?

Pateikiami du duomenų rėmeliai: df1 = data.frame (CustomerId = c (1: 6), Product = c (rep ("Toaster", 3), rep ("Radio", 3)) df2 = data.frame (CustomerId = c (2, 4, 6), State = c (rep ("Alabama", 2), rep ("Ohio", 1)) df1 # CustomerId Product # 1 Toaste ...
nustatytas rugpjūčio 19 d '09 16:18
16
atsakymai

Kaip pasikartoti per Pandas duomenų bazės eilutes?

Turiu „DataFrame“ iš „pandas“: importuokite „pandas“ kaip pd inp = [{'c1': 10, 'c2': 100}, {'c1: 11,' c2 ': 110}, {' c1 ': 12,' c2 ': 120}] df = pd.DataFrame (inp) print df Išėjimas: c1 c2 0 10 100 1 11 110 2 12 120 Dabar noriu perjungti šio rėmo linijas.
gegužės 10 d. 13 val
16
atsakymai

Pašalinkite stulpelį iš „DataFrame panda“

Kai ištrinau stulpelį „DataFrame“, naudoju: del df ['column_name'] Ir tai puikiai veikia. Kodėl negaliu naudoti toliau pateikto? del df.column_name Kadangi galite pasiekti stulpelį / seriją kaip df.column_name, tikiuosi, kad jis bus ...
lapkričio 16 d. '12 9:26
21
atsakymas

Duomenų rėmo stulpelių trynimas pagal pavadinimą

Turiu keletą stulpelių, kuriuos norėčiau pašalinti iš duomenų rėmelio. Žinau, kad mes galime juos atskirai ištrinti, naudodami kažką panašaus: df $ x <- NULL Bet tikėjausi, kad tai atliksiu mažiau komandų. Be to, aš žinau, kad aš ...
nustatytas sausio 05 '11, 17:34
22
atsakymai

Įtraukus naują stulpelį į esamą „DataFrame“ „Python pandas“

Turiu tokį indeksuotą „DataFrame“ su pavadintais stulpeliais, o eilutės nėra nuolatinės: abcd 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 ...
rugsėjo 23 d 12 val
15
atsakymai

Ištrinkite eilutes su visais arba kai kuriais NA (trūkstamų reikšmių) duomenimis

Norėčiau ištrinti šios duomenų rėmelio eilutes, kuriose: a) visų stulpelių yra NA. Toliau pateikiamas apytikslis duomenų rėmelis. gs hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 ...
01 Feb rinkinys '11, 14:52
16
atsakymai

Pasirinkite kelis stulpelius pandos duomenų rėmelyje

Turiu duomenis skirtinguose stulpeliuose, tačiau nežinau, kaip ją išgauti, kad jį būtų galima išsaugoti kitu kintamuoju. index abc 1 2 3 4 2 3 4 5 Kaip pasirinkti „a“, „b“ ir išsaugoti ją df1? Bandžiau df1 = df ['a': 'b'] df1 = df.ix [:, ...
nustatoma 02 liepos 12 d. 0:03
17
atsakymai

Kaip pakeisti NA reikšmes nuliais R duomenų rėme?

Turiu duomenų rėmelį, o kai kuriose stulpeliuose yra NA reikšmės. Kaip pakeisti šias NA reikšmes nuliais?
lapkričio 17 d. '11, 6:45
18
atsakymai

Įtraukite vieną eilutę į „Panda DataFrame“

Suprantu, kad „pandas“ sukurtas taip, kad įkeltų visiškai apgyvendintą „DataFrame“, bet turiu sukurti tuščią „DataFrame“ ir po to pridėti eilutes po vieną. Koks yra geriausias būdas tai padaryti? Sėkmingai sukūriau tuščią „DataFrame“ su: res = DataF ...
gegužės 23 d., 12 val
26
atsakymai

Kaip pakeisti stulpelių „DataFrame“ tvarką?

Turiu tokį „DataFrame“ (df): importuokite numpy kaip „np“ importavimo pandas kaip pd df = pd.DataFrame (np.random.rand (10, 5)) į paskirties vietą pridedu daugiau stulpelių: df ['mean' ] = df.mean (1) Kaip perkelti vidutinę stulpelį į pradžią, t.y. įdiegs ...
Nustatyti spalio 31 d '12 - 1:22
12
atsakymai

Kaip pašalinti eilutes iš „Pandas DataFrame“, kurios vertė tam tikruose stulpeliuose yra NaN

Turiu „DataFrame“: >>> df STK_ID EPS pinigus STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN ...
lapkričio 16 d. '12 12:17
12
atsakymai

Kaip gauti „Pandas“ duomenų eilių skaičių?

Bandau gauti „DF“ linijų skaičių naudojant „Pandas“, ir čia yra mano kodas. 1 metodas: total_rows = df.count print total_rows +1 2 metodas: total_rows = df ['First_columnn_label']. Skaičius spausdinti total_rows +1 Abu kodų fragmentai man sukelia šią klaidą: Oh ...
nustatytas balandžio 11 d '13, 11:14