Klausimai, pažymėti „skaidiniu“

Skirstymas - tai veiklos strategija, kurioje galimai dideles duomenų grupes galite suskirstyti į keletą mažesnių duomenų grupių.
5
atsakymai

Kaip apibrėžti duomenų rinkmenų skaidymą?

Spark SQL ir DataFrames pradėjau naudoti Spark 1.4.0. Noriu apibrėžti individualų skirtuką „DataFrames“ „Scala“, bet nematau, kaip tai padaryti. Vienoje iš duomenų lentelių, kuriose dirbau, yra paskyros operacijų sąrašas, ...
birželio 23 d. 15 val
6
atsakymai

Ar „Zookeeper“ turi būti Kafkai privaloma?

Kafkoje norėčiau naudoti tik vieną tarpininką, vieną temą ir vieną skyrių, kuriame yra vienas gamintojas ir keli vartotojai (kiekvienas vartotojas gauna savo brokerio duomenų kopiją). Atsižvelgiant į tai, aš nenoriu, kad pridėtinės išlaidos ...
Nustatykite gegužės 20, 14, 8:31
5
atsakymai

Pandas: „DataFrame“ pavyzdys

Bandau skaityti gana didelį CSV failą naudojant „Pandas“ ir padalinti jį į dvi atsitiktines fragmentus, iš kurių vienas yra 10% duomenų, o kitas - 90%. Čia yra mano dabartinis bandymas: eilutės = data.index row_count = len (eilutės) random.shuffle (sąrašas (ro ...)
nustatyti 30 rug. '12 9:12
3
atsakymai

Kaip veikia „HashPartitioner“?

Aš perskaičiau HashPartitioner dokumentaciją. Deja, nieko nebuvo paaiškinta, išskyrus API skambučius. Manau, kad „HashPartitioner“ dalijasi paskirstytu rinkiniu pagal raktų rinkinį. Pavyzdžiui, jei mano duomenys yra panašūs į (1,1), (1,2), (1,3), (2,1) ...
yra nustatytas liepos 15 d. 15 val. 10:46
9
atsakymai

„MySQL“ skaidymas / apgaubimas / skaidymas - kokia kryptimi?

Turime InnoDB duomenų bazę, kuri yra apie 70 GB, ir tikimės, kad per ateinančius 2-3 metus ji išaugs iki kelių šimtų GB. Apie 60% duomenų nurodo vieną lentelę. Šiuo metu duomenų bazė veikia gana gerai, nes ...
nustatyti 05 Rgs '08 4:59 val
1
atsakymas

Kas yra MYSQL atskyrimas?

Aš perskaičiau dokumentaciją (http://dev.mysql.com/doc/refman/5.1/en/partitioning.html), bet norėčiau, kad jūsų žodžiais būtų, kas tai yra ir kodėl ji naudojama. Ar tai daugiausia naudojama keliems serveriams, todėl ji nuvilkia ...
spalio 16 d. '09 22:23
7
atsakymai

LINQ skyrių sąrašas 8 narių sąrašuose

Kaip paimti sąrašą (naudojant LINQ) ir padalinti jį į sąrašų sąrašą, kuris paskirsto šaltinių sąrašą į kiekvieną aštuntą įrašą? Manau, kad kažkas panašaus bus „Skip“ ir / arba „Take“, bet aš vis dar esu gana naujas „LINQ“. Redaguoti: naudokite ...
rugsėjo 22 d. '10, 23:34
8
atsakymai

Veiksmingas būdas suskirstyti sąrašą į n dydžio sąrašus

Turiu masyvą, kurį noriu padalyti į mažesnes n dydžio matricas ir atlikti kiekvieną operaciją. Mano dabartinis būdas tai padaryti yra įgyvendinamas naudojant „ArrayLists“ „Java“ (bet koks pseudokodas bus naudojamas) (int i = 1; i <= Math.flo ...
nustatytas balandžio 28 d '11 23:49
5
atsakymai

Lentelė su 80 mln. Įrašų ir indekso pridėjimas trunka ilgiau nei 18 valandų (arba visam laikui)! Kas dabar?

Trumpa istorija apie tai, kas atsitiko. Dirbu su 71 milijonu įrašų (ne tiek daug, palyginti su milijardais įrašų, kuriuos tvarko kiti). Kituose siūluose kažkas pasiūlė, kad dabartinė mano klasterio konfigūracija netinka mano poreikiui ...
nustatyti 12 sep. '10, 20:23
3
atsakymai

Duomenų bazė - lentelės „Renginiai“ projektavimas

Perskaitę patarimus iš šio puikaus „Nettuts +“ straipsnio. Aš atėjau lentelės schemą, kuri dalijasi labai nepastoviais duomenimis iš kitų lentelių, kurioms taikomi sunkūs rodmenys, ir tuo pačiu sumažinti stalų skaičių, reikalingą visai c ...
nustatytas balandžio 20 d '10, 5:35
2
atsakymai

Kaip suprasti dinaminio programavimo sprendimą linijiniu skaidymu?

Stengiuosi suprasti dinaminį programavimo sprendimą linijinės skilimo problemai. Aš perskaičiuoju algoritmo projektavimo vadovą ir problema aprašyta 8.5 skyriuje. Perskaičiau skyrių daug kartų, bet aš nesuprantu. Manau, kad ...
nustatyti spalio 29 d '11 15:08
4
atsakymai

„STOPKEY“ trūksta „Oracle“ skyriui paieškos skambučio pagal vietinį indeksą planavimui

Yra tokia suskaidyta lentelė: CREATE TABLE "ERMB_LOG_TEST_BF". "OUT_SMS" ("TRX_ID" NUMERIS (19,0) NE NULL ENABLE "," CREATE_TS "TIMESTAMP (3) DEFAULT systimestamp NOT NULL ENABLE, / * kiti laukai ... *> ) PCTFREE 10 PCTUSED 4 ...
Nustatykite kovo 12 d. 13 val
5
atsakymai

Kas yra lentelės padalijimas?

Tokiu atveju, ar turėtume naudoti lentelės padalijimą?
nustatyti 30 lapkričio '09 21:06
8
atsakymai

Ar atskyrimas yra lengvesnis nei rūšiavimas?

Tai klausimas, kuris ilgą laiką pasiliko mano galvoje ... Tarkime, kad turiu elementų sąrašą ir jų lygiavertiškumą, o dviejų elementų palyginimas užima nuolatinį laiką. Noriu, pavyzdžiui, grąžinti elementų dalį. sąrašas ...
Nustatyta liepos 15 d. 10 val
5
atsakymai

Automatinis postgresql apsaugojimas?

Turiu problemų, kai reikia labai greitai į duomenų bazę įkelti didelį duomenų kiekį (5+ milijardus eilučių) (idealiu atveju mažiau nei 30 minučių, bet greičiau), ir neseniai man buvo pasiūlyta pažvelgti į postgresql (nepavyko su „MySQL“ ir žiūrėjau hbase ...
nustatytas balandžio 25 d '12 23:34