Klausimai pažymėti „unicode“

Unicode yra standartas, skirtas koduoti, pateikti ir apdoroti tekstą, kad būtų palaikomi visi rašytiniam tekstui reikalingi simboliai, įskaitant visas rašymo sistemas, techninius simbolius ir skyrybos ženklus.
11
atsakymai

Kiek baitų yra vienas unikodo simbolis?

Aš šiek tiek supainioti apie koduotes. Kiek aš žinau, seni ASCII simboliai paėmė vieną baitą už simbolį. Kiek baitų reikia unikodo pobūdžio? Manau, kad vienas Unicode simbolis gali turėti bet kokį galimą bet kurios kalbos simbolį ...
yra nustatytas kovo 13 d. 11 val
14
atsakymai

Kaip konvertuoti wstring į eilutę?

Kyla klausimas, kaip konvertuoti wstring į eilutę? Turiu šį pavyzdį: #include <string> #include <iostream> int main () {std :: wstring ws = L "Hello"; std :: string s (ws.begin (), ws.end ());
nustatytas 26 sausis '11, 14:58 val
10
atsakymai

„Unicode Error“ unicodeescape kodekas negali iššifruoti baitų ... Nepavyksta atidaryti teksto failų „Python 3“

Aš naudoju „Python 3.1“, „Windows 7“ įrenginiuose, o rusų kalba yra sistemos numatytoji kalba, o utf-8 yra numatytasis kodavimas. Žvelgiant į atsakymą į ankstesnį klausimą, bandau naudoti „kodekų“ modulį, kad suteikčiau man laimės. Štai keletas pavyzdžių ...
nustatyti 28 rug. '09 18:36
6
atsakymai

Koks skirtumas tarp kodavimo / dekodavimo?

Aš niekada nebuvo tikras, kad suprantu skirtumą tarp dekodavimo str / unicode ir kodavimo. Žinau, kad str () Decode () yra tiems atvejams, kai turite baitų eilutę, kuri, kaip žinote, turi tam tikrą simbolių kodavimą, nes ...
15 Jan '09 18:13
15
atsakymai

Kaip patikrinti, ar eilutė yra „Python“ ASCII?

Noriu patikrinti, ar eilutė yra ASCII, ar ne. Aš žinau, ord (), bet kai bandau ord ('é'), turiu TypeError: ord () tikėtiną simbolį, bet rastas 2 ilgio eilutė. Supratau, kad tai sukelia tai, kaip aš pastatiau „Python“ (kaip aprašyta arba ...
nustatyti spalio 13 d '08 3:13
11
atsakymai

„Python“: konvertuoti Unicode į ASCII be klaidų

Mano kodas tiesiog skalauja tinklalapį, o tada jį konvertuoja į „Unicode“. html = urllib.urlopen (nuoroda) .read () html.encode ("utf8", "ignoruoti") self.response.out.write (html) Bet aš gaunu UnicodeDecodeError: Traceback (naujausias paskutinis skambutis): File A ...
nustatytas kovo 2 d. 10 val. 20:52
9
atsakymai

(grep) Regex, kad atitiktų ne ASCII simbolius?

„Linux“ turiu katalogą su daugybe failų. Kai kurie iš jų turi ne ASCII simbolių, tačiau jie visi galioja UTF-8. Vienoje programoje yra klaida, kuri neleidžia dirbti su ne ASCII pavadinimais ir turiu sužinoti ...
nustatytas sausio 23 d '10, 20:34
8
atsakymai

Kodėl šios eilutės ilgis yra didesnis nei jame esančių simbolių skaičius?

Šis kodas: string a = "abc"; eilutė b = "A 𠈓 C"; Console.WriteLine ("Ilgis a = {0}", a.Length); Console.WriteLine ("Ilgis b = {0}", b.Length); išėjimai: ilgis a = 3 ilgis b = 4 Kodėl? Vienintelis dalykas, kurį galėjau įsivaizduoti, buvo tai, kad kinų sim ...
lapkričio 17 d. '14, 18:13
5
atsakymai

Kaip gerai yra Unicode palaikomas C ++ 11?

Aš perskaičiau ir girdėjau, kad C ++ 11 palaiko Unicode. Keletas klausimų apie tai: Kaip gerai standartinė C ++ biblioteka palaiko Unicode? Ar std :: string daro tai, ko reikia? Kaip jį naudoti? Kur yra galimos problemos?
birželio 14 d. 13 val
9
atsakymai

Koks skirtumas tarp Unicode ir UTF-8?

Apsvarstykite: ar tiesa, kad unicode = utf16? Daugelis sako, kad „Unicode“ yra standartas, o ne kodavimas, tačiau dauguma redaktorių palaiko kodavimą kaip „Unicode“.
nustatyti 17 okt. '10, 5:17
5
atsakymai

Stulpelių tipų skirtumas tarp BYTE ir CHAR

„Oracle“: skirtumas tarp: CREATE TABLE CLIENT (NAME VARCHAR2 (11 BYTE), ID_CLIENT NUMBER) ir CREATE TABLE CLIENT (NAME VARCHAR2 (11 CHAR), - arba net VARCHAR2 (11) ID_CLIENT NUMBER)
nustatytas 17 sep. '08 12:27
11
atsakymai

Rodyklės ir failų struktūros atvaizdavimas „Markdown“ sintaksėje

Noriu apibūdinti katalogų ir failų struktūrą kai kuriuose mano dienoraščiuose „Jekyll“ tinklaraštyje, ar „Markdown“ nėra tvarkingas būdas tai daryti? Pavyzdžiui, šią nuorodą galite pamatyti Jekyll svetainėje, kurioje rodoma katalogų ir failų vieta ...
Nustatyti spalio 31 d '13, 8:27
5
atsakymai

Kodėl Python spausdina Unicode simbolius, kai numatytasis kodavimas yra ASCII?

Iš „Python 2.6“ korpuso: >>> importuoti sys >>> spausdinti sys.getdefaultencoding () ascii >>> print u 'xe9' é >>> Patvirtindamas spausdinimą, tikėjausi, kad turėsite tam tikrą gibberį ar klaidą. nes simbolis "é" ne man ...
nustatytas balandžio 8 d '10, 3:03
2
atsakymai

„Python“: naudokite .format () eilutėje su pabėgusiu Unicode

Aš naudoju Python 2.6.5. Mano kodui reikalingas didesnis arba lygus ženklas. Čia jis yra: >>> s = u 'u2265' >>> spausdinimas s >>> ≥ >>> spausdinimas "{0}". Formatas (-ai) Traceback (paskutinis paskutinis): failas "<input>" ...
Nustatyta liepos 13 d. 10 val
5
atsakymai

Ar paieškos rodinyje yra Unicode simbolis,

Unikode yra milijonų glifų piktogramų, tačiau juos sunku rasti. Ar yra Unicode simbolis, kuris atrodo kaip žiūronai arba didinamasis stiklas? Ar yra simbolis, kuris reiškia „paiešką“, kuris yra Unicode?
nustatyti 20 rug. '12 13:29