Klausimai pažymėti 'utf-16'

UTF-16 yra simbolių kodavimas, kuris žymi Unicode kodo taškus, naudojant 2 arba 4 baitus vienam simboliui.
12
atsakymai

UTF-8, UTF-16 ir UTF-32

Koks skirtumas tarp UTF-8, UTF-16 ir UTF-32? Suprantu, kad jie visi saugos „Unicode“, ir kiekvienas iš jų naudoja skirtingą baitų skaičių, kad būtų rodomas simbolis. Ar yra kokių nors privalumų pasirenkant vieną?
nustatytas sausio 30 d '09 20:05
10
atsakymai

Kas yra Unicode, UTF-8, UTF-16?

Kas yra Unicode pagrindas ir kodėl reikia UTF-8 ar UTF-16? Aš jį ištyriau „Google“ ir čia ieškojau, tačiau tai nėra aišku. VSS, lyginant failus, kartais pasirodo pranešimas, kuriame nurodoma, kad abu failai turi skirtingus UTF. Kodėl taip yra? Prašome paaiškinti ...
nustatytas vasario 11 d '10, 3:12
5
atsakymai

Kas yra pakaitinė pora „Java“?

Aš perskaičiau StringBuffer dokumentaciją, ypač atvirkštinį () metodą. Šiame dokumente minima kažkas apie pakaitines poras. Kas yra šiame kontekste pakaitinė pora? Kas yra žemas ir aukštas pakaitalas?
gegužės 05 d. 11 val. 22:21
4
atsakymai

Skirtumas tarp UTF-8 ir UTF-16?

Skirtumas tarp UTF-8 ir UTF-16? Kodėl jiems reikia? MessageDigest md = MessageDigest.getInstance ("SHA-256"); String text = "Tai kai tekstas"; md.update (text.getBytes ("UTF-8")); // Pakeiskite jį į „UTF-16“, jei reikia, baitą [] digest = md.digest ();
nustatytas sausio 11 d '11 10:38
6
atsakymai

Ar galiu git atpažinti UTF-16 failą kaip tekstą?

Aš stebiu virtualios mašinos virtualiosios mašinos failą (* .vmc) git'e, o atlikus pakeitimus, git nustatė failą kaip dvejetainį failą ir nenorėjo jo atskirti. Radau, kad failas buvo užkoduotas UTF-16. Ar git sužino, kad ...
nustatytas balandžio 22 d '09 18:51
4
atsakymai

„Java Unicode“ eilutės ilgis

Bandau gauti Unicode eilutę ir išbandyti įvairias parinktis. Atrodo kaip maža problema, bet nukentėjo didelis kelias. Čia bandau gauti eilutės str1 ilgį. Aš jį gaunu kaip 6. Bet iš tikrųjų tai yra 3. Žymeklio perkėlimas palei liniją „குமா ...
nustatytas balandžio 11 d '13, 14:47
2
atsakymai

Unikodas C ++ 11

Aš šiek tiek skaitau apie Unicode - ypač UTF-8 palaikymą - (ne) C ++ 11, ir tikėjausi, kad „ngn-wiki.ru“ guru gali man patikinti, kad mano supratimas yra teisingas, arba nurodau, kur aš nesuprantu ar kažką praleido, jei taip yra. Trumpai ...
rugpjūčio 11 d '14, 20:56
8
atsakymai

grepping ir utf16 dvejetainiai

Grep / pcregrep standartas ir kt. patogus naudoti su dvejetainiais failais ASCII arba UTF8 duomenims - ar yra paprastas būdas juos išbandyti ir UTF16 (pageidautina tuo pačiu metu, bet tai darys)? Duomenys, kuriuos bandau gauti ...
nustatytas rugsėjo 20 d '10, 18:25
6
atsakymai

Skirtumas tarp didžiojo riboto kanalo kanalo ir mažo Endiano baito

Koks skirtumas tarp „Big Endian“ ir „Little Endian“ baito tvarkos? Atrodo, kad abi susijusios su Unicode ir UTF16. Kur tiksliai mes jį naudojame?
nustatė kovo 31 d
5
atsakymai

Kas yra UTF-16 reikšmė?

Aš niekada nesuprato UTF-16 kodavimo reikšmės. Jei reikia gydyti eilutes kaip atsitiktinę prieigą (ty kodo taškas yra toks pat, kaip kodo blokas), tuomet jums reikia UTF-32, nes UTF-16 vis dar yra kintamo ilgio. Jei ne ...
Nustatykite kovo 13 d. 11 val
7
atsakymai

Konvertuokite UTF-8 į UTF-8 specifikaciją be „Python“ specifikacijos

Pateikiami du klausimai. Turiu rinkmenas, kurios paprastai yra UTF-8 su BOM. Norėčiau juos konvertuoti (idealiu atveju) į UTF-8 be specifikacijos. Atrodo, kad codecs.StreamRecoder (srautas, kodavimas, dekodavimas, skaitytuvas, rašytojas, klaidos) bus ...
nustatė sausio 17 d '12 19:37
6
atsakymai

Koks yra vidinis „Java“ atstovavimas styginiams? Pakeistas UTF-8? UTF-16?

Aš ieškojau „Java“ vidinės Stygos reprezentacijos, bet turiu dvi medžiagas, kurios atrodo tvirtos, bet nenuoseklios. Vienas iš jų: http://www.codeguru.com/cpp/misc/misc/multi-lingualsupport/article.php/c10451 ir jis sako: „Java“ ...
yra nustatytas kovo 14 d., 12 val. 12:26
3
atsakymai

Kodėl .net naudoja eilutės UTF16 kodavimą, bet pagal nutylėjimą naudokite utf8 failams išsaugoti?

Iš čia iš esmės, eilutė naudoja UTF-16 simbolių kodavimo formą, tačiau, kai taupoma vs StreamWriter: Šis konstruktorius sukuria „StreamWriter“ su UTF-8 kodavimu be „Byte Order Icon“ (BOM), pamačiau šį modelį (nuotolinė nuoroda): ...
vasario 18 d '13, 20:35
8
atsakymai

Kaip išspręsti „nesugebėjimo perjungti kodavimo“ problemą įterpiant XML į SQL Server

Bandau įterpti XML į stulpelį (SQL SERVER 2008 R2), tačiau serveris skundžiasi: System.Data.SqlClient.SqlException (0x80131904): XML analizė: 1 eilutė, 39 ženklas, negalintis perjungti kodavimo Aš sužinojau, kad XML stulpelis turi būti UTF- 16 pakilti ...
nustatyti 21 rugsėjo '10, 16:32
5
atsakymai

Apribojimo dydis (char) pagal ISO / IEC, koduotą su skirtingais kodais, pvz., UTF-16

Darant prielaidą, kad programa veikia sistemoje su simbolių rinkiniu, koduojančiu UTF-16. Taigi, pagal programavimo kalbą C ++ - 4, p. 150: „Charlie“ gali būti mašinų simbolių rinkinys. → Manau, kad kintamasis char bus dydis ...
nustatė kovo 30 d. 15 val